์ž์—ฐ์–ด ์ฒ˜๋ฆฌ/Today I learned :

[NLP]๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ชจ๋ธ

์ฃผ์˜ ๐Ÿฑ 2022. 7. 24. 18:41
728x90
๋ฐ˜์‘ํ˜•

๊ธฐ๊ณ„๊ฐ€ ์‚ฌ๋žŒ๋ง์„ ์•Œ์•„๋“ฃ๊ฒŒ ํ•˜๋ ค๋ฉด ๋ชจ๋ธ์ด ์žˆ์–ด์•ผ ํ•จ

 

์ž…๋ ฅ(์ž์—ฐ์–ด) --------------> ๋ชจ๋ธ(ํ•จ์ˆ˜) -----------> ์ถœ๋ ฅ(ํ™•๋ฅ ๊ฐ’: 0~1์‚ฌ์ด)

 

NLP๋ชจ๋ธ

: ์ž์—ฐ์–ด๋ฅผ ์ž…๋ ฅ๋ฐ›์•„ ํ•ด๋‹น ์ž…๋ ฅ์ด ํŠน์ • ๋ฒ”์ฃผ์ผ ํ™•๋ฅ ์„ ๋ฐ˜ํ™˜ํ•˜๋Š” ํ™•๋ฅ  ํ•จ์ˆ˜์ด๋‹ค.

 

์ถœ๋ ฅ๋œ ํ™•๋ฅ ์„ post processing(ํ›„์ฒ˜๋ฆฌ)ํ•ด์„œ ์ž์—ฐ์–ด๋กœ ๋‹ค์‹œ ๋ฐ”๊ฟˆ

 

๊ฐ€์žฅ ์ธ๊ธฐ์žˆ๋Š” ๋ชจ๋ธ - ๋”ฅ๋Ÿฌ๋‹(๋งŽ์€ ์€๋‹‰์ธต ์‚ฌ์šฉ) ex) GPT, BERT,,,

 

๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ํ•™์Šต

ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”์ด ์žˆ์–ด์•ผ ํ•จ ex) ๊ฐ์„ฑ๋ถ„์„์˜ ๊ฒฝ์šฐ - ๊ธ์ •1 ์ค‘๋ฆฝ0 ๋ถ€์ •0

๋ชจ๋ธ์ด ์Šค์Šค๋กœ ํŒจํ„ด์„ ์ตํž ์ˆ˜ ์žˆ๋„๋ก train(ํ•™์Šต)

 

train : ์ถœ๋ ฅ์ด ์ •๋‹ต์— ๊ฐ€๊นŒ์›Œ์ง€๋„๋ก ๋ชจ๋ธ์„ ์—…๋ฐ์ดํŠธํ•˜๋Š” ๊ณผ์ •

 

 

Transfer learning ์ „์ด ํ•™์Šต : ํŠน์ • ํ…Œ์Šคํฌ๋ฅผ ํ•™์Šตํ•œ ๋ชจ๋ธ์„ ๋‹ค๋ฅธ ํ…Œ์Šคํฌ ์ˆ˜ํ–‰์— ์žฌ์‚ฌ์šฉํ•˜๋Š” ๊ธฐ๋ฒ•

์žฅ์  : ๋ชจ๋ธ์˜ ํ•™์Šต ์†๋„๊ฐ€ ๋นจ๋ผ์ง€๊ณ  ์ƒˆ๋กœ์šด ํ…Œ์Šคํฌ๋ฅผ ๋” ์ž˜ ์ˆ˜ํ–‰ํ•จ

 

Upstream task : ๋‹ค์Œ ๋‹จ์–ด ๋งžํžˆ๊ธฐ, ๋นˆ์นธ ์ฑ„์šฐ๊ธฐ ๋“ฑ ๋Œ€๊ทœ๋ชจ ์ฝ”ํผ์Šค์˜ ๋ฌธ๋งฅ์„ ์ดํ•ดํ•˜๋Š” ๊ณผ์ œ

   - GPT ๊ณ„์—ด ๋ชจ๋ธ : ๋‹ค์Œ ๋‹จ์–ด ๋งžํžˆ๊ธฐ๋กœ Pretrain

  -----> ์–ธ์–ด ๋ชจ๋ธ ( ๋‹ค์Œ ๋‹จ์–ด ๋งžํžˆ๊ธฐ๋กœ Upstream task ์ˆ˜ํ–‰ํ•œ ๋ชจ๋ธ)

 

   - BERT ๊ณ„์—ด ๋ชจ๋ธ : ๋นˆ์นธ ์ฑ„์šฐ๊ธฐ๋กœ Pretrain

-----> Masked  ์–ธ์–ด ๋ชจ๋ธ ( ๋‹ค์Œ ๋‹จ์–ด ๋งžํžˆ๊ธฐ๋กœ Upstream task ์ˆ˜ํ–‰ํ•œ ๋ชจ๋ธ)

 

Downstream task : ๋ฌธ์„œ ๋ถ„๋ฅ˜, ๊ฐœ์ฒด๋ช… ์ธ์‹ ๋“ฑ์˜ ๊ตฌ์ฒด์ ์ธ ๋ฌธ์ œ

 

Pretrain : Upstream task๋ฅผ trainํ•˜๋Š” ๊ณผ์ •

Pretrainํ•˜๋Š” ์ด์œ ? Downstream task๋ฅผ ์ž˜ํ•˜๊ธฐ ์œ„ํ•ด!

 

Fine-tuning(ํŒŒ์ธํŠœ๋‹) : Downstream task trainํ•˜๋Š” ๊ณผ์ •

ex) ๋ฌธ์„œ ๋ถ„๋ฅ˜์˜ ๊ฒฝ์šฐ Pretrain๋งˆ์นœ BERT ๋ชจ๋ธ ์ „์ฒด๋ฅผ ๋ฌธ์„œ ๋ถ„๋ฅ˜ ๋ฐ์ดํ„ฐ๋กœ ์—…๋ฐ์ดํŠธ ํ•จ

 

 

 

๋ชจ๋ธ train์˜ ํŒŒ์ดํ”„๋ผ์ธ

  • ๊ฐ์ข… ์„ค์ •๊ฐ’ ์„ค์ •(ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ-learning rate, batch_size..)
  • ๋ฐ์ดํ„ฐ ๋‚ด๋ ค๋ฐ›๊ธฐ
  • Pretrain ๋งˆ์นœ ๋ชจ๋ธ ์ค€๋น„
  • ํ† ํฌ๋‚˜์ด์ € ์ค€๋น„
  • ๋ฐ์ดํ„ฐ ๋กœ๋” ์ค€๋น„
  • ํ…Œ์Šคํฌ ์ •์˜
  • ๋ชจ๋ธ trainํ•˜๊ธฐ
๋ฐ˜์‘ํ˜•