๋ฐ˜์‘ํ˜•

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ 35

[NLP] ํŠธ๋žœ์Šคํฌ๋จธ ๋ธ”๋ก, ์–ดํƒ ์…˜๊ณผ ์…€ํ”„ ์–ดํƒ ์…˜

ํŠธ๋žœ์Šคํฌ๋จธ์˜ ์ธ์ฝ”๋”๋Š” ์ด๊ฐ™์€ ๋ธ”๋ก์„ ์ˆ˜์‹ญ ๊ฐœ ์Œ“์•„์„œ ๊ตฌ์„ฑํ•œ๋‹ค ์ธ์ฝ”๋” ๋ธ”๋ก ๊ตฌ์„ฑ์š”์†Œ ๋ฉ€ํ‹ฐ ํ—ค๋“œ ์–ดํ…์…˜(Multi-Head Attention) ํ”ผ๋“œํฌ์›Œ๋“œ ๋‰ด๋Ÿด๋„คํŠธ์›Œํฌ(FeedForward) ์ž”์ฐจ ์—ฐ๊ฒฐ ๋ฐ ๋ ˆ์ด์–ด ์ •๊ทœํ™”(Add & Norm) ๋งˆ์Šคํฌ๋ฅผ ์ ์šฉํ•œ ๋ฉ€ํ‹ฐ ํ—ค๋“œ ์–ดํ…์…˜(Masked Multi-Head Attention) ๋ฉ€ํ‹ฐ ํ—ค๋“œ ์–ดํ…์…˜(Multi-Head Attention) ํ”ผ๋“œํฌ์›Œ๋“œ ๋‰ด๋Ÿด ๋„คํŠธ์›Œํฌ(FeedForward) ์ž”์ฐจ ์—ฐ๊ฒฐ ๋ฐ ๋ ˆ์ด์–ด ์ •๊ทœํ™”(Add & Norm) Self attention = Multi-Head Attention ์–ดํ…์…˜ = ์ค‘์š”ํ•œ ์š”์†Œ์— ๋” ์ง‘์ค‘ํ•ด ์„ฑ๋Šฅ์„ ๋Œ์–ด ์˜ฌ๋ฆฌ๋Š” ๊ธฐ๋ฒ• ๊ธฐ๊ณ„๋ฒˆ์—ญ์— ์–ดํ…์…˜ ๋„์ž…ํ•˜๋ฉด ํƒ€๊นƒ ์–ธ์–ด๋ฅผ ๋””์ฝ”๋”ฉํ•  ๋•Œ ์†Œ์Šค ์–ธ์–ด์˜ ๋‹จ์–ด ์‹œ๋ญ์Šค ๊ฐ€์šด๋ฐ ๋””์ฝ”๋”ฉ์— ๋„์›€์ด ๋˜๋Š” ..

[NLP] ์–ธ์–ด๋ชจ๋ธ: ํŠธ๋žœ์Šคํฌ๋จธ ๊ฐœ์š”

์–ธ์–ด ๋ชจ๋ธ์ด๋ž€? ๋‹จ์–ด ์‹œํ€€์Šค์— ํ™•๋ฅ ์„ ๋ถ€์—ฌํ•˜๋Š” ๋ชจ๋ธ ํŠธ๋žœ์Šคํฌ๋จธ? 2017๋…„ ๊ตฌ๊ธ€์ด ์ œ์•ˆํ•œ ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค ๋ชจ๋ธ, ๊ธฐ๊ณ„๋ฒˆ์—ญ๊ณผ ๊ฐ™์€ ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ•œ๋‹ค. ์‹œํ€€์Šค? ๋‹จ์–ด์™€ ๊ฐ™์€ ๋ฌด์–ธ๊ฐ€์˜ ๋‚˜์—ด ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค? ํŠน์ • ์†์„ฑ์„ ์ง€๋‹Œ ์‹œํ€€์Šค๋ฅผ ๋‹ค๋ฅธ ์†์„ฑ์˜ ์‹œํ€€์Šค๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์ž‘์—… (๊ธฐ๊ณ„ ๋ฒˆ์—ญ) ์†Œ์Šค ์–ธ์–ด -> ํƒ€๊นƒ ์–ธ์–ด๋กœ ๋ณ€ํ™˜ (์ด๋•Œ ๊ธธ์ด๊ฐ€ ๋‹ฌ๋ผ๋„ ๊ณผ์ œ ์ˆ˜ํ–‰์— ๋ฌธ์ œ๊ฐ€ ์—†์–ด์•ผ ํ•จ) ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค ๋ชจ๋ธ์˜ ๊ตฌ์„ฑ ์ธ์ฝ”๋” : ์†Œ์Šค ์‹œํ€€์Šค ์••์ถ•(=์ธ์ฝ”๋”ฉ)ํ•˜์—ฌ ๋””์ฝ”๋”๋กœ ๋ณด๋ƒ„ ๋””์ฝ”๋” : ํƒ€๊นƒ ์‹œํ€€์Šค ์ƒ์„ฑ(=๋””์ฝ”๋”ฉ) input:์†Œ์Šค ์‹œํ€€์Šค ์ „์ฒด output : ํƒ€๊นƒ ์‹œ๋ญ”์Šค ์ผ๋ถ€ ์ธ์ฝ”๋” ์ž…๋ ฅ : ์–ด์ œ, ์นดํŽ˜, ๊ฐ”์—ˆ์–ด, ๊ฑฐ๊ธฐ, ์‚ฌ๋žŒ, ๋งŽ๋”๋ผ (์†Œ์Šค์‹œํ€€์Šค ์ „์ฒด) ๋””์ฝ”๋” ์ž…๋ ฅ: ํƒ€๊นƒ ์‹œํ€€์Šค์˜ ์‹œ์ž‘์„ ์•Œ๋ฆฌ๋Š” ์ŠคํŽ˜์…œ ํ† ํฐ ..

์šฐ๋„ likelihood

์šฐ๋„ likelihood ๊ฐ€๋Šฅ๋„ ํ™•๋ฅ  ๋ถ„ํฌ์˜ ๋ชจ์ˆ˜๊ฐ€, ์–ด๋–ค ํ™•๋ฅ ๋ณ€์ˆ˜์˜ ํ‘œ์ง‘๊ฐ’๊ณผ ์ผ๊ด€๋˜๋Š” ์ •๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ’ ํŠน์ • ์‚ฌ๊ฑด๋“ค์ด ์ผ์–ด๋‚  ๊ฐ€๋Šฅ์„ฑ‘ ๋˜๋Š” ‘์ƒ˜ํ”Œ๋“ค๊ณผ ํ™•๋ฅ ๋ถ„ํฌ์˜ ์ผ๊ด€๋œ ์ •๋„ ์–ด๋–ค ์‹œํ–‰์˜ ๊ฒฐ๊ณผ (Evidence) E ๊ฐ€ ์ฃผ์–ด์กŒ๋‹ค ํ•  ๋•Œ, ๋งŒ์ผ ์ฃผ์–ด์ง„ ๊ฐ€์„ค H ๊ฐ€ ์ฐธ์ด๋ผ๋ฉด, ๊ทธ๋Ÿฌํ•œ ๊ฒฐ๊ณผ E ๊ฐ€ ๋‚˜์˜ฌ ์ •๋„๋Š” ์–ผ๋งˆ๋‚˜ ๋˜๊ฒ ๋Š๋ƒ ํ•˜๋Š” ๊ฒƒ ์ฆ‰ ๊ฒฐ๊ณผ E ๊ฐ€ ๋‚˜์˜จ ๊ฒฝ์šฐ, ๊ทธ๋Ÿฌํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋Š” ์—ฌ๋Ÿฌ ๊ฐ€๋Šฅํ•œ ๊ฐ€์„ค๋“ค์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ์ธก๋„๊ฐ€ ๊ณง ์šฐ๋„์ธ ์…ˆ์ด๋‹ค.

[NLP] ํ† ํฐํ™” , BPE, ์›Œ๋“œํ”ผ์Šค

ํ† ํฐํ™”๋ž€? ๋ฌธ์žฅ์„ ํ† ํฐ ์‹œํ€€์Šค๋กœ ๋‚˜๋ˆ„๋Š” ๊ณผ์ • ํ† ํฌ๋‚˜์ด์ €๋ž€? ํ† ํฐํ™” ์ˆ˜ํ–‰ํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ ํ•œ๊ตญ์–ด ํ† ํฌ๋‚˜์ด์ € : mecab, kkma,,,,,๋“ฑ๋“ฑ ์ข…๋ฅ˜์— ๋”ฐ๋ผ ํ’ˆ์‚ฌ ํƒœ๊น…๊นŒ์ง€ ํ•˜๋Š” ๊ฒฝ์šฐ๋„ ์žˆ์Œ 1. ๋‹จ์–ด(์–ด์ ˆ) ๋‹จ์œ„ ํ† ํฐํ™” - ๊ณต๋ฐฑ ๊ธฐ์ค€์œผ๋กœ ํ† ํฐํ™” ex) ์•„๊นŒ ์นดํŽ˜์— ์žˆ์—ˆ์–ด -> ์•„๊นŒ, ์นดํŽ˜์—, ์žˆ์—ˆ์–ด -- ๊ณต๋ฐฑ์œผ๋กœ ๋ถ„๋ฆฌํ•˜๋ฉด ๋ณ„๋„๋กœ ํ† ํฌ๋‚˜์ด์ €๋ฅผ ์“ฐ์ง€ ์•Š์•„๋„ ๋œ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์ง€๋งŒ, ์–ดํœ˜ ์ง‘ํ•ฉ(vocabulary)์˜ ํฌ๊ธฐ๊ฐ€ ๋งค์šฐ ์ปค์งˆ ์ˆ˜ ์žˆ์Œ(์žˆ์–ด, ์žˆ์—ˆ์–ด, ์žˆ์—ˆ๋Š”๋ฐ์š”๊นŒ์ง€ ๋ชจ๋“  ๊ฒฝ์šฐ์˜ ์ˆ˜๊ฐ€ ์–ดํœ˜์ง‘ํ•ฉ์— ๋“ค์–ด๊ฐ€์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ) ์–ดํœ˜ ์ง‘ํ•ฉ ํฌ๊ธฐ๊ฐ€ ์ปค์ง€๋ฉด ๊ทธ๋งŒํผ ๋ชจ๋ธ ํ•™์Šต์ด ์–ด๋ ค์›Œ์งˆ ์ˆ˜ ์žˆ์Œ mecab๊ฐ™์€ ๊ฒฝ์šฐ ์•„๊นŒ, ์นดํŽ˜์—, ์žˆ์—ˆ,์–ด ์™€ ๊ฐ™์ด ์˜๋ฏธ์žˆ๋Š” ๋‹จ์œ„๋กœ ํ† ํฐํ™”ํ•˜๊ธฐ์— ์–ดํœ˜์ง‘ํ•ฉํฌ๊ธฐ๊ฐ€ ์ง€๋‚˜์น˜๊ฒŒ ์ปค์ง€๋Š” ๊ฒƒ์„ ๋ง‰์„ ์ˆ˜๋Š” ์žˆ์Œ ..

[NLP]๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ชจ๋ธ

๊ธฐ๊ณ„๊ฐ€ ์‚ฌ๋žŒ๋ง์„ ์•Œ์•„๋“ฃ๊ฒŒ ํ•˜๋ ค๋ฉด ๋ชจ๋ธ์ด ์žˆ์–ด์•ผ ํ•จ ์ž…๋ ฅ(์ž์—ฐ์–ด) --------------> ๋ชจ๋ธ(ํ•จ์ˆ˜) -----------> ์ถœ๋ ฅ(ํ™•๋ฅ ๊ฐ’: 0~1์‚ฌ์ด) NLP๋ชจ๋ธ : ์ž์—ฐ์–ด๋ฅผ ์ž…๋ ฅ๋ฐ›์•„ ํ•ด๋‹น ์ž…๋ ฅ์ด ํŠน์ • ๋ฒ”์ฃผ์ผ ํ™•๋ฅ ์„ ๋ฐ˜ํ™˜ํ•˜๋Š” ํ™•๋ฅ  ํ•จ์ˆ˜์ด๋‹ค. ์ถœ๋ ฅ๋œ ํ™•๋ฅ ์„ post processing(ํ›„์ฒ˜๋ฆฌ)ํ•ด์„œ ์ž์—ฐ์–ด๋กœ ๋‹ค์‹œ ๋ฐ”๊ฟˆ ๊ฐ€์žฅ ์ธ๊ธฐ์žˆ๋Š” ๋ชจ๋ธ - ๋”ฅ๋Ÿฌ๋‹(๋งŽ์€ ์€๋‹‰์ธต ์‚ฌ์šฉ) ex) GPT, BERT,,, ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ํ•™์Šต ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”์ด ์žˆ์–ด์•ผ ํ•จ ex) ๊ฐ์„ฑ๋ถ„์„์˜ ๊ฒฝ์šฐ - ๊ธ์ •1 ์ค‘๋ฆฝ0 ๋ถ€์ •0 ๋ชจ๋ธ์ด ์Šค์Šค๋กœ ํŒจํ„ด์„ ์ตํž ์ˆ˜ ์žˆ๋„๋ก train(ํ•™์Šต) train : ์ถœ๋ ฅ์ด ์ •๋‹ต์— ๊ฐ€๊นŒ์›Œ์ง€๋„๋ก ๋ชจ๋ธ์„ ์—…๋ฐ์ดํŠธํ•˜๋Š” ๊ณผ์ • Transfer learning ์ „์ด ํ•™์Šต : ํŠน์ • ํ…Œ์Šคํฌ๋ฅผ ํ•™์Šตํ•œ ๋ชจ๋ธ์„ ๋‹ค๋ฅธ ํ…Œ์Šคํฌ ..

๋ฐ˜์‘ํ˜•