ํธ๋์คํฌ๋จธ์ ์ธ์ฝ๋๋ ์ด๊ฐ์ ๋ธ๋ก์ ์์ญ ๊ฐ ์์์ ๊ตฌ์ฑํ๋ค
์ธ์ฝ๋ ๋ธ๋ก ๊ตฌ์ฑ์์
- ๋ฉํฐ ํค๋ ์ดํ ์ (Multi-Head Attention)
- ํผ๋ํฌ์๋ ๋ด๋ด๋คํธ์ํฌ(FeedForward)
- ์์ฐจ ์ฐ๊ฒฐ ๋ฐ ๋ ์ด์ด ์ ๊ทํ(Add & Norm)
- ๋ง์คํฌ๋ฅผ ์ ์ฉํ ๋ฉํฐ ํค๋ ์ดํ ์ (Masked Multi-Head Attention)
- ๋ฉํฐ ํค๋ ์ดํ ์ (Multi-Head Attention)
- ํผ๋ํฌ์๋ ๋ด๋ด ๋คํธ์ํฌ(FeedForward)
- ์์ฐจ ์ฐ๊ฒฐ ๋ฐ ๋ ์ด์ด ์ ๊ทํ(Add & Norm)
Self attention = Multi-Head Attention
์ดํ ์ = ์ค์ํ ์์์ ๋ ์ง์คํด ์ฑ๋ฅ์ ๋์ด ์ฌ๋ฆฌ๋ ๊ธฐ๋ฒ
๊ธฐ๊ณ๋ฒ์ญ์ ์ดํ ์ ๋์ ํ๋ฉด ํ๊น ์ธ์ด๋ฅผ ๋์ฝ๋ฉํ ๋ ์์ค ์ธ์ด์ ๋จ์ด ์๋ญ์ค ๊ฐ์ด๋ฐ ๋์ฝ๋ฉ์ ๋์์ด ๋๋ ๋จ์ด ์ ํํด ๋ฒ์ญ ํ์ง ํฅ์
Self attention = ์๊ธฐ์์ ์๊ฒ ์ํํ๋ ์ดํ ์
์ ๋ ฅ ์ํ์ค ์ค ํ์คํฌ ์ํ์ ์๋ฏธ์๋ ์์ ์์ฃผ๋ก ์ ๋ณด๋ฅผ ์ถ์ถํ๋ค๋ ์๋ฏธ
ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง(CNN)๊ณผ ๋น๊ต
CNN=ํฉ์ฑ๊ณฑ ํํฐ(convolution filter)๋ก ์ํ์ค์ ์ง์ญ์ ์ธ ํน์ง์ ์ก์๋ด๋ ๋ชจ๋ธ
CNN์ด ๋ฌธ์ฅ์ ์ธ์ฝ๋ฉํ๋ ๊ณผ์ - ํฉ์ฑ๊ณฑ ํํฐ(๋ถ์์ ๋ค๋ชจ์นธ)์ด ๋จ์ด๋ฅผ ํ๋์ฉ ๋๊ธฐ๋ฉด์ ์ฐจ๋ก๋๋ก ์ฝ์
ํํฐ ํฌ๊ธฐ๊ฐ 3(3๊ฐ ๋จ์ด์ฉ ์ฒ๋ฆฌ)์ด๋ผ๋ฉด 4์นธ ์ด์ ๋จ์ด์ ธ ์๋ ๋จ์ด ์ฌ์ด์ ์๋ฏธ๋ ์บ์นํ๊ธฐ ์ด๋ ต๋ค
์ฆ ํฉ์ฑ๊ณฑ ํํฐ ํฌ๊ธฐ๋ฅผ ๋์ด์๋ ๋ฌธ๋งฅ์ ์ฝ์ด๋ด๊ธฐ ์ด๋ ต๋ค
์ํ ์ ๊ฒฝ๋ง(RNN)๊ณผ ๋น๊ต
RNN ์ญ์ ์ํ์ค ์ ๋ณด๋ฅผ ์์ถํ๋ ๋ฐ ๊ฐ์ ์ด ์๋ ๊ตฌ์กฐ
ํ์ง๋ง ์ํ์ค ๊ธธ์ด๊ฐ ๊ธธ์ด์ง์๋ก ์ ๋ณด ์์ถ์ ๋ฌธ์ : ์ค๋ ์ ์ ์ ๋ ฅ๋ ๋จ์ด๋ ์์ด๋ฒ๋ฆฌ๊ฑฐ๋, ํน์ ๋จ์ด ์ ๋ณด๋ฅผ ๊ณผ๋ํ๊ฒ ๋ฐ์ํด ์ ์ฒด ์ ๋ณด๋ฅผ ์๊ณกํ๋ ๊ฒฝ์ฐ๊ฐ ์์ฃผ ์๊ธด๋ค
๊ธฐ๊ณ ๋ฒ์ญ์ ํ ๋ RNN์ ์ฌ์ฉํ๋ค๋ฉด ์ธ์ฝ๋๊ฐ ๋์ฝ๋๋ก ๋๊ธฐ๋ ์ ๋ณด๋ ์์ค ์ํ์ค์ ๋ง์ง๋ง์ธ ๋ง๋๋ผ๋ผ๋ ๋จ์ด์ ์๋ฏธ๊ฐ ๋ง์ด ๋ฐ์๋ ์๋ฐ์ ์์
RNN์ ์ ๋ ฅ ์ ๋ณด๋ฅผ ์ฐจ๋ก๋๋ก ์ฒ๋ฆฌํ๊ณ ์ค๋ ์ ์ ์ฝ์๋ ๋จ์ด๋ ์์ด๋ฒ๋ฆฌ๋ ๊ฒฝํฅ์ด ์๊ธฐ ๋๋ฌธ
์ดํ ์ ๊ณผ ๋น๊ต
cafe์ ๋์ํ๋ ์์ค ์ธ์ด์ ๋จ์ด๋ ์นดํ์ด๊ณ ์ด๋ ์์ค ์ํ์ค์ ์ด๋ฐ๋ถ์ ๋ฑ์ฅํ ์ํฉ์ ๋๋ค. cafe๋ผ๋ ๋จ์ด๋ฅผ ๋์ฝ๋ฉํด์ผ ํ ๋ ์นดํ๋ฅผ ๋ฐ๋์ ์ฐธ์กฐํด์ผ ํ๋๋ฐ์. ์ดํ ์ ์ด ์๋ ๋จ์ RNN์ ์ฌ์ฉํ๋ฉด ์๋ ์ด๋ฐ์ ์ ๋ ฅ๋ ๋จ์ด๋ผ ๋ชจ๋ธ์ด ์์์ ๊ฐ๋ฅ์ฑ์ด ํฌ๊ณ , ์ด ๋๋ฌธ์ ๋ฒ์ญ ํ์ง์ด ๋ฎ์์ง ์ ์์ต๋๋ค.
๋์ฝ๋ ์ชฝ RNN์ ์ดํ ์ ์ ์ถ๊ฐํจ - ์ดํ ์ ์ ๋์ฝ๋๊ฐ ํ๊น ์ํ์ค๋ฅผ ์์ฑํ ๋ ์์ค ์ํ์ค ์ ์ฒด์์ ์ด๋ค ์์์ ์ฃผ๋ชฉํด์ผ ํ ์ง ์๋ ค์ฃผ๋ฏ๋ก ์นดํ๊ฐ ์์ค ์ํ์ค ์ด๋ฐ์ ๋ฑ์ฅํ๊ฑฐ๋ ์์ค ์ํ์ค์ ๊ธธ์ด๊ฐ ๊ธธ์ด์ง๋๋ผ๋ ๋ฒ์ญ ํ์ง์ด ๋จ์ด์ง๋ ๊ฒ์ ๋ง์ ์ ์์ต๋๋ค
์ ํ์ต๋ ์ ํ ์ดํ ์ ๋ชจ๋ธ์ด๋ผ๋ฉด ๊ฑฐ๊ธฐ์ ๋์ํ๋ ์ฅ์๋ ์นดํ๋ผ๋ ์ฌ์ค์ ์์์ฑ ์ ์์ ๊ฒ์ ๋๋ค. ๊ทธ๋ฟ๋ง ์๋๋ผ ๊ฑฐ๊ธฐ๋ ๊ฐ์์ด์๋ ์ฐ๊ด์ด ์์์ ํ์ธํ ์ ์์ต๋๋ค. ํธ๋์คํฌ๋จธ ์ธ์ฝ๋ ๋ธ๋ก ๋ด๋ถ์์๋ ์ด์ฒ๋ผ ๊ฑฐ๊ธฐ๋ผ๋ ๋จ์ด๋ฅผ ์ธ์ฝ๋ฉํ ๋ ์นดํ, ๊ฐ์์ด๋ผ๋ ๋จ์ด์ ์๋ฏธ๋ฅผ ๊ฐ์กฐํด์ ๋ฐ์
ํธ๋์คํฌ๋จธ ์ธ์ฝ๋ ๋ธ๋ก์ ์นดํ๋ผ๋ ๋จ์ด๋ฅผ ์ธ์ฝ๋ฉํ ๋ ๊ฑฐ๊ธฐ, ๊ฐ์์ด๋ผ๋ ๋จ์ด์ ์๋ฏธ๋ฅผ ๋ค๋ฅธ ๋จ์ด๋ค๋ณด๋ค ๋ ๊ฐํ๊ฒ ๋ฐ์
'์์ฐ์ด ์ฒ๋ฆฌ > Today I learned :' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ง์ผํ ์ ์ํ ๋ฐ์ดํฐ๋ถ์3-2] ๊ธฐ์ ์ ๋ฐฉ๋ฒ(CP,RFM, KPI) (0) | 2022.12.02 |
---|---|
[NLP] ์ ํ ์ดํ ์ (0) | 2022.07.31 |
[NLP] ์ธ์ด๋ชจ๋ธ: ํธ๋์คํฌ๋จธ ๊ฐ์ (0) | 2022.07.28 |
์ฐ๋ likelihood (0) | 2022.07.25 |
[NLP] ํ ํฐํ , BPE, ์๋ํผ์ค (1) | 2022.07.25 |