μžμ—°μ–΄ 처리/Today I learned :

[NLP] μ…€ν”„ μ–΄νƒ μ…˜

주영 🐱 2022. 7. 31. 14:39
728x90

μ…€ν”„ μ–΄ν…μ…˜ μˆ˜ν–‰ λŒ€μƒ = μž…λ ₯ μ‹œν€€μŠ€ 전체

 

κ°œλ³„ 단어와 전체 μž…λ ₯ μ‹œν€€μŠ€λ₯Ό λŒ€μƒμœΌλ‘œ μ–΄ν…μ…˜ 계산을 μˆ˜ν–‰ν•΄ λ¬Έλ§₯ 전체λ₯Ό κ³ λ €ν•˜κΈ° λ•Œλ¬Έμ— 지역적인 λ¬Έλ§₯만 λ³΄λŠ” CNNκ³Ό 차이가 있음

λͺ¨λ“  경우의 수λ₯Ό κ³ λ €(단어듀 μ„œλ‘œκ°€ μ„œλ‘œλ₯Ό 1λŒ€ 1둜 λ°”λΌλ³΄κ²Œ 함)ν•˜κΈ° λ•Œλ¬Έμ— μ‹œν€€μŠ€ 길이가 길어지더라도 정보λ₯Ό μžŠκ±°λ‚˜ μ™œκ³‘ν•  μ—Όλ €κ°€ μ—†λ‹€λŠ” μ μ—μ„œ RNNκ³Ό 차이

 

μ–΄ν…μ…˜κ³Ό μ…€ν”„ μ–΄ν…μ…˜ 차이

 

  1. μ–΄ν…μ…˜μ€ μ†ŒμŠ€ μ‹œν€€μŠ€ 전체 단어듀(μ–΄μ œ, μΉ΄νŽ˜, …, λ§Žλ”라)κ³Ό 타깃 μ‹œν€€μŠ€ 단어 ν•˜λ‚˜(cafe) 사이λ₯Ό μ—°κ²°ν•˜λŠ” 데 μ“°μž…λ‹ˆλ‹€. 반면 μ…€ν”„ μ–΄ν…μ…˜μ€ μž…λ ₯ μ‹œν€€μŠ€ 전체 단어듀 사이λ₯Ό μ—°κ²°ν•©λ‹ˆλ‹€.
  2. μ–΄ν…μ…˜μ€ RNN ꡬ쑰 μœ„μ—μ„œ λ™μž‘ν•˜μ§€λ§Œ μ…€ν”„ μ–΄ν…μ…˜μ€ RNN 없이 λ™μž‘ν•©λ‹ˆλ‹€.
  3. 타깃 μ–Έμ–΄μ˜ 단어λ₯Ό 1개 생성할 λ•Œ μ–΄ν…μ…˜μ€ 1회 μˆ˜ν–‰ν•˜μ§€λ§Œ μ…€ν”„μ–΄ν…μ…˜μ€ 인코더, 디코더 λΈ”λ‘μ˜ 개수만큼 반볡 μˆ˜ν–‰ν•©λ‹ˆλ‹€.

트랜슀포머 인코더 디코더 λ‘˜ λ‹€ μ…€ν”„ μ–΄νƒ μ…˜μ΄ 적용됨

 

 

계산 μ˜ˆμ‹œ

μ…€ν”„ μ–΄ν…μ…˜μ€ μΏΌλ¦¬(query), ν‚€(key), λ°Έλ₯˜(value) μ„Έ 가지 μš”μ†Œκ°€ μ„œλ‘œ 영ν–₯을 μ£Όκ³  λ°›μœΌλ©° λ¬Έμž₯의 의미λ₯Ό κ³„μ‚°ν•œλ‹€

 

각 단어 λ²‘ν„°λŠ” 블둝 λ‚΄μ—μ„œ μ–΄λ–€ 계산 과정을 거쳐 쿼리, ν‚€, λ°Έλ₯˜ μ„Έ κ°€μ§€λ‘œ λ³€ν™˜

 

μ…€ν”„ μ–΄νƒ μ…˜ 계산

트랜슀포머 블둝에 μž…λ ₯λ˜λŠ” λ¬Έμž₯이 그림처럼 μ—¬μ„― 개 λ‹¨μ–΄λ‘œ ꡬ성돼 μžˆλ‹€λ©΄ 이 λΈ”λ‘μ˜ μ…€ν”„ μ–΄ν…μ…˜ 계산 λŒ€μƒμ€ 쿼리 벑터 6개, ν‚€ 벑터 6개, λ°Έλ₯˜ λ°±ν„° 6개 λ“± λͺ¨λ‘ 18κ°œκ°€ λœλ‹€

μ…€ν”„ μ–΄ν…μ…˜μ€ 쿼리 단어 각각에 λŒ€ν•΄ λͺ¨λ“  ν‚€ 단어와 μ–Όλ§ˆλ‚˜ 유기적인 관계λ₯Ό λ§Ίκ³  μžˆλŠ”μ§€ κ·Έ 합이 1인 ν™•λ₯ κ°’μœΌλ‘œ λ‚˜νƒ€λƒ…λ‹ˆλ‹€. κ·Έλ¦Ό17을 보면 μΉ΄νŽ˜λΌλŠ” 쿼리 단어와 κ°€μž₯ 관련이 높은 ν‚€ λ‹¨μ–΄λŠ” κ±°κΈ°λΌλŠ” 점(0.4)을 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.

 

μ…€ν”„ μ–΄ν…μ…˜ λͺ¨λ“ˆμ€ κ·Έλ¦Όκ³Ό 같은 결과에 value 벑터듀을 가쀑합(weighted sum)ν•˜λŠ” λ°©μ‹μœΌλ‘œ 계산을 마무리

 

μƒˆλ‘­κ²Œ λ§Œλ“€μ–΄μ§€λŠ” 카페 벑터(Z카페)λŠ” λ¬Έμž₯에 μ†ν•œ λͺ¨λ“  단어 쌍 μ‚¬μ΄μ˜ 관계가 λ…Ήμ•„ μžˆλ‹€

μ΄λŸ¬ν•œ λ°©μ‹μœΌλ‘œ λ‚˜λ¨Έμ§€ 단어듀도 μ…€ν”„ μ–΄ν…μ…˜μ„ 각각 μˆ˜ν–‰ν•©λ‹ˆλ‹€.

λͺ¨λ“  μ‹œν€€μŠ€λ₯Ό λŒ€μƒμœΌλ‘œ μ…€ν”„ μ–΄ν…μ…˜ 계산이 λλ‚˜λ©΄ κ·Έ κ²°κ³Όλ₯Ό λ‹€μŒ λΈ”λ‘μœΌλ‘œ λ„˜κΉλ‹ˆλ‹€.

 

이처럼 트랜슀포머 λͺ¨λΈμ€ μ…€ν”„ μ–΄ν…μ…˜μ„ 블둝(λ ˆμ΄μ–΄) 수만큼 λ°˜λ³΅ν•œλ‹€

λ°˜μ‘ν˜•