μžμ—°μ–΄ 처리/Today I learned :

Word Embedding

주영 🐱 2023. 1. 5. 18:54
728x90

μ›Œλ“œ μž„λ² λ”©(Word Embedding)은 단어λ₯Ό λ²‘ν„°λ‘œ ν‘œν˜„ν•˜λŠ” λ°©λ²•μž…λ‹ˆλ‹€. 

 

1. Sparse Representation

 

μ•žμ„œ 원-ν•« 인코딩을 ν†΅ν•΄μ„œ λ‚˜μ˜¨ 원-ν•« 벑터듀은 ν‘œν˜„ν•˜κ³ μž ν•˜λŠ” λ‹¨μ–΄μ˜ 인덱슀의 κ°’λ§Œ 1이고, λ‚˜λ¨Έμ§€ μΈλ±μŠ€μ—λŠ” μ „λΆ€ 0으둜 ν‘œν˜„λ˜λŠ” 벑터 ν‘œν˜„ λ°©λ²•μ΄μ—ˆμŠ΅λ‹ˆλ‹€. μ΄λ ‡κ²Œ 벑터 λ˜λŠ” ν–‰λ ¬(matrix)의 값이 λŒ€λΆ€λΆ„μ΄ 0으둜 ν‘œν˜„λ˜λŠ” 방법을 ν¬μ†Œ ν‘œν˜„(sparse representation)이라고 ν•©λ‹ˆλ‹€. 원-ν•« λ²‘ν„°λŠ” ν¬μ†Œ 벑터(sparse vector)μž…λ‹ˆλ‹€.

μ΄λŸ¬ν•œ ν¬μ†Œ λ²‘ν„°μ˜ λ¬Έμ œμ μ€ λ‹¨μ–΄μ˜ κ°œμˆ˜κ°€ λŠ˜μ–΄λ‚˜λ©΄ λ²‘ν„°μ˜ 차원이 ν•œμ—†μ΄ μ»€μ§„λ‹€λŠ” μ μž…λ‹ˆλ‹€.  λ‹¨μ–΄μ˜ μΈλ±μŠ€μ— ν•΄λ‹Ήλ˜λŠ” λΆ€λΆ„λ§Œ 1이고 λ‚˜λ¨Έμ§€λŠ” 0의 값을 κ°€μ Έμ•Όλ§Œ ν•˜λ―€λ‘œ 단어 집합이 클수둝 κ³ μ°¨μ›μ˜ 벑터가 λ©λ‹ˆλ‹€. μ΄λŸ¬ν•œ 벑터 ν‘œν˜„μ€ 곡간적 λ‚­λΉ„λ₯Ό λΆˆλŸ¬μΌμœΌν‚΅λ‹ˆλ‹€.

 

2. Dense Representation

ν¬μ†Œ ν‘œν˜„κ³Ό λ°˜λŒ€λ˜λŠ” ν‘œν˜„μœΌλ‘œ 밀집 ν‘œν˜„(dense representation)이 μžˆμŠ΅λ‹ˆλ‹€. 밀집 ν‘œν˜„μ€ λ²‘ν„°μ˜ 차원을 단어 μ§‘ν•©μ˜ 크기둜 μƒμ •ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. μ‚¬μš©μžκ°€ μ„€μ •ν•œ κ°’μœΌλ‘œ λͺ¨λ“  λ‹¨μ–΄μ˜ 벑터 ν‘œν˜„μ˜ 차원을 맞μΆ₯λ‹ˆλ‹€. λ˜ν•œ, 이 κ³Όμ •μ—μ„œ 더 이상 0κ³Ό 1만 가진 값이 μ•„λ‹ˆλΌ μ‹€μˆ˜κ°’μ„ κ°€μ§€κ²Œ λ©λ‹ˆλ‹€. μ‚¬μš©μžκ°€ 밀집 ν‘œν˜„μ˜ 차원을 128둜 μ„€μ •ν•œλ‹€λ©΄, λͺ¨λ“  λ‹¨μ–΄μ˜ 벑터 ν‘œν˜„μ˜ 차원은 128둜 λ°”λ€Œλ©΄μ„œ λͺ¨λ“  값이 μ‹€μˆ˜κ°€ λ©λ‹ˆλ‹€.

 

3. Word Embedding

단어λ₯Ό 밀집 벑터(dense vector)의 ν˜•νƒœλ‘œ ν‘œν˜„ν•˜λŠ” 방법을 μ›Œλ“œ μž„λ² λ”©(word embedding)이라고 ν•©λ‹ˆλ‹€. 그리고 이 밀집 벑터λ₯Ό μ›Œλ“œ μž„λ² λ”© 과정을 톡해 λ‚˜μ˜¨ 결과라고 ν•˜μ—¬ μž„λ² λ”© 벑터(embedding vector)라고도 ν•©λ‹ˆλ‹€.

μ›Œλ“œ μž„λ² λ”© λ°©λ²•λ‘ μœΌλ‘œλŠ” LSA, Word2Vec, FastText, Glove 등이 μžˆμŠ΅λ‹ˆλ‹€. μΌ€λΌμŠ€μ—μ„œ μ œκ³΅ν•˜λŠ” 도ꡬ인 Embedding()λŠ” μ•žμ„œ μ–ΈκΈ‰ν•œ 방법듀을 μ‚¬μš©ν•˜μ§€λŠ” μ•Šμ§€λ§Œ, 단어λ₯Ό λžœλ€ν•œ 값을 κ°€μ§€λŠ” 밀집 λ²‘ν„°λ‘œ λ³€ν™˜ν•œ 뒀에, 인곡 μ‹ κ²½λ§μ˜ κ°€μ€‘μΉ˜λ₯Ό ν•™μŠ΅ν•˜λŠ” 것과 같은 λ°©μ‹μœΌλ‘œ 단어 벑터λ₯Ό ν•™μŠ΅ν•˜λŠ” 방법을 μ‚¬μš©ν•©λ‹ˆλ‹€. μ•„λž˜μ˜ ν‘œλŠ” μ•žμ„œ 배운 원-ν•« 벑터와 μ§€κΈˆ 배우고 μžˆλŠ” μž„λ² λ”© λ²‘ν„°μ˜ 차이λ₯Ό λ³΄μ—¬μ€λ‹ˆλ‹€.

 μ›-ν•« λ²‘ν„°μž„λ² λ”© 벑터

차원 고차원(단어 μ§‘ν•©μ˜ 크기) 저차원
λ‹€λ₯Έ ν‘œν˜„ ν¬μ†Œ λ²‘ν„°μ˜ 일쒅 밀집 λ²‘ν„°μ˜ 일쒅
ν‘œν˜„ 방법 μˆ˜λ™ ν›ˆλ ¨ λ°μ΄ν„°λ‘œλΆ€ν„° ν•™μŠ΅ν•¨
κ°’μ˜ νƒ€μž… 1κ³Ό 0 μ‹€μˆ˜

 

λ°˜μ‘ν˜•