์ž์—ฐ์–ด ์ฒ˜๋ฆฌ/Today I learned : 31

PYTORCH(ํŒŒ์ดํ† ์น˜) cheatsheet

Imports General import torch # root package from torch.utils.data import Dataset, DataLoader # dataset representation and loading Neural Network API import torch.autograd as autograd # computation graph from torch import Tensor # tensor node in the computation graph import torch.nn as nn # neural networks import torch.nn.functional as F # layers, activations and more import torch.optim as optim ..

ํฌํ„ธ์˜ ๊ฒ€์ƒ‰์—”์ง„ ์ž‘๋™ ์›๋ฆฌ, ๊ตฌ๊ธ€์˜ pagerank ์•Œ๊ณ ๋ฆฌ์ฆ˜

๋„ค์ด๋ฒ„๋‚˜ ๊ตฌ๊ธ€๊ฐ™์€ ํฌํ„ธ์—๊ฒ€์ƒ‰์„ ํ•˜๋ฉด 1์ดˆ๋„ ์•ˆ๋ผ์„œ ์—„์ฒญ๋‚˜๊ฒŒ ๋งŽ์€ ๊ฒ€์ƒ‰๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜จ๋‹ค. ๊ฒ€์ƒ‰ ์„œ๋น„์Šค๋Š” ์–ด๋–ค ์›๋ฆฌ๋กœ ์ž‘๋™ํ•˜๋Š”๊ฒƒ์ผ๊นŒ? ๊ฒ€์ƒ‰์—”์ง„์ด ์ •๋ณด๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ  ์ €์žฅํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋ฌผ๋ก  ๊ฐ ๊ฒ€์ƒ‰ ์„œ๋น„์Šค๋งˆ๋‹ค ์ฐจ์ด๋Š” ์žˆ๊ฒ ์ง€๋งŒ ์ž‘๋™ ๋ฐฉ์‹์—๋Š” ์ด 3๊ฐ€์ง€ ๋‹จ๊ณ„๊ฐ€ ์žˆ๋‹ค๊ณ  ํ• ์ˆ˜์žˆ๋‹ค. 1. ํฌ๋กค๋ง - Crawling 2. ์ธ๋ฑ์‹ฑ - Indexing 3. ๋žญํ‚น - Ranking 1. ํฌ๋กค๋ง ๋„ค์ด๋ฒ„์˜ ํ™”๋ฉด์„ ๋ณด๋ฉด ๋ฐฐ๋„ˆ ๋ฉ”์ผ ์นดํŽ˜ ๋ธ”๋กœ๊ทธ ์‡ผํ•‘ ๋‰ด์Šค ์ฆ๊ถŒ ๋‚ ์”จ ๋“ฑ๋“ฑ ์ˆ˜๋งŽ์€ ๋งํฌ๋“ค์ด ์ˆจ์–ด์žˆ๋‹ค. ํ™”๋ฉด์˜ ๊ธ€์”จ์—๋Š” ํด๋ฆญํ•˜๋ฉด ๋‹ค๋ฅธ ํŽ˜์ด์ง€๋กœ ๋„˜์–ด๊ฐ€๋Š” ๋งํฌ๋“ค์ด ์ˆจ์–ด์žˆ๋Š”๊ฒƒ์ด๋‹ค. ํฌ๋กค๋ง์€ ์›น ํŽ˜์ด์ง€๋ฅผ ๊ทธ๋Œ€๋กœ ๊ฐ€์ ธ์™€์„œ ๊ฑฐ๊ธฐ์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”์ถœํ•˜์—ฌ ์ˆ˜์ง‘ํ•˜๋Š” ๊ฒƒ์œผ๋กœ, ํฌ๋กค๋ง์„ ์ˆ˜ํ–‰ํ•˜๋ฉด ์ด ๋ชจ๋“  ๋งํฌ๋“ค์„ ๋‹ค ๋Œ์•„๋‹ค๋‹ˆ๊ณ  ํŽ˜์ด์ง€ ์•ˆ์— ์žˆ๋Š” ์ •๋ณด๋ฅผ ์ฝ์–ด๋“ค์ด๊ฒŒ ๋œ๋‹ค. ..

์ด๊ฒƒ์ €๊ฒƒ ํ•ด๋ณธ ํ•œ๊ตญ์–ด ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ธฐ๋ฒ•๋“ค

๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ ํ•ญ์ƒ ๋งž๋‹ฅ๋œจ๋ฆฌ๊ฒŒ ๋˜๋Š” ๋ฌธ์ œ๋Š” ์•„๋ฌด๋ž˜๋„ ๋ฐ์ดํ„ฐ ๋ถˆ๊ท ํ˜•์ด ์•„๋‹๊นŒ ์‹ถ๋‹ค. ํ•œ ์นดํ…Œ๊ณ ๋ฆฌ๋งŒ ๋„ˆ๋ฌด ๋งŽ๊ฑฐ๋‚˜ ๋„ˆ๋ฌด ์ ์–ด ๋‹ค๋ฅธ ์นดํ…Œ๊ณ ๋ฆฌ์™€ ์ฐจ์ด๊ฐ€ ๋‚˜๋Š” ์ƒํ™ฉ์—์„œ ๊ทธ๋Œ€๋กœ ํ•™์Šต์‹œํ‚ค๋ฉด ๋ฐ์ดํ„ฐ๊ฐ€ ์ ์€ ์นดํ…Œ๊ณ ๋ฆฌ์— ๋Œ€ํ•ด์„œ๋Š” ์ž˜ ๋ถ„๋ฅ˜๊ฐ€ ๋˜์ง€ ์•Š๋Š”๋‹ค. ๋…ผ๋ฌธ์„ ์“ธ ๋•Œ๋„ ์ฒ˜์Œ์—๋Š” 17๋ถ„๋ฅ˜๋ฅผ ํ•˜๊ณ ์žํ–ˆ์ง€๋งŒ ๋ฐ์ดํ„ฐ ์ฐจ์ด๊ฐ€ ๋„ˆ๋ฌด ์ปค 5๊ฐ€์ง€ ํฐ ๋ถ„๋ฅ˜๋กœ ๋‚˜๋ˆด์—ˆ๋‹ค. ๊ทธ๋ž˜๋„ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ•์ด ํ•„์š”ํ•ด์„œ ๋ช‡๊ฐ€์ง€ ํ…Œ์ŠคํŒ…์„ ํ–ˆ๋˜ ๊ธฐ์–ต์ด ๋‚œ๋‹ค. ์•„๋ฌดํŠผ ์ง€๊ธˆ๊นŒ์ง€ ํ•ด๋ณธ ์—ฌ๋Ÿฌ ์‹œ๋„๋“ค์„ ์ •๋ฆฌํ•ด๋ณด๊ณ ์ž ํ•œ๋‹ค. ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์—์„  ๋Œ€ํ‘œ์ ์œผ๋กœ ์•„๋ž˜์™€ ๊ฐ™์€ ๋„ค๊ฐ€์ง€ ์ฆ๊ฐ• ๊ธฐ๋ฒ•์ด ์กด์žฌํ•œ๋‹ค. - SR (Synonym Replacement): ํŠน์ • ๋‹จ์–ด๋ฅผ ๋น„์Šทํ•œ ์˜๋ฏธ์˜ ์œ ์˜์–ด๋กœ ๊ต์ฒด - RI (Random Insertion): ์ž„์˜์˜ ๋‹จ์–ด๋ฅผ ์‚ฝ์ž… - RS (Random Swap..

์ฝ”๋žฉ์—์„œ mecab ์„ค์น˜ํ•˜๊ธฐ

๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ฝ”๋“œ ์‹คํ–‰ !pip install konlpy from konlpy.tag import Mecab !git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git %cd Mecab-ko-for-Google-Colab/ !bash install_mecab-ko_on_colab190912.sh ์‹คํ–‰ ํ›„ ๋งˆ์ง€๋ง‰ ์ค„์„ ๋ณด๋ฉด ๋Ÿฐํƒ€์ž„์„ ์žฌ์‹คํ–‰ํ•˜๋ผ๊ณ  ํ•œ๋‹ค. ์žฌ์‹คํ–‰ํ›„ ์œ„์˜ ์ฝ”๋“œ๋ฅผ ๋‹ค์‹œ ์‹คํ–‰ํ•˜์ง€ ์•Š๊ณ  mecab์„ ๋ถˆ๋Ÿฌ์˜ค๋ฉด ๋œ๋‹ค. Successfully Installed Now you can use Mecab from konlpy.tag import Mecab mecab = Mecab() ์‚ฌ์šฉ์ž ์‚ฌ์ „ ์ถ”๊ฐ€ ๋ฐฉ๋ฒ• : https://bit.ly/3k0ZH5..

[๋งˆ์ผ€ํŒ…์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ๋ถ„์„3-2] ๊ธฐ์ˆ ์  ๋ฐฉ๋ฒ•(CP,RFM, KPI)

Customer Profit(CP) - ์–ด๋–ค ๊ณ ๊ฐ์ด ์ˆ˜์ต์„ฑ์ด ์žˆ๋Š”์ง€ ์ถ”์ ํ•˜๋Š” ๋ฐฉ๋ฒ• - ๊ณ ๊ฐ์„ ๊ด€๋ฆฌํ•˜๊ธฐ ์œ„ํ•œ B2B ๊ด‘๊ณ ์— ์ข…์ข… ์‚ฌ์šฉ๋˜์ง€๋งŒ ๊ณ ๊ฐ์„ ์„ธ๋ถ„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด B2C์—์„œ๋„ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค. 80/20 ๊ทœ์น™ ๊ณ ๊ฐ์˜ 20%๊ฐ€ 80%์˜ ์ด์ต์„ ์ œ๊ณตํ•œ๋‹ค. ๊ณ ๊ฐ ์ˆ˜์ต์„ฑ์€ ๊ทธ๊ฒƒ์ด ์‚ฌ์‹ค์ธ์ง€ ํ™•์ธํ•˜๋Š” ๋ฐ ํฌ์ปค์‹ฑํ•œ๋‹ค. ์ข‹์€ ๊ณ ๊ฐ์€ ์ ์€ ๋…ธ๋ ฅ์„ ํ•„์š”๋กœ ํ•˜๊ณ  ๋†’์€ ์ง€์ถœ์„ ์ดˆ๋ž˜ํ•˜๋ฉฐ, ์ข‹์ง€ ์•Š์€ ๊ณ ๊ฐ์€ ๋†’์€ ๋…ธ๋ ฅ๊ณผ ๋‚ฎ์€ ์ง€์ถœ์„ ์ดˆ๋ž˜ํ•จ์„ ์ดํ•ด CP Score = ์ผ๋…„๊ฐ„ ํ•œ ๊ณ ๊ฐ์œผ๋กœ๋ถ€ํ„ฐ ๋ฒ„๋Š” ์ˆ˜์ต - ์ผ๋…„๊ฐ„ ํ•œ ๊ณ ๊ฐ์„ ์„œํฌํŒ…ํ•˜๋Š” ๋น„์šฉ ์–ด๋–ป๊ฒŒ ๊ณ„์‚ฐํ• ๊นŒ? 1. customer cost๋ฅผ ์ •์˜ํ•œ๋‹ค(marketing cost, service, return, shipping,,,) 2. customer spend๋ฅผ ์ •์˜ํ•œ๋‹ค. (CRM์œผ๋กœ..

[NLP] ์…€ํ”„ ์–ดํƒ ์…˜

์…€ํ”„ ์–ดํ…์…˜ ์ˆ˜ํ–‰ ๋Œ€์ƒ = ์ž…๋ ฅ ์‹œํ€€์Šค ์ „์ฒด ๊ฐœ๋ณ„ ๋‹จ์–ด์™€ ์ „์ฒด ์ž…๋ ฅ ์‹œํ€€์Šค๋ฅผ ๋Œ€์ƒ์œผ๋กœ ์–ดํ…์…˜ ๊ณ„์‚ฐ์„ ์ˆ˜ํ–‰ํ•ด ๋ฌธ๋งฅ ์ „์ฒด๋ฅผ ๊ณ ๋ คํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ง€์—ญ์ ์ธ ๋ฌธ๋งฅ๋งŒ ๋ณด๋Š” CNN๊ณผ ์ฐจ์ด๊ฐ€ ์žˆ์Œ ๋ชจ๋“  ๊ฒฝ์šฐ์˜ ์ˆ˜๋ฅผ ๊ณ ๋ ค(๋‹จ์–ด๋“ค ์„œ๋กœ๊ฐ€ ์„œ๋กœ๋ฅผ 1๋Œ€ 1๋กœ ๋ฐ”๋ผ๋ณด๊ฒŒ ํ•จ)ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์‹œํ€€์Šค ๊ธธ์ด๊ฐ€ ๊ธธ์–ด์ง€๋”๋ผ๋„ ์ •๋ณด๋ฅผ ์žŠ๊ฑฐ๋‚˜ ์™œ๊ณกํ•  ์—ผ๋ ค๊ฐ€ ์—†๋‹ค๋Š” ์ ์—์„œ RNN๊ณผ ์ฐจ์ด ์–ดํ…์…˜๊ณผ ์…€ํ”„ ์–ดํ…์…˜ ์ฐจ์ด ์–ดํ…์…˜์€ ์†Œ์Šค ์‹œํ€€์Šค ์ „์ฒด ๋‹จ์–ด๋“ค(์–ด์ œ, ์นดํŽ˜, …, ๋งŽ๋”๋ผ)๊ณผ ํƒ€๊นƒ ์‹œํ€€์Šค ๋‹จ์–ด ํ•˜๋‚˜(cafe) ์‚ฌ์ด๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ๋ฐ ์“ฐ์ž…๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ์…€ํ”„ ์–ดํ…์…˜์€ ์ž…๋ ฅ ์‹œํ€€์Šค ์ „์ฒด ๋‹จ์–ด๋“ค ์‚ฌ์ด๋ฅผ ์—ฐ๊ฒฐํ•ฉ๋‹ˆ๋‹ค. ์–ดํ…์…˜์€ RNN ๊ตฌ์กฐ ์œ„์—์„œ ๋™์ž‘ํ•˜์ง€๋งŒ ์…€ํ”„ ์–ดํ…์…˜์€ RNN ์—†์ด ๋™์ž‘ํ•ฉ๋‹ˆ๋‹ค. ํƒ€๊นƒ ์–ธ์–ด์˜ ๋‹จ์–ด๋ฅผ 1๊ฐœ ์ƒ์„ฑํ•  ๋•Œ ์–ดํ…์…˜์€ 1ํšŒ ์ˆ˜ํ–‰ํ•˜์ง€๋งŒ ์…€ํ”„์–ดํ…์…˜..

[NLP] ํŠธ๋žœ์Šคํฌ๋จธ ๋ธ”๋ก, ์–ดํƒ ์…˜๊ณผ ์…€ํ”„ ์–ดํƒ ์…˜

ํŠธ๋žœ์Šคํฌ๋จธ์˜ ์ธ์ฝ”๋”๋Š” ์ด๊ฐ™์€ ๋ธ”๋ก์„ ์ˆ˜์‹ญ ๊ฐœ ์Œ“์•„์„œ ๊ตฌ์„ฑํ•œ๋‹ค ์ธ์ฝ”๋” ๋ธ”๋ก ๊ตฌ์„ฑ์š”์†Œ ๋ฉ€ํ‹ฐ ํ—ค๋“œ ์–ดํ…์…˜(Multi-Head Attention) ํ”ผ๋“œํฌ์›Œ๋“œ ๋‰ด๋Ÿด๋„คํŠธ์›Œํฌ(FeedForward) ์ž”์ฐจ ์—ฐ๊ฒฐ ๋ฐ ๋ ˆ์ด์–ด ์ •๊ทœํ™”(Add & Norm) ๋งˆ์Šคํฌ๋ฅผ ์ ์šฉํ•œ ๋ฉ€ํ‹ฐ ํ—ค๋“œ ์–ดํ…์…˜(Masked Multi-Head Attention) ๋ฉ€ํ‹ฐ ํ—ค๋“œ ์–ดํ…์…˜(Multi-Head Attention) ํ”ผ๋“œํฌ์›Œ๋“œ ๋‰ด๋Ÿด ๋„คํŠธ์›Œํฌ(FeedForward) ์ž”์ฐจ ์—ฐ๊ฒฐ ๋ฐ ๋ ˆ์ด์–ด ์ •๊ทœํ™”(Add & Norm) Self attention = Multi-Head Attention ์–ดํ…์…˜ = ์ค‘์š”ํ•œ ์š”์†Œ์— ๋” ์ง‘์ค‘ํ•ด ์„ฑ๋Šฅ์„ ๋Œ์–ด ์˜ฌ๋ฆฌ๋Š” ๊ธฐ๋ฒ• ๊ธฐ๊ณ„๋ฒˆ์—ญ์— ์–ดํ…์…˜ ๋„์ž…ํ•˜๋ฉด ํƒ€๊นƒ ์–ธ์–ด๋ฅผ ๋””์ฝ”๋”ฉํ•  ๋•Œ ์†Œ์Šค ์–ธ์–ด์˜ ๋‹จ์–ด ์‹œ๋ญ์Šค ๊ฐ€์šด๋ฐ ๋””์ฝ”๋”ฉ์— ๋„์›€์ด ๋˜๋Š” ..

[NLP] ์–ธ์–ด๋ชจ๋ธ: ํŠธ๋žœ์Šคํฌ๋จธ ๊ฐœ์š”

์–ธ์–ด ๋ชจ๋ธ์ด๋ž€? ๋‹จ์–ด ์‹œํ€€์Šค์— ํ™•๋ฅ ์„ ๋ถ€์—ฌํ•˜๋Š” ๋ชจ๋ธ ํŠธ๋žœ์Šคํฌ๋จธ? 2017๋…„ ๊ตฌ๊ธ€์ด ์ œ์•ˆํ•œ ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค ๋ชจ๋ธ, ๊ธฐ๊ณ„๋ฒˆ์—ญ๊ณผ ๊ฐ™์€ ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ•œ๋‹ค. ์‹œํ€€์Šค? ๋‹จ์–ด์™€ ๊ฐ™์€ ๋ฌด์–ธ๊ฐ€์˜ ๋‚˜์—ด ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค? ํŠน์ • ์†์„ฑ์„ ์ง€๋‹Œ ์‹œํ€€์Šค๋ฅผ ๋‹ค๋ฅธ ์†์„ฑ์˜ ์‹œํ€€์Šค๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์ž‘์—… (๊ธฐ๊ณ„ ๋ฒˆ์—ญ) ์†Œ์Šค ์–ธ์–ด -> ํƒ€๊นƒ ์–ธ์–ด๋กœ ๋ณ€ํ™˜ (์ด๋•Œ ๊ธธ์ด๊ฐ€ ๋‹ฌ๋ผ๋„ ๊ณผ์ œ ์ˆ˜ํ–‰์— ๋ฌธ์ œ๊ฐ€ ์—†์–ด์•ผ ํ•จ) ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค ๋ชจ๋ธ์˜ ๊ตฌ์„ฑ ์ธ์ฝ”๋” : ์†Œ์Šค ์‹œํ€€์Šค ์••์ถ•(=์ธ์ฝ”๋”ฉ)ํ•˜์—ฌ ๋””์ฝ”๋”๋กœ ๋ณด๋ƒ„ ๋””์ฝ”๋” : ํƒ€๊นƒ ์‹œํ€€์Šค ์ƒ์„ฑ(=๋””์ฝ”๋”ฉ) input:์†Œ์Šค ์‹œํ€€์Šค ์ „์ฒด output : ํƒ€๊นƒ ์‹œ๋ญ”์Šค ์ผ๋ถ€ ์ธ์ฝ”๋” ์ž…๋ ฅ : ์–ด์ œ, ์นดํŽ˜, ๊ฐ”์—ˆ์–ด, ๊ฑฐ๊ธฐ, ์‚ฌ๋žŒ, ๋งŽ๋”๋ผ (์†Œ์Šค์‹œํ€€์Šค ์ „์ฒด) ๋””์ฝ”๋” ์ž…๋ ฅ: ํƒ€๊นƒ ์‹œํ€€์Šค์˜ ์‹œ์ž‘์„ ์•Œ๋ฆฌ๋Š” ์ŠคํŽ˜์…œ ํ† ํฐ ..

์šฐ๋„ likelihood

์šฐ๋„ likelihood ๊ฐ€๋Šฅ๋„ ํ™•๋ฅ  ๋ถ„ํฌ์˜ ๋ชจ์ˆ˜๊ฐ€, ์–ด๋–ค ํ™•๋ฅ ๋ณ€์ˆ˜์˜ ํ‘œ์ง‘๊ฐ’๊ณผ ์ผ๊ด€๋˜๋Š” ์ •๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ’ ํŠน์ • ์‚ฌ๊ฑด๋“ค์ด ์ผ์–ด๋‚  ๊ฐ€๋Šฅ์„ฑ‘ ๋˜๋Š” ‘์ƒ˜ํ”Œ๋“ค๊ณผ ํ™•๋ฅ ๋ถ„ํฌ์˜ ์ผ๊ด€๋œ ์ •๋„ ์–ด๋–ค ์‹œํ–‰์˜ ๊ฒฐ๊ณผ (Evidence) E ๊ฐ€ ์ฃผ์–ด์กŒ๋‹ค ํ•  ๋•Œ, ๋งŒ์ผ ์ฃผ์–ด์ง„ ๊ฐ€์„ค H ๊ฐ€ ์ฐธ์ด๋ผ๋ฉด, ๊ทธ๋Ÿฌํ•œ ๊ฒฐ๊ณผ E ๊ฐ€ ๋‚˜์˜ฌ ์ •๋„๋Š” ์–ผ๋งˆ๋‚˜ ๋˜๊ฒ ๋Š๋ƒ ํ•˜๋Š” ๊ฒƒ ์ฆ‰ ๊ฒฐ๊ณผ E ๊ฐ€ ๋‚˜์˜จ ๊ฒฝ์šฐ, ๊ทธ๋Ÿฌํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋Š” ์—ฌ๋Ÿฌ ๊ฐ€๋Šฅํ•œ ๊ฐ€์„ค๋“ค์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ์ธก๋„๊ฐ€ ๊ณง ์šฐ๋„์ธ ์…ˆ์ด๋‹ค.

[NLP] ํ† ํฐํ™” , BPE, ์›Œ๋“œํ”ผ์Šค

ํ† ํฐํ™”๋ž€? ๋ฌธ์žฅ์„ ํ† ํฐ ์‹œํ€€์Šค๋กœ ๋‚˜๋ˆ„๋Š” ๊ณผ์ • ํ† ํฌ๋‚˜์ด์ €๋ž€? ํ† ํฐํ™” ์ˆ˜ํ–‰ํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ ํ•œ๊ตญ์–ด ํ† ํฌ๋‚˜์ด์ € : mecab, kkma,,,,,๋“ฑ๋“ฑ ์ข…๋ฅ˜์— ๋”ฐ๋ผ ํ’ˆ์‚ฌ ํƒœ๊น…๊นŒ์ง€ ํ•˜๋Š” ๊ฒฝ์šฐ๋„ ์žˆ์Œ 1. ๋‹จ์–ด(์–ด์ ˆ) ๋‹จ์œ„ ํ† ํฐํ™” - ๊ณต๋ฐฑ ๊ธฐ์ค€์œผ๋กœ ํ† ํฐํ™” ex) ์•„๊นŒ ์นดํŽ˜์— ์žˆ์—ˆ์–ด -> ์•„๊นŒ, ์นดํŽ˜์—, ์žˆ์—ˆ์–ด -- ๊ณต๋ฐฑ์œผ๋กœ ๋ถ„๋ฆฌํ•˜๋ฉด ๋ณ„๋„๋กœ ํ† ํฌ๋‚˜์ด์ €๋ฅผ ์“ฐ์ง€ ์•Š์•„๋„ ๋œ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์ง€๋งŒ, ์–ดํœ˜ ์ง‘ํ•ฉ(vocabulary)์˜ ํฌ๊ธฐ๊ฐ€ ๋งค์šฐ ์ปค์งˆ ์ˆ˜ ์žˆ์Œ(์žˆ์–ด, ์žˆ์—ˆ์–ด, ์žˆ์—ˆ๋Š”๋ฐ์š”๊นŒ์ง€ ๋ชจ๋“  ๊ฒฝ์šฐ์˜ ์ˆ˜๊ฐ€ ์–ดํœ˜์ง‘ํ•ฉ์— ๋“ค์–ด๊ฐ€์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ) ์–ดํœ˜ ์ง‘ํ•ฉ ํฌ๊ธฐ๊ฐ€ ์ปค์ง€๋ฉด ๊ทธ๋งŒํผ ๋ชจ๋ธ ํ•™์Šต์ด ์–ด๋ ค์›Œ์งˆ ์ˆ˜ ์žˆ์Œ mecab๊ฐ™์€ ๊ฒฝ์šฐ ์•„๊นŒ, ์นดํŽ˜์—, ์žˆ์—ˆ,์–ด ์™€ ๊ฐ™์ด ์˜๋ฏธ์žˆ๋Š” ๋‹จ์œ„๋กœ ํ† ํฐํ™”ํ•˜๊ธฐ์— ์–ดํœ˜์ง‘ํ•ฉํฌ๊ธฐ๊ฐ€ ์ง€๋‚˜์น˜๊ฒŒ ์ปค์ง€๋Š” ๊ฒƒ์„ ๋ง‰์„ ์ˆ˜๋Š” ์žˆ์Œ ..