[자연어 처리] 한국어 토큰화, 품사태깅 구현 KoNLPy (Hannanum,Kkma),Khaiii

자연어 처리/Today I learned :

[자연어 처리] 한국어 토큰화, 품사태깅 구현 KoNLPy (Hannanum,Kkma),Khaiii

주영 🐱 2023. 1. 3. 18:18

728x90

설치

!pip install konlpy

한나눔(Hannanum)

from konlpy.tag import Hannanum
hannanum = Hannanum()
text = '안녕하세요! 오늘 많이 추워요'
print(hannanum.morphs(text))  # Parse phrase to morphemes
print(hannanum.nouns(text))   # Noun extractors
print(hannanum.pos(text))     # POS tagger

['안녕', '하', '세', '요', '!', '오늘', '많', '이', '춥', '어요']
['안녕', '오늘']
[('안녕', 'N'), ('하', 'X'), ('세', 'E'), ('요', 'J'), ('!', 'S'), ('오늘', 'N'), ('많', 'P'), ('이', 'X'), ('춥', 'P'), ('어요', 'E')]

꼬꼬마

from konlpy.tag import Kkma
kkma = Kkma()
text = '안녕하세요! 오늘은 많이 추워요'
print(kkma.morphs(text))  # Parse phrase to morphemes
print(kkma.nouns(text))   # Noun extractors
print(kkma.pos(text))     # POS tagger

['안녕', '하', '세요', '!', '오늘', '은', '많이', '춥', '어요']
['안녕', '오늘']
[('안녕', 'NNG'), ('하', 'XSV'), ('세요', 'EFN'), ('!', 'SF'), ('오늘', 'NNG'), ('은', 'JX'), ('많이', 'MAG'), ('춥', 'VA'), ('어요', 'EFN')]

Khaiii

!git clone https://github.com/kakao/khaiii.git
!pip install cmake
!mkdir build
!cd build && cmake /content/khaiii
!cd /content/build/ && make all
!cd /content/build/ && make resource
!cd /content/build && make install
!cd /content/build && make package_python
!pip install /content/build/package_python

from khaiii import KhaiiiApi
khaiiApi = KhaiiiApi()

tokenized = khaiiApi.analyze('코딩과 AI 개발이 둘다 가능한 사람은 많지 않다.')
tokens = []
for word in tokenized:
    tokens.extend([str(m).split('/')[0] for m in word.morphs])

print(tokens)

저작자표시 비영리 변경금지 (새창열림)

'자연어 처리 > Today I learned :' 카테고리의 다른 글

[자연어 처리] 맞춤법 전처리 교정 Py-Hanspell 예제 (0)	2023.01.03
[자연어 처리]전처리 띄어쓰기 교정 수정 PyKoSpacing 예제 (0)	2023.01.03
[자연어 처리]한국어 전처리 re (0)	2023.01.03
[자연어처리] 텍스트 전처리(Text Preprocessing) (1)	2023.01.03
PYTORCH(파이토치) cheatsheet (0)	2022.12.12

현재글[자연어 처리] 한국어 토큰화, 품사태깅 구현 KoNLPy (Hannanum,Kkma),Khaiii

TIL

마케팅, 특수문자이모티콘, 오블완, 배당투자, 오픽, 오픽 AL, 오픽공부법, 1인개발자, 오픽 모의테스트, 1인개발마케팅, 오픽1주, 오픽AL, 티스토리챌린지, 안드로이드개발, 오픽IH, 딥러닝, 오픽모의고사, 오픽기출, 1인개발, 배당투자계산기,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TIL