๋ค์ค ๋ก์ง์คํฑ ํ๊ท (์ํํธ๋งฅ์ค ํ๊ท)
์์ ๋ถ๋ฅ๊ฐ 2๊ฐ์ธ(1์๋๋ฉด 0)์ธ ์ด์ง ๋ก์ง์คํฑ ํ๊ท์ ๊ดํด ๋ฐฐ์ ๋ค. ๋ง์ฝ ๋ถ๋ฅํญ๋ชฉ์ด 2๊ฐ๊ฐ ์๋ ๊ทธ ์ด์์ด๋ผ๋ฉด ์ด๋ป๊ฒ ํ ๊น? ์์ ์์ ์์ ์ฌ์ฉํ ๋ฐ์ดํฐ์๋ ๋ถ๊ฝ์ ํ์ข ์ด virginica, versicolor,setosa๋ก ์ธ๊ฐ์ง์์ง๋ง ์ฐ๋ฆฌ๋ versicolor์ธ๊ฐ ์๋๊ฐ๋ก๋ง ํ๋จ์ ํ์๋ค. ์ด๋ฒ์๋ ํ ๋ถ๊ฝ์ ๊ฝ์์ ๋๋น์ ๊ธธ์ด๋ฅผ ๊ฐ์ง๊ณ ์ธ๊ฐ์ง ํ์ข ์ค ์ด๋ ํ์ข ์ธ์ง ๋ถ๋ฅํ๋ ๋ค์ค ๋ก์ง์คํฑํ๊ท๋ฅผ ํด๋ณด๊ฒ ๋ค.
๋ค์ค ๋ก์ง์คํฑํ๊ท๋ ์ํ x๊ฐ ์ฃผ์ด์ง๋ฉด ๊ฐ ํด๋์ค์ ๋ํ ์ ์๋ฅผ ์ํํธ๋งฅ์ค ํ๊ท๋ชจ๋ธ์ด ๊ณ์ฐํ๊ณ ๊ทธ ์ ์์ ์ํํธ๋งฅ์ค ํจ์๋ฅผ ์ ์ฉํด ๊ฐ ํด๋์ค์ ํ๋ฅ ์ ์ถ์ ํ๋ค.
:
๋ก์ง๋ณํ ๊ฒฐ๊ณผ๋ ์ ํ๊ฒฐํฉํ ํํ๋ก ๋๋ค.
trainํ ๋, ํ๋ผ๋ฏธํฐ ์ถ์ ์ ํฌ๋ก์ค ์ํธ๋กํผ๊ฐ ์ต์ = log(liklihood function)์ด ์ต๋๊ฐ ๋๋ ๊ฐ์ด๋ค.
์๋๋ ์์ ๋งํ๋ ๋ถ๊ฝ ํ์ข ๋ถ๋ฅ๋ฌธ์ ๋ฅผ ์ฌ์ดํท๋ฐ์ผ๋ก ๊ตฌํํ ์์์ด๋ค.
from sklearn import datasets
iris=datasets.load_iris()
from sklearn.linear_model import LogisticRegression
X=iris['data'][:,(2,3)]
y=iris['target']
softmaxlr = LogisticRegression(multi_class='multinomial')#auto๋ก ์ง์ ํ๋ฉด ์๋์ผ๋ก ์ด์ง/๋ค์ค์ธ์ง ์ง์ ํด์ค
softmaxlr.fit(X,y)
๊ฝ์์ ๊ธธ์ด๊ฐ 5, ๋๋น๊ฐ 2์ธ ๋ถ๊ฝ์ 78.4ํ๋ฅ ๋ก ํด๋์ค 2(Virginica), 21.4%ํ๋ฅ ๋ก versicolor๋ผ๊ณ ์ถ๋ ฅํ๋ค.
https://colab.research.google.com/drive/15vQxtl97V3lCS1fyOIzT7pTILaEbKD41?usp=sharing