๋จธ์‹ ๋Ÿฌ๋‹

๋‹ค์ค‘ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€ (์†Œํ”„ํŠธ๋งฅ์Šค ํšŒ๊ท€)

์ฃผ์˜ ๐Ÿฑ 2022. 12. 5. 12:11
728x90
๋ฐ˜์‘ํ˜•

์•ž์„œ ๋ถ„๋ฅ˜๊ฐ€ 2๊ฐœ์ธ(1์•„๋‹ˆ๋ฉด 0)์ธ ์ด์ง„ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€์— ๊ด€ํ•ด ๋ฐฐ์› ๋‹ค. ๋งŒ์•ฝ ๋ถ„๋ฅ˜ํ•ญ๋ชฉ์ด 2๊ฐœ๊ฐ€ ์•„๋‹Œ ๊ทธ ์ด์ƒ์ด๋ผ๋ฉด ์–ด๋–ป๊ฒŒ ํ• ๊นŒ? ์•ž์„  ์˜ˆ์ œ์—์„œ ์‚ฌ์šฉํ•œ ๋ฐ์ดํ„ฐ์—๋Š” ๋ถ“๊ฝƒ์˜ ํ’ˆ์ข…์ด virginica, versicolor,setosa๋กœ ์„ธ๊ฐ€์ง€์˜€์ง€๋งŒ ์šฐ๋ฆฌ๋Š” versicolor์ธ๊ฐ€ ์•„๋‹Œ๊ฐ€๋กœ๋งŒ ํŒ๋‹จ์„ ํ–ˆ์—ˆ๋‹ค. ์ด๋ฒˆ์—๋Š” ํ•œ ๋ถ“๊ฝƒ์˜ ๊ฝƒ์žŽ์˜ ๋„ˆ๋น„์™€ ๊ธธ์ด๋ฅผ ๊ฐ€์ง€๊ณ  ์„ธ๊ฐ€์ง€ ํ’ˆ์ข…์ค‘ ์–ด๋Š ํ’ˆ์ข…์ธ์ง€ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋‹ค์ค‘ ๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€๋ฅผ ํ•ด๋ณด๊ฒ ๋‹ค. 

๋‹ค์ค‘ ๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€๋Š” ์ƒ˜ํ”Œ x๊ฐ€ ์ฃผ์–ด์ง€๋ฉด ๊ฐ ํด๋ž˜์Šค์— ๋Œ€ํ•œ ์ ์ˆ˜๋ฅผ ์†Œํ”„ํŠธ๋งฅ์Šค ํšŒ๊ท€๋ชจ๋ธ์ด ๊ณ„์‚ฐํ•˜๊ณ  ๊ทธ ์ ์ˆ˜์— ์†Œํ”„ํŠธ๋งฅ์Šค ํ•จ์ˆ˜๋ฅผ ์ ์šฉํ•ด ๊ฐ ํด๋ž˜์Šค์˜ ํ™•๋ฅ ์„ ์ถ”์ •ํ•œ๋‹ค. 

log(odds)

 :

 ๋กœ์ง“๋ณ€ํ™˜ ๊ฒฐ๊ณผ๋Š” ์„ ํ˜•๊ฒฐํ•ฉํ•œ ํ˜•ํƒœ๋กœ ๋œ๋‹ค.

 

trainํ•  ๋•Œ, ํŒŒ๋ผ๋ฏธํ„ฐ ์ถ”์ •์€ ํฌ๋กœ์Šค ์—”ํŠธ๋กœํ”ผ๊ฐ€ ์ตœ์†Œ = log(liklihood function)์ด ์ตœ๋Œ€๊ฐ€ ๋˜๋Š” ๊ฐ’์ด๋‹ค. 

 

์•„๋ž˜๋Š” ์•ž์„œ ๋งํ–ˆ๋˜ ๋ถ“๊ฝƒ ํ’ˆ์ข… ๋ถ„๋ฅ˜๋ฌธ์ œ๋ฅผ ์‚ฌ์ดํ‚ท๋Ÿฐ์œผ๋กœ ๊ตฌํ˜„ํ•œ ์˜ˆ์‹œ์ด๋‹ค. 

from sklearn import datasets
iris=datasets.load_iris()
from sklearn.linear_model import LogisticRegression

X=iris['data'][:,(2,3)]
y=iris['target']
softmaxlr = LogisticRegression(multi_class='multinomial')#auto๋กœ ์ง€์ •ํ•˜๋ฉด ์ž๋™์œผ๋กœ ์ด์ง„/๋‹ค์ค‘์ธ์ง€ ์ง€์ •ํ•ด์คŒ
softmaxlr.fit(X,y)

 

๊ฝƒ์žŽ์˜ ๊ธธ์ด๊ฐ€ 5, ๋„ˆ๋น„๊ฐ€ 2์ธ ๋ถ“๊ฝƒ์€ 78.4ํ™•๋ฅ ๋กœ ํด๋ž˜์Šค 2(Virginica), 21.4%ํ™•๋ฅ ๋กœ versicolor๋ผ๊ณ  ์ถœ๋ ฅํ–ˆ๋‹ค. 

 

https://colab.research.google.com/drive/15vQxtl97V3lCS1fyOIzT7pTILaEbKD41?usp=sharing

๋ฐ˜์‘ํ˜•