๋”ฅ๋Ÿฌ๋‹/Today I learned :

๋จธ์‹ ๋Ÿฌ๋‹ ์ •์˜์™€ ๋ถ„๋ฅ˜

์ฃผ์˜ ๐Ÿฑ 2021. 6. 4. 15:59
728x90
๋ฐ˜์‘ํ˜•

โ–ท ๋จธ์‹ ๋Ÿฌ๋‹์€ ๋ช…์‹œ์ ์ธ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์—†์ด ์ปดํ“จํ„ฐ๊ฐ€ ํ•™์Šตํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”๊ฒŒ ํ•˜๋Š” ์—ฐ๊ตฌ ๋ถ„์•ผ๋‹ค.

 

โ–ท ์–ด๋–ค ์ž‘์—… T์— ๋Œ€ํ•œ ํ”„๋กœ๊ทธ๋žจ์˜ ์„ฑ๋Šฅ์„ P๋กœ ์ธก์ •ํ–ˆ์„ ๋•Œ ๊ฒฝํ—˜ E๋กœ ์ธํ•ด ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋๋‹ค๋ฉด,

์ด ํ”„๋กœ๊ทธ๋žจ์€ T์™€ P์— ๋Œ€ํ•ด E๋กœ ํ•™์Šตํ•œ ๊ฒƒ์ด๋‹ค.

 

 

์ŠคํŒธ ํ•„ํ„ฐ - ์ŠคํŒธ๋ฉ”์ผ ๊ตฌ๋ถ„ ๋จธ์‹ ๋Ÿฌ๋‹ ํ”„๋กœ๊ทธ๋žจ

 

์‹œ์Šคํ…œ์ด ํ•™์Šตํ•˜๋Š”๋ฐ ์‚ฌ์šฉํ•˜๋Š” ์ƒ˜ํ”Œ = ํ›ˆ๋ จ์„ธํŠธ training set

๊ฐ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ = training instance | ์ƒ˜ํ”Œ

์ด ๊ฒฝ์šฐ ์ž‘์—…T = ์ƒˆ ๋ฉ”์ผ์ด ์ŠคํŒฌ์ธ์ง€ ๊ตฌ๋ถ„ํ•˜๋Š” ๊ฒƒ

๊ฒฝํ—˜ E = ํ›ˆ๋ จ๋ฐ์ดํ„ฐ

์„ฑ๋Šฅ ์ธก์ •P๋Š” ์ง์ ‘ ์ •์˜ํ•ด์•ผ ํ•œ๋‹ค. (ex - ์ •ํ™•ํžˆ ๋ถ„๋ฅ˜๋œ ๋ฉ”์ผ์˜ ๋น„์œจ) = ์ •ํ™•๋„ accuracy , ๋ถ„๋ฅ˜ ์ž‘์—…์— ์‚ฌ์šฉ๋œ๋‹ค.

 

 

๋จธ์‹ ๋Ÿฌ๋‹์€ ๋‹ค์Œ ๋ถ„์•ผ์— ๋›ฐ์–ด๋‚˜๋‹ค :

  • ๊ธฐ์กด ์†”๋ฃจ์…˜์œผ๋กœ๋Š” ๋งŽ์€ ์ˆ˜๋™ ์กฐ์ •๊ณผ ๊ทœ์น™์ด ํ•„์š”ํ•œ ๋ฌธ์ œ : ํ•˜๋‚˜์˜ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด ์ฝ”๋“œ๋ฅผ ๊ฐ„๋‹จํ•˜๊ฒŒ ๋งŒ๋“ค๊ณ  ์ „ํ†ต์ ์ธ ๋ฐฉ๋ฒ•๋ณด๋‹ค ๋” ์ž˜ ์ˆ˜ํ–‰๋˜๋„๋ก ํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ์ „ํ†ต์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์ด ์—†๋Š” ๋ณต์žกํ•œ ๋ฌธ์ œ : ๊ฐ€์žฅ ๋›ฐ์–ด๋‚œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฒ•์œผ๋กœ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋‹ค
  • ์œ ๋™์ ์ธ ํ™˜๊ฒฝ : ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ์ ์‘ํ•  ์ˆ˜ ์žˆ๋‹ค
  • ๋ณต์žกํ•œ ๋ฌธ์ œ์™€ ๋Œ€๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ์—์„œ ์ธ์‚ฌ์ดํŠธ ์–ป๊ธฐ

 

๊ตฌ์ฒด์ ์ธ ๋จธ์‹ ๋Ÿฌ๋‹ ์ž‘์—…์˜ ์‚ฌ๋ก€ : 

  • ์ƒ์‚ฐ ๋ผ์ธ์—์„œ ์ œํ’ˆ ์ด๋ฏธ์ง€๋ฅผ ๋ถ„์„ํ•ด ์ž๋™์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ :์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜, CNN ์‚ฌ์šฉ
  • ๋‡Œ ์Šค์บ”ํ•˜์—ฌ ์ข…์–‘ ์ง„๋‹จํ•˜๊ธฐ : ์‹œ๋งจํ‹ฑ ๋ถ„ํ•  ์ž‘์—…,CNN์œผ๋กœ ์ด๋ฏธ์ง€์˜ ๊ฐ ํ”ฝ์…€ ๋ถ„๋ฅ˜
  • ๋‰ด์Šค ๊ธฐ์‚ฌ ์ž๋™ ๋ถ„๋ฅ˜ : ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ (NLP), ํ…์ŠคํŠธ ๋ถ„๋ฅ˜ ์ž‘์—…. RNN,CNN,ํŠธ๋žœ์Šคํฌ๋จธ๋กœ ํ•ด๊ฒฐ
  • ํ† ๋ก  ํฌ๋Ÿผ์—์„œ ๋ถ€์ •์  ์ฝ”๋ฉ˜ํŠธ ์ž๋™์œผ๋กœ ๊ตฌ๋ถ„ : NLP
  • ๊ธด ๋ฌธ์„œ ์ž๋™ ์š”์•ฝ : NLP
  • ์ฑ—๋ด‡ : NLU , NLP ์ปดํฌ๋„ŒํŠธ
  • ๋‹ค์–‘ํ•œ ์„ฑ๋Šฅ ์ง€ํ‘œ ๊ธฐ๋ฐ˜์œผ๋กœ ํšŒ์‚ฌ์˜ ๋‚ด๋…„๋„ ์ˆ˜์ต ์˜ˆ์ธกํ•˜๊ธฐ : ํšŒ๊ท€ ๋ชจ๋ธ ์‚ฌ์šฉ
  • ์Œ์„ฑ ๋ช…๋ น์— ๋ฐ˜์‘ํ•˜๋Š” ์•ฑ : RNN, CNN ํŠธ๋žœ์Šคํฌ๋จธ
  • ์‹ ์šฉ์นด๋“œ ๋ถ€์ •๊ฑฐ๋ž˜ ๊ฐ์ง€ : ์ด์ƒ์น˜ ํƒ์ง€ ์ž‘์—…
  • ๊ตฌ๋งค ์ด๋ ฅ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ณ ๊ฐ์„ ๋‚˜๋ˆ„๊ณ  ๊ฐ ์ง‘ํ•ฉ์— ๋งž๋Š” ๋งˆ์ผ€ํŒ… ์ „๋žต : ๊ตฐ์ง‘ ์ž‘์—…
  • ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ์…‹์„ ๋ช…ํ™•ํ•œ ๊ทธ๋ž˜ํ”„๋กœ ํ‘œํ˜„ํ•˜๊ธฐ : ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™” , ์ฐจ์› ์ถ•์†Œ ๊ธฐ๋ฒ•
  • ๊ณผ๊ฑฐ ๊ตฌ๋งค ์ด๋ ฅ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ณ ๊ฐ์ด ๊ด€์‹ฌ์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋Š” ์ƒํ’ˆ ์ถ”์ฒœ : ๊ณผ๊ฑฐ ๊ตฌ๋งค ์ด๋ ฅ์„ ์ธ๊ณต ์‹ ๊ฒฝ๋ง์— ์ฃผ์ž…ํ•˜๊ณ  ๋‹ค์Œ์— ๊ตฌ๋งคํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๊ฐ€์žฅ ๋†’์€ ์ƒํ’ˆ ์ถœ๋ ฅ
  • ์ง€๋Šฅํ˜• ๊ฒŒ์ž„ ๋ด‡bot : ๋ณดํ†ต ๊ฐ•ํ™”ํ•™์ŠตRL ,ex ์•ŒํŒŒ๊ณ 

 

๋จธ์‹ ๋Ÿฌ๋‹ ์‹œ์Šคํ…œ์˜ ์ข…๋ฅ˜

 

ํ•™์Šตํ•˜๋Š” ๋™์•ˆ์˜ ๊ฐ๋… ํ˜•ํƒœ๋‚˜ ์ •๋ณด๋Ÿ‰์— ๋”ฐ๋ผ

์ง€๋„ํ•™์Šต, ๋น„์ง€๋„ํ•™์Šต, ์ค€์ง€๋„ ํ•™์Šต, ๊ฐ•ํ™”ํ•™์Šต

 

์ง€๋„ ํ•™์Šต  supervised learning 

์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์ฃผ์ž…ํ•˜๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”์ด๋ผ๋Š” ์›ํ•˜๋Š” ๋‹ต์ด ํฌํ•จ๋œ๋‹ค

 

 - ๋ถ„๋ฅ˜(ex ์ŠคํŒธํ•„ํ„ฐ)

 - ํšŒ๊ท€ (์˜ˆ์ธก๋ณ€์ˆ˜๋ผ ๋ถ€๋ฅด๋Š” ํŠน์„ฑ,์†์„ฑ(์ฃผํ–‰๊ฑฐ๋ฆฌ, ์—ฐ์‹, ๋ธŒ๋žœ๋“œ..)๋“ค์„ ์ด์šฉํ•ด ์ค‘๊ณ ์ฐจ ๊ฐ€๊ฒฉ๊ฐ™์€ ํƒ€๊ฒŸ ์ˆ˜์น˜๋ฅผ ์˜ˆ์ธก)

 - ์ผ๋ถ€ ํšŒ๊ท€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋ถ„๋ฅ˜์— ์‚ฌ์šฉ ํ˜น์€ ๊ทธ ๋ฐ˜๋Œ€ (๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋Š” ๋ถ„๋ฅ˜์— ์‚ฌ์šฉ - ํด๋ž˜์Šค์— ์†ํ•  ํ™•๋ฅ ์„ ์ถœ๋ ฅํ•œ๋‹ค.)

 

 ์ค‘์š”ํ•œ ์ง€๋„ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ : 

  • k- ์ตœ๊ทผ์ ‘ ์•„์›ƒ
  • ์„ ํ˜• ํšŒ๊ท€
  • ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€
  • ์„œํฌํŠธ ๋ฒกํ„ฐ ๋จธ์‹ 
  • ๊ฒฐ์ • ํฌ๋ฆฌ์™€ ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ
  • ์‹ ๊ฒฝ๋ง

 

๋น„์ง€๋„ ํ•™์Šต  unsupervised learning 

์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์ฃผ์ž…ํ•˜๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”์ด ์—†์Œ. ์•Œ์•„์„œ ํ•™์Šต

 

์ค‘์š”ํ•œ ๋น„์ง€๋„ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ : 

  • ๊ตฐ์ง‘
    • k- ํ‰๊ท 
    • DBSCAN
    • ๊ณ„์ธต ๊ตฐ์ง‘ ๋ถ„์„
    • ์ด์ƒ์น˜ ํƒ์ง€, ํŠน์ด์น˜ ํƒ์ง€
    • ์›-ํด๋ž˜์Šค
  • ์‹œ๊ฐํ™”์™€ ์ฐจ์› ์ถ•์†Œ, ํŠน์„ฑ ์ถ”์ถœ
    • ์ฃผ์„ฑ๋ถ„ ๋ถ„์„
    • ์ปค๋„PCA
    • ์ง€์—ญ์  ์„ ํ˜• ์ž„๋ฒ ๋”ฉ
    • t-SNE
  • ์—ฐ๊ด€ ๊ทœ์น™ ํ•™์Šต
    • Apriori
    • Eclat

 

์ค€์ง€๋„ ํ•™์Šต  semisupervised learning 

์ผ๋ถ€๋งŒ ๋ ˆ์ด๋ธ”์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

์ง€๋„+๋น„์ง€๋„ ํ•™์Šต

 

 

๊ฐ•ํ™” ํ•™์Šต  reinforcement learning 

๋งค์šฐ ๋‹ค๋ฅธ ์ข…๋ฅ˜์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜

ํ•™์Šตํ•˜๋Š” ์‹œ์Šคํ…œ = ์—์ด์ „ํŠธ , ํ™˜๊ฒฝ์„ ๊ด€์ฐฐํ•ด ํ–‰๋™์„ ์‹คํ–‰ํ•˜๊ณ  ๊ทธ ๊ฒฐ๊ณผ๋กœ ๋ณด์ƒ ํ˜น์€ ํŒจ๋„ํ‹ฐ๋ฅผ ๋ฐ›๋Š”๋‹ค

์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด์„œ ์ตœ์ƒ์˜ ์ „๋žต์ธ ์ •์ฑ…์„ ์Šค์Šค๋กœ ํ•™์Šตํ•œ๋‹ค, 

์ •์ฑ…์€ ์ƒํ™ฉ ์† ์—์ด์ „ํŠธ๊ฐ€ ์–ด๋–ค ํ–‰๋™์„ ์„ ํƒํ•ด์•ผํ• ์ง€๋ฅผ ์ •์˜ํ•œ๋‹ค.

(๋ณดํ–‰ ๋กœ๋ด‡ ๋งŒ๋“ค๊ธฐ ,์•ŒํŒŒ๊ณ )

 

๋ฐ˜์‘ํ˜•