๋”ฅ๋Ÿฌ๋‹/Today I learned :

end-to-end ๋ชจ๋ธ์ด๋ž€

์ฃผ์˜ ๐Ÿฑ 2023. 1. 13. 16:06
728x90
๋ฐ˜์‘ํ˜•

๋”ฅ๋Ÿฌ๋‹ ์ฑ…์„ ์ฝ๋‹ค๋ณด๋ฉด, ์—”๋“œํˆฌ์—”๋“œ ๋ชจ๋ธ์ด๋ผ๋Š” ์šฉ์–ด๊ฐ€ ๋งŽ์ด ๋‚˜์˜จ๋‹ค. 

 

end-to-end ๋ชจ๋ธ

๋Œ€๋ถ€๋ถ„์˜ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ x๋ฅผ ๋„ฃ์œผ๋ฉด y๊ฐ€ ๋‚˜์˜ค๋„๋ก ํ•œ๋‹ค. (์˜ˆ๋ฅผ ๋“ค๋ฉด, ๊ฐœ์‚ฌ์ง„ ์ž…๋ ฅ-> ๊ฐœ๋ฅผ๋ฑ‰๋Š” ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ํ…Œ์Šคํฌ)

๊ทธ ๊ณผ์ •์€ ์ด๋ฏธ์ง€์—์„œ ํŠน์ง•์„ ์ถ”์ถœํ•˜๊ณ , ํŠน์ง•์— ๋งž๋Š” ๋‹จ์–ด์™€ ๋งค์นญ์‹œํ‚ค๊ณ  ์ด๋Ÿฌํ•œ ์ž‘์—…๋“ค์„ ๊ฑฐ์น˜๋Š” ํŒŒ์ดํ”„๋ผ์ธ์œผ๋กœ ์ด๋ฃจ์–ด์ ธ์žˆ๋‹ค.end-to-end ๋ชจ๋ธ์€ ์ด๋Ÿฌํ•œ ์ค‘๊ฐ„ ๊ณผ์ •๋“ค์„ ํ•˜๋‚˜์˜ ์‹ ๊ฒฝ๋ง(ํ•˜๋‚˜์˜ ํŒŒ์ดํ”„๋ผ์ธ)์œผ๋กœ ๋Œ€์ฒด/์••์ถ•ํ•˜๋Š” ๊ฒƒ์ด๋ผ ์ƒ๊ฐํ•˜๋ฉด ๋œ๋‹ค. 

 

๋‹ค๋งŒ ์ด๋Š” ๋งŽ์€ ์–‘์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ์–ด์•ผ๋งŒ ๊ฐ€๋Šฅํ•˜๋‹ค.

 

์Œ์„ฑ์ธ์‹์— end-to-end ๋ฅผ ์ ์šฉํ•œ ์˜ˆ

 


 

 

์‚ฌ์‹ค ์ข€ ์ถ”์ƒ์ ์ธ ๊ฐœ๋…์ด๊ธฐ๋Š” ํ•œ๋ฐ์š” “ํŠน์ •ํ•œ task๋ฅผ ํ•˜๋‚˜์˜ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ถ”๋ก  ๊ฒฐ๊ณผ๋กœ ์ˆ˜ํ–‰ํ•œ๋‹ค” ์ด์ •๋„์˜ ์˜๋ฏธ์ธ๋ฐ ์—ฌ๊ธฐ์„œ “ํŠน์ •ํ•œ task” ๋Š” language modeling, sentence classification๊ณผ ๊ฐ™์€ ์šฐ๋ฆฌ๊ฐ€ ์ตํžˆ ์•Œ๊ณ  ์žˆ๋Š” task๋“ค์ด ๋  ์ˆ˜ ์žˆ๊ฒ ๊ณ ,“ํ•˜๋‚˜์˜ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ถ”๋ก  ๊ฒฐ๊ณผ“๋ผ๋Š” ์˜๋ฏธ๋Š” ๋ฐ˜๋Œ€์˜ ๊ฒฝ์šฐ์ธ “์—ฌ๋Ÿฌ ๋ชจ๋ธ๋กœ ์›ํ•˜๋Š” task์— ๋Œ€ํ•œ ์ถ”๋ก  ๊ฒฐ๊ณผ“๋กœ ์‰ฝ๊ฒŒ ์ดํ•ดํ•ด๋ณผ ์ˆ˜ ์žˆ์„ํ…๋ฐ์š”.

์˜ˆ๋ฅผ ๋“ค์–ด, “๊ธ๋ถ€์ • ๋ถ„๋ฅ˜“๋ผ๋Š” task๋ฅผ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด A๋ชจ๋ธ, B๋ชจ๋ธ ๋‘๊ฐœ๊ฐ€ ํ•„์š”ํ•˜๊ณ  A๋ชจ๋ธ์˜ ๊ฒฐ๊ณผ๊ฐ’์„ ์ด์šฉํ•ด B๋ชจ๋ธ์˜ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๊ณ  B๋ชจ๋ธ์ด “๊ธ๋ถ€์ • ๋ถ„๋ฅ˜“๋ฅผ ์ˆ˜ํ–‰ํ•˜๋ฉด ์ด๋Ÿฌํ•œ ๊ตฌ์กฐ๋Š” end to end๊ตฌ์กฐ๋กœ ๋ณด๊ธฐ๋Š” ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

์—ฌ๋Ÿฌ๊ฐœ์˜ ๋ชจ๋ธ์„ ์“ฐ๋”๋ผ๋„ ๋ชจ๋ธ๊ฐ„์˜ ์˜์กด์„ฑ์ด ์—†๋‹ค๋ฉด end to end๋ผ๊ณ  ๋ณผ ์ˆ˜๋„ ์žˆ๊ฒ ๊ตฌ์š” ~ (์ด ๊ฒฝ์šฐ๋Š” ensemble ๊ตฌ์กฐ๋กœ ๋ณผ ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค)๋”ฐ๋ผ์„œ, end to end๋Š” ์—ฌ๋Ÿฌ ๋ชจ๋“ˆ (RNNs, transformer ๋“ฑ)์„ ์“ฐ๋”๋ผ๋„ input์— ๋Œ€ํ•ด์„œ ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ํ˜•ํƒœ์˜ output์„ ๋ฐ”๋กœ ์ถœ๋ ฅํ•ด์ค„ ์ˆ˜ ์žˆ๋Š” ํ•˜๋‚˜์˜ ๊ตฌ์กฐ์— ๋Œ€ํ•ด ๋ถ™๋Š” ์ด๋ฆ„์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค ~

๋ฐ˜์‘ํ˜•