๋Œ€ํšŒ ํ”„๋กœ์ ํŠธ/kaggle

kaggle ์‹ ์šฉ์นด๋“œ ๊ฑฐ๋ž˜ ์ด์ƒ ํƒ์ง€ (๋ถ„๋ฅ˜, ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€)

์ฃผ์˜ ๐Ÿฑ 2022. 12. 5. 15:06
728x90
๋ฐ˜์‘ํ˜•

https://www.kaggle.com/datasets/mlg-ulb/creditcardfraud

 

Credit Card Fraud Detection

Anonymized credit card transactions labeled as fraudulent or genuine

www.kaggle.com

๋Œ€ํšŒ๋ฌธ์ œ: ์ƒ๋‹จ ๋งํฌ

๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ฅผ ๊ณต๋ถ€ํ•˜๊ณ , ์‹ค์ œ๋กœ ์ ์šฉํ•ด๋ณด๊ณ  ์‹ถ์–ด์„œ ์บ๊ธ€์—์„œ ๋ฌธ์ œ๋ฅผ ํ•˜๋‚˜ ๊ณจ๋ผ ํ’€์–ด๋ดค๋‹ค. 

์‹ ์šฉ์นด๋“œ ๊ฑฐ๋ž˜๊ฐ€ ์‚ฌ๊ธฐ๊ฑฐ๋ž˜์ธ์ง€, ์ •์ƒ๊ฑฐ๋ž˜์ธ์ง€ ์‹๋ณ„ํ•˜๋Š” ๋ฌธ์ œ๋กœ,  ์นด๋“œ์‚ฌ๊ฐ€ ์ด์ƒ ์žˆ๋Š” ์นด๋“œ ๊ฑฐ๋ž˜๋ฅผ ์ธ์‹ ํ•˜์—ฌ ๊ณ ๊ฐ์ด ๊ตฌ๋งคํ•˜์ง€ ์•Š์€ ํ•ญ๋ชฉ์— ๋Œ€ํ•ด์„œ๋Š” ๋น„์šฉ์ด ์ฒญ๊ตฌ๋˜์ง€ ์•Š๋„๋ก ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์ด๋‹ค.

๋ฐ์ดํ„ฐ ์…‹์€ ์ดํ‹€์น˜ ๊ฑฐ๋ž˜๋กœ, 248,807๊ฑด์˜ ๊ฑฐ๋ž˜์ค‘ 492๊ฑด์˜ ์‚ฌ๊ธฐ๊ฐ€ ์žˆ๋‹ค. Class์นผ๋Ÿผ์— 0,1๋กœ ํ‘œ๊ธฐ๋˜์–ด์žˆ๋‹ค. Fraud(์ด์ƒ)๋Š” ๋ชจ๋“  ๊ฑฐ๋ž˜์˜ 0.172%๋ฐ”๊ปญ ๋˜์ง€ ์•Š๋Š”๋‹ค. ํ”ผ์ฒ˜๋Š” V1~ V28๋กœ, PCA๋กœ ํ•œ๋ฒˆ ๊ฐ€๊ณต๋๊ณ  ์ƒ์„ธ ์ •๋ณด๋Š” ๊ธฐ๋ฐ€์ด๋‹ค. ๊ฐ€๊ณต๋˜์ง€ ์•Š์€ ๋ณ€์ˆ˜๋Š” time ๊ณผ ๊ธˆ์•ก(Amount)์ด๋‹ค

https://colab.research.google.com/drive/1LpRCQZRmgEQFtzZlHut6KQezEKGAaXRq?usp=sharing

๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•˜๊ณ  ๊ฒฐ์ธก์น˜๋ฅผ ์‚ดํŽด๋ณธ๋‹ค - ๊ฒฐ์ธก์น˜์—†์Œ!

์‹œ๊ฐ„ ์นผ๋Ÿผ์€ ์“ฐ์ง€ ์•Š๊ณ  1~28, ๊ธˆ์•ก๊นŒ์ง€๋Š” X๋กœ, ํƒ€๊ฒŸ๋ณ€์ˆ˜ ํด๋ž˜์Šค(0,1)์€ y๋กœ ์„ค์ •ํ•œ๋‹ค. 

์‚ฌ๊ธฐ์ธ ๊ฑด์€ ์ „์ฒด์ค‘์— 492๊ฐœ๋กœ ํ˜„์ €ํžˆ ์ ๋‹ค. ์ด ๋•Œ ํ•™์Šต์ด ๋” ์ž˜๋˜๊ฒŒ ํ•˜๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ• ๊นŒ

7๋Œ€ 3์œผ๋กœ ํ•™์Šต๊ณผ ๊ฒ€์ฆ์…‹์„ ๋‚˜๋ˆ„์–ด์ฃผ์—ˆ๋‹ค. ์‚ฌ์ดํ‚ท๋Ÿฐ์˜ ๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€๋ฅผ ํ˜ธ์ถœํ•˜์—ฌ ํ•™์Šต ํ›„ ์ •ํ™•๋„๋ฅผ ์ธก์ •ํ–ˆ๋‹ค. 

 

์˜ค์ฐจํ–‰๋ ฌ์„ ์‹œ๊ฐํ™”ํ–ˆ๋‹ค. 

 

์„ฑ๊ณผ์ธก์ •์ง€ํ‘œ๋“ค์„ ๊ณ„์‚ฐํ•œ๋‹ค. 

๋ฐ˜์‘ํ˜•