https://www.kaggle.com/datasets/mlg-ulb/creditcardfraud
๋ํ๋ฌธ์ : ์๋จ ๋งํฌ
๋ก์ง์คํฑ ํ๊ท๋ฅผ ๊ณต๋ถํ๊ณ , ์ค์ ๋ก ์ ์ฉํด๋ณด๊ณ ์ถ์ด์ ์บ๊ธ์์ ๋ฌธ์ ๋ฅผ ํ๋ ๊ณจ๋ผ ํ์ด๋ดค๋ค.
์ ์ฉ์นด๋ ๊ฑฐ๋๊ฐ ์ฌ๊ธฐ๊ฑฐ๋์ธ์ง, ์ ์๊ฑฐ๋์ธ์ง ์๋ณํ๋ ๋ฌธ์ ๋ก, ์นด๋์ฌ๊ฐ ์ด์ ์๋ ์นด๋ ๊ฑฐ๋๋ฅผ ์ธ์ ํ์ฌ ๊ณ ๊ฐ์ด ๊ตฌ๋งคํ์ง ์์ ํญ๋ชฉ์ ๋ํด์๋ ๋น์ฉ์ด ์ฒญ๊ตฌ๋์ง ์๋๋ก ํ๋ ๊ฒ์ด ๋ชฉํ์ด๋ค.
๋ฐ์ดํฐ ์
์ ์ดํ์น ๊ฑฐ๋๋ก, 248,807๊ฑด์ ๊ฑฐ๋์ค 492๊ฑด์ ์ฌ๊ธฐ๊ฐ ์๋ค. Class์นผ๋ผ์ 0,1๋ก ํ๊ธฐ๋์ด์๋ค. Fraud(์ด์)๋ ๋ชจ๋ ๊ฑฐ๋์ 0.172%๋ฐ๊ปญ ๋์ง ์๋๋ค. ํผ์ฒ๋ V1~ V28๋ก, PCA๋ก ํ๋ฒ ๊ฐ๊ณต๋๊ณ ์์ธ ์ ๋ณด๋ ๊ธฐ๋ฐ์ด๋ค. ๊ฐ๊ณต๋์ง ์์ ๋ณ์๋ time ๊ณผ ๊ธ์ก(Amount)์ด๋ค
https://colab.research.google.com/drive/1LpRCQZRmgEQFtzZlHut6KQezEKGAaXRq?usp=sharing
๋ฐ์ดํฐ๋ฅผ ๋ก๋ํ๊ณ ๊ฒฐ์ธก์น๋ฅผ ์ดํด๋ณธ๋ค - ๊ฒฐ์ธก์น์์!
์๊ฐ ์นผ๋ผ์ ์ฐ์ง ์๊ณ 1~28, ๊ธ์ก๊น์ง๋ X๋ก, ํ๊ฒ๋ณ์ ํด๋์ค(0,1)์ y๋ก ์ค์ ํ๋ค.
์ฌ๊ธฐ์ธ ๊ฑด์ ์ ์ฒด์ค์ 492๊ฐ๋ก ํ์ ํ ์ ๋ค. ์ด ๋ ํ์ต์ด ๋ ์๋๊ฒ ํ๋ ค๋ฉด ์ด๋ป๊ฒ ํ ๊น
7๋ 3์ผ๋ก ํ์ต๊ณผ ๊ฒ์ฆ์ ์ ๋๋์ด์ฃผ์๋ค. ์ฌ์ดํท๋ฐ์ ๋ก์ง์คํฑํ๊ท๋ฅผ ํธ์ถํ์ฌ ํ์ต ํ ์ ํ๋๋ฅผ ์ธก์ ํ๋ค.
์ค์ฐจํ๋ ฌ์ ์๊ฐํํ๋ค.
์ฑ๊ณผ์ธก์ ์งํ๋ค์ ๊ณ์ฐํ๋ค.
'๋ํ ํ๋ก์ ํธ > kaggle' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[kaggle competition1]Store Sales - Time Series Forecasting Use machine learning to predict grocery sales 1-๋ณ์์ค๋ช (0) | 2022.11.28 |
---|