pandas
ํ ์ด๋ธ ํํ์ ๋ฐ์ดํฐ๋ฅผ ์ฝ๊ฒ ๋ค๋ฃฐ ์ ์๋ ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
pandas ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ถ๋ฌ์ค๊ธฐ
import pandas as pd
pd.ํจ์๋ช ()
row1 = ์ ๋ชฉ --๋ฐ์ดํฐ ๋ถ์์๋ ๋ถํ์
row2 = 4๊ฐ์ ์นผ๋ผ๋ช
row3~8 = ๋ถ์ํ ๋ฐ์ดํฐ -- ๋ฐ์ดํฐ ๋ถ์์ ํ์
row 9~10 = ์์ฝ ์ ๋ณด -- ๋ฐ์ดํฐ ๋ถ์์ ๋ถํ์
arrived_1= pd.read_excel('./Downloads/20-11arrived.xlsx',header=1, skipfooter =2,usecols = 'A:C')
arrived_1.head(3)
pd.read_excel() -์์ ํ์ผ ๋ถ๋ฌ์ค๋ ํจ์ ์์ Path๋ฃ์
header =1 - ์นผ๋ผ๋ช ์๋ ์์น. 0๋ถํฐ ์์์ด๋ฏ๋ก row2 = 1
skipfooter =2 - ๋ง์ง๋ง row์์ ๋ ์ค์ ์๋ต
usecols ='A:C' A๋ถํฐ C์นผ๋ผ๊น์ง ๋ถ๋ฌ์จ๋ค
.head(3) - ์ฒ์๋ถํฐ 3๋ฒ์งธrow๊น์ง ๋ณด์ฌ์ค๋ค,
.tail(3)
arrived_1.info() ๋ฐ์ดํฐ ์์ฝ ์ ๋ณด ํ์ธ
<class 'pandas.core.frame.DataFrame'> RangeIndex: 6 entries, 0 to 5 0~5๊น์ง ์ด 6 rows ๋ก ๊ตฌ์ฑ Data columns (total 3 columns): ์ด 3๊ฐ์ ์นผ๋ผ
0 ๊ตญ์ ์ฝ๋ 6 non-null object ๊ตญ์ ์ฝ๋ ์นผ๋ผ์ ๋น์นธ ์์ด(non-null) 6๊ฐ์ row๋ก ๊ตฌ์ฑ๋ object(๋ฌธ์ ์์ฑ)๋ณ์๋ค
dtypes: int64(1), object(2)
memory usage: 272.0+ bytes |
๊ธฐ์ดํต๊ณ๋ ํ์ธ
arrived_1.describe()
์ซ์ํ ๋ณ์์ ๋ํ ์ฌ๋ฌ๊ฐ์ง ํต๊ณ๋์ ์ถ๋ ฅํ๋ ํจ์(์ฌ๊ธฐ์๋ ์ ๊ตญ๊ฐ์๊ฐ ์ซ์ํ๋ณ์)
์์๋๋ก ๊ฐ์,ํ๊ท ,ํ์คํธ์ฐจ,์ต์๊ฐ,1๋ถ์์,2๋ถ์์(์ค์์),3๋ถ์์,์ต๋๊ฐ
๋ฐ์ดํฐ ์ ํ - ์นผ๋ผ ๊ธฐ์ค
arrived_1['์ ๊ตญ๊ฐ์']
์ฌ๋ฌ ์นผ๋ผ์ ์ ํํ๋ ค๋ฉด ๋ฆฌ์คํธ๋ก ๋ฌถ์ด์ฃผ์ด์ผ ํ๋ค
arrived_1[['๊ตญ์ ์ฝ๋','์
๊ตญ๊ฐ์']]
์นผ๋ผ ์์ฑ
๊ธฐ์กด ๋ฐ์ดํฐ์ ์กด์ฌํ์ง ์๋ ๊ธฐ์ค๋ ์์ด๋ผ๋ ์นผ๋ผ์ '2020-11'์ ๋ถ์ฌํ ๊ฒฐ๊ณผ,๊ธฐ์ค๋ ์์ด๋ผ๋ ์ ๊ท ์นผ๋ผ์ด ์์ฑ๋จ
arrived_1['๊ธฐ์ค๋
์']= '2020-11'
arrived_1
๋ฐ์ดํฐ ์ ํ - ๋ก์ฐ ๊ธฐ์ค : ํน์ ์กฐ๊ฑด์ ๋ง๋ ๋ฐ์ดํฐ ํํฐ๋ง ํ ๋
์ฑ๋ณ์ด ๋จ์ฑ์ธ ๊ฒฝ์ฐ๋ง ์ฐพ๊ธฐ
condition = (arrived_1['์ฑ๋ณ'] == '๋จ์ฑ')
condition
arrived_1[condition]
์ฑ๋ณ์ด ๋จ์ฑ ์ด๋ฉด์ ์ ๊ตญ๊ฐ์๊ฐ 150,000๋ช ์ด์
&์ผ๋ก ์ฐ๊ฒฐ
condition = (arrived_1['์ฑ๋ณ']== '๋จ์ฑ') & (arrived_1['์
๊ตญ๊ฐ์']>=150000)
arrived_1[condition]
AND &
OR |
condition = (arrived_1['๊ตญ์ ์ฝ๋'].isin(['A01','A08']))
arrived_1[condition==False]
.isin() ์์ ์ฐพ๊ณ ์ถ์ ๊ฐ์ ๋ฆฌ์คํธ ํํ๋ก ๋ฃ์ผ๋ฉด True False ๋ฐํ
condition == False ๋ก ์ค์ ํ๋ฉด ํด๋นํ์ง ์๋ ๊ฒฝ์ฐ๋ง ๋ณผ ์ ์์
'๋ฐ์ดํฐ ๋ถ์' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋งฅ๋ถ์์ ์๋์ฝ๋ค ์ฃผํผํฐ ๋ ธํธ๋ถ ์ธํ ํ๊ธฐ for import xgboost (0) | 2022.08.30 |
---|