code ๊ตญ๊ฐ์ฝ๋ํ
๊ตญ์ ์ฝ๋ | ๊ตญ์ ๋ช | |
0 | A01 | ์ผ๋ณธ |
1 | A02 | ๋๋ง |
2 | A03 | ํ์ฝฉ |
3 | A18 | ์ค๊ตญ |
4 | A18 | ์ด๋ |
5 | A22 | ์ฐ์ฆ๋ฒ ํค์คํ |
6 | A23 | ์นด์ํ์คํ |
7 | A99 | ์์์ ๊ธฐํ |
๋ฐ์ดํฐ ํตํฉ - ์์ผ๋ก ํตํฉ (merge)
๋ฐ์ดํฐ ์์ผ๋ก ํตํฉํ๊ธฐ(left ์กฐ๊ฑด)
sample_1_code = pd.merge(left=arrived_1,
right=code,
how='left',
left_on='๊ตญ์ ์ฝ๋',
right_on='๊ตญ์ ์ฝ๋')
left / right ์ผ์ชฝ/์ค๋ฅธ์ชฝ ํ ์ด๋ธ
how='left' ์ผ์ชฝ ํ ์ด๋ธ ๊ธฐ์ค์ผ๋ก ๋ ํ ์ด๋ธ ๊ฒฐํฉ
how='inner' ๋ฐ์ดํฐ ์์ผ๋ก ํตํฉํ๊ธฐ(inner ์กฐ๊ฑด)
left_on right_on ์ผ์ชฝ/์ค๋ฅธ์ชฝ ํ ์ด๋ธ์ ๊ธฐ์ค์นผ๋ผ์'๊ตญ๊ฐ์ฝ๋'
๋งค์นญ๋๋ ๊ฐ์ด ์๋ ๊ฒฝ์ฐ NaN์ผ๋ก ํ์๋จ
๋ฐ์ดํฐ ํตํฉ - ์๋๋ก ํตํฉ (append)
๋ ํ ์ด๋ธ์ ์นผ๋ผ ์์๊ฐ ๋์ผํด์ผ ํ๋ค.
sample = sample_1_code.append(sample_2_code, ignore_index=True)
sample_1_code์ ์นผ๋ผ์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐํตํฉ
ignore_index=True ์ง์ ํ์ง ์์ผ๋ฉด ๊ฐ ๋ฐ์ดํฐ์์์ ์ธ๋ฑ์ค ๊ฐ์ผ๋ก ํฉ์ณ์ง
๋ฐ์ดํฐ ์ ์ฅ (to_excel)
sample.to_excel('./files/sample.xlsx')
sample.to_excel('./files/sample_index_false.xlsx', index=False)
index๋ฒํธ ๋นผ๊ณ ์ ์ฅํ๊ณ ์ถ๋ค๋ฉด : index=False
๋ฐ์ดํฐ ์ง๊ณ(pivot_table)
"00๋ณ๋ก ๋ฐ์ดํฐ ์ง๊ณํ ๋"
์์ ์์์ ํผ๋ฒ ํ ์ด๋ธ
sample_pivot = sample.pivot_table(values='์
๊ตญ๊ฐ์',
index='๊ตญ์ ๋ช
',
columns='๊ธฐ์ค๋
์',
aggfunc='mean' )
sample.pivot_table() : sample๋ฐ์ดํฐ๋ฅผ ํผ๋ฒํํ๋ค
values='์ ๊ตญ๊ฐ์' : ๊ฐ
index='๊ตญ์ ๋ช ' : ํ
columns='๊ธฐ์ค๋ ์' " ์ด
aggfunc='mean' : values๋ฅผ index์ columns๊ธฐ์ค์ผ๋ก ํ๊ท ์ ๊ณ์ฐ
index colums์ ํ์๊ฐ์ ์๋
'๋ฐ์ดํฐ ๋ถ์ > Today I learned :' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ง์ผํ ์ ์ํ ๋ฐ์ดํฐ๋ถ์2] ํด๋ฌ์คํฐ๋ง์ ํ์ฉํ ์ธ๋ถํ (0) | 2022.12.02 |
---|---|
[๋ง์ผํ ์ ์ํ ๋ฐ์ดํฐ๋ถ์1] ๋ง์ผํ ์์์ ์ธ๋ถํ (1) | 2022.11.30 |
Pandas ํ๋ค์ค ๊ธฐ์ด - ํ ๋จ์ ๋ฐ์ดํฐ ์ถ์ถ (0) | 2021.09.22 |
Numpy ๊ธฐ์ด (0) | 2021.09.18 |
[๋ฐ์ดํฐ ๋ถ์] ํ์ ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (0) | 2021.03.12 |