๋ฐ์ดํ„ฐ ๋ถ„์„/Today I learned :

[๋ฐ์ดํ„ฐ ๋ถ„์„] pandas ๊ธฐ์ดˆ 2

์ฃผ์˜ ๐Ÿฑ 2021. 4. 8. 15:37
728x90

code ๊ตญ๊ฐ€์ฝ”๋“œํ‘œ

 

   ๊ตญ์ ์ฝ”๋“œ ๊ตญ์ ๋ช…
0 A01 ์ผ๋ณธ
1 A02 ๋Œ€๋งŒ
2 A03 ํ™์ฝฉ
3 A18 ์ค‘๊ตญ
4 A18 ์ด๋ž€
5 A22 ์šฐ์ฆˆ๋ฒ ํ‚ค์Šคํƒ„
6 A23 ์นด์žํ์Šคํƒ„
7 A99 ์•„์‹œ์•„ ๊ธฐํƒ€

 

 

๋ฐ์ดํ„ฐ ํ†ตํ•ฉ - ์˜†์œผ๋กœ ํ†ตํ•ฉ (merge)

 

๋ฐ์ดํ„ฐ ์˜†์œผ๋กœ ํ†ตํ•ฉํ•˜๊ธฐ(left ์กฐ๊ฑด)

sample_1_code = pd.merge(left=arrived_1, 
                         right=code,
                         how='left',
                         left_on='๊ตญ์ ์ฝ”๋“œ',
                         right_on='๊ตญ์ ์ฝ”๋“œ')

left / right ์™ผ์ชฝ/์˜ค๋ฅธ์ชฝ ํ…Œ์ด๋ธ”

how='left' ์™ผ์ชฝ ํ…Œ์ด๋ธ” ๊ธฐ์ค€์œผ๋กœ ๋‘ ํ…Œ์ด๋ธ” ๊ฒฐํ•ฉ

 how='inner' ๋ฐ์ดํ„ฐ ์˜†์œผ๋กœ ํ†ตํ•ฉํ•˜๊ธฐ(inner ์กฐ๊ฑด)

left_on  right_on ์™ผ์ชฝ/์˜ค๋ฅธ์ชฝ ํ…Œ์ด๋ธ”์˜ ๊ธฐ์ค€์นผ๋Ÿผ์€'๊ตญ๊ฐ€์ฝ”๋“œ'

 

๋งค์นญ๋˜๋Š” ๊ฐ’์ด ์—†๋Š” ๊ฒฝ์šฐ NaN์œผ๋กœ ํ‘œ์‹œ๋จ

 

 

๋ฐ์ดํ„ฐ ํ†ตํ•ฉ - ์•„๋ž˜๋กœ ํ†ตํ•ฉ (append)

 

      ๋‘ ํ…Œ์ด๋ธ”์˜ ์นผ๋Ÿผ ์ˆœ์„œ๊ฐ€ ๋™์ผํ•ด์•ผ ํ•œ๋‹ค.

sample = sample_1_code.append(sample_2_code, ignore_index=True)

sample_1_code์˜ ์นผ๋Ÿผ์„ ๊ธฐ์ค€์œผ๋กœ ๋ฐ์ดํ„ฐํ†ตํ•ฉ 

 

ignore_index=True ์ง€์ •ํ•˜์ง€ ์•Š์œผ๋ฉด ๊ฐ ๋ฐ์ดํ„ฐ์—์„œ์˜ ์ธ๋ฑ์Šค ๊ฐ’์œผ๋กœ ํ•ฉ์ณ์ง

 

 

 

๋ฐ์ดํ„ฐ ์ €์žฅ (to_excel)

 

sample.to_excel('./files/sample.xlsx')
sample.to_excel('./files/sample_index_false.xlsx', index=False)

index๋ฒˆํ˜ธ ๋นผ๊ณ  ์ €์žฅํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด : index=False

 

 

 

 

๋ฐ์ดํ„ฐ ์ง‘๊ณ„(pivot_table)

 

"00๋ณ„๋กœ ๋ฐ์ดํ„ฐ ์ง‘๊ณ„ํ•  ๋•Œ"

์—‘์…€์—์„œ์˜ ํ”ผ๋ฒ— ํ…Œ์ด๋ธ”

 

sample_pivot = sample.pivot_table(values='์ž…๊ตญ๊ฐ์ˆ˜',
                                  index='๊ตญ์ ๋ช…',
                                  columns='๊ธฐ์ค€๋…„์›”',
                                  aggfunc='mean' )

sample.pivot_table() :  sample๋ฐ์ดํ„ฐ๋ฅผ ํ”ผ๋ฒ—ํ™”ํ•œ๋‹ค

values='์ž…๊ตญ๊ฐ์ˆ˜' : ๊ฐ’

index='๊ตญ์ ๋ช…' : ํ–‰

columns='๊ธฐ์ค€๋…„์›”' " ์—ด

aggfunc='mean' :  values๋ฅผ index์™€ columns๊ธฐ์ค€์œผ๋กœ ํ‰๊ท ์„ ๊ณ„์‚ฐ

 

index colums์€ ํ•„์ˆ˜๊ฐ’์€ ์•„๋‹˜

 

 

๋ฐ˜์‘ํ˜•