๋ฐ์ดํ„ฐ ๋ถ„์„/Today I learned :

Pandas ํŒ๋‹ค์Šค ๊ธฐ์ดˆ - ํ–‰ ๋‹จ์œ„ ๋ฐ์ดํ„ฐ ์ถ”์ถœ

์ฃผ์˜ ๐Ÿฑ 2021. 9. 22. 14:55
728x90

ํ–‰ ๋‹จ์œ„ ๋ฐ์ดํ„ฐ ์ถ”์ถœํ•˜๊ธฐ

 

loc  ์ธ๋ฑ์Šค ๊ธฐ์ค€์œผ๋กœ ํ–‰ ๋ฐ์ดํ„ฐ ์ถ”์ถœ

iloc ํ–‰ ๋ฒˆํ˜ธ ๊ธฐ์ค€์œผ๋กœ ํ–‰ ๋ฐ์ดํ„ฐ ์ถ”์ถœ

 

 

loc[์ธ๋ฑ์Šค๋ฒˆํ˜ธ] : -1๊ฐ™์€ ๊ฐ’ ๋„ฃ์œผ๋ฉด ์˜ค๋ฅ˜

print(df.loc[0])

print(df.loc[[0,99,999]]) ํ•œ๋ฒˆ์— ์—ฌ๋Ÿฌ ํ–‰ ์ถ”์ถœ

๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์˜ ๋งˆ์ง€๋ง‰ ํ–‰ ์ถ”์ถœํ•˜๊ธฐ

 

๋งˆ์ง€๋ง‰ ํ–‰ ๋ฐ์ดํ„ฐ์˜ ์ธ๋ฑ์Šค๋ฅผ ์•Œ์•„์•ผ ํ•œ๋‹ค. 

 

1. shape[0]์— ํ–‰ ํฌ๊ธฐ (1704)๊ฐ€ ์ €์žฅ๋˜์–ด์žˆ์Œ.

number_of_rows=df.shape[0]
last_row_index= number_of_rows -1
print(df.loc[last_row_index])

์‹คํ–‰ ๊ฒฐ๊ณผ

country Zimbabwe

continent Africa

year 2007

lifeExp 43.487

pop 12311143

gdpPercap 469.709298

Name: 1703, dtype: object

 

or

2. tail ๋ฉ”์„œ๋“œ์˜ ์ธ์ž n์— 1์„ ์ „๋‹ฌ

print(df.tail(n=1))

์‹คํ–‰ ๊ฒฐ๊ณผ

 

 

 

 

tail ๋ฉ”์„œ๋“œ๋Š” ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ์ž๋ฃŒํ˜•์„ ๋ฐ˜ํ™˜ํ•˜๊ณ ,  loc๋Š” ์‹œ๋ฆฌ์ฆˆ ์ž๋ฃŒํ˜•์„ ๋ฐ˜ํ™˜

 

 

 

iloc ์†์„ฑ์œผ๋กœ ํ–‰ ๋ฐ์ดํ„ฐ ์ถ”์ถœํ•˜๊ธฐ

์Œ์ˆ˜๋กœ๋„ ๊ฐ€๋Šฅ(-1 = ๋งˆ์ง€๋ง‰ ํ–‰ ๋ฐ์ดํ„ฐ ์ถ”์ถœ), ํ•˜์ง€๋งŒ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์— ์กด์žฌํ•˜์ง€ ์•Š๋Š” ํ–‰ ๋ฒˆํ˜ธ - ์˜ค๋ฅ˜๋ฐœ์ƒ

print(df.iloc[1])

print(df.iloc[[0,99,999]]) ํ•œ๋ฒˆ์— ์—ฌ๋Ÿฌ ํ–‰ ์ถ”์ถœ

 

 


์ถ”์ถœํ•  ๋ฐ์ดํ„ฐ์˜ ํ–‰๊ณผ ์—ด์„ ์ง€์ •ํ•˜์—ฌ ์ถ”์ถœ

df.loc[[[ํ–‰],[์—ด]]        df.iloc[[[ํ–‰],[์—ด]]

 

1. ์Šฌ๋ผ์ด์‹ฑ์œผ๋กœ ํ–‰๊ณผ ์—ด ์ง€์ •

 - ๋ชจ๋“  ํ–‰์˜ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด year, pop์—ด ์ถ”์ถœํ•˜๋Š” ๋ฒ•

-- iloc์†์„ฑ์˜ ์—ด ์ž๋ฆฌ์—๋Š” ์ •์ˆ˜ ๋ฆฌ์ŠคํŠธ๋ฅผ ๋„ฃ์–ด์•ผ ํ•จ

subset = df.loc[:,['year','pop']]
print(subset.head())

2. range ๋ฉ”์„œ๋“œ

-- list(range(3)) , [:3]์˜ ๊ฒฐ๊ด๊ฐ’์€ ๋™์ผํ•˜๋‹ค.

subset = df.iloc[:,0:6:2]์™€ ๊ฐ™์Œ

small_range = list(range(0,6,2))
subset = df.iloc[:,small_range]
print(subset.head())

 

 

 

 

 

 

 

๋ฐ˜์‘ํ˜•