๋ฐ˜์‘ํ˜•

๋ฐ์ดํ„ฐ ๋ถ„์„/Today I learned : 14

Pandas ํŒ๋‹ค์Šค ๊ธฐ์ดˆ - ํ–‰ ๋‹จ์œ„ ๋ฐ์ดํ„ฐ ์ถ”์ถœ

ํ–‰ ๋‹จ์œ„ ๋ฐ์ดํ„ฐ ์ถ”์ถœํ•˜๊ธฐ loc ์ธ๋ฑ์Šค ๊ธฐ์ค€์œผ๋กœ ํ–‰ ๋ฐ์ดํ„ฐ ์ถ”์ถœ iloc ํ–‰ ๋ฒˆํ˜ธ ๊ธฐ์ค€์œผ๋กœ ํ–‰ ๋ฐ์ดํ„ฐ ์ถ”์ถœ loc[์ธ๋ฑ์Šค๋ฒˆํ˜ธ] : -1๊ฐ™์€ ๊ฐ’ ๋„ฃ์œผ๋ฉด ์˜ค๋ฅ˜ print(df.loc[0]) print(df.loc[[0,99,999]]) ํ•œ๋ฒˆ์— ์—ฌ๋Ÿฌ ํ–‰ ์ถ”์ถœ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์˜ ๋งˆ์ง€๋ง‰ ํ–‰ ์ถ”์ถœํ•˜๊ธฐ ๋งˆ์ง€๋ง‰ ํ–‰ ๋ฐ์ดํ„ฐ์˜ ์ธ๋ฑ์Šค๋ฅผ ์•Œ์•„์•ผ ํ•œ๋‹ค. 1. shape[0]์— ํ–‰ ํฌ๊ธฐ (1704)๊ฐ€ ์ €์žฅ๋˜์–ด์žˆ์Œ. number_of_rows=df.shape[0] last_row_index= number_of_rows -1 print(df.loc[last_row_index]) ์‹คํ–‰ ๊ฒฐ๊ณผ country Zimbabwe continent Africa year 2007 lifeExp 43.487 pop 12311143 gdpPercap ..

Numpy ๊ธฐ์ดˆ

๊ธฐ๋ณธ์ ์œผ๋กœ ๋ฐฐ์—ด์˜ ๊ตฌ์กฐ, ๋‹ค์ฐจ์› ๋ฐฐ์—ด, ๋ฐฐ์—ด ๊ฐ„ ์—ฐ์‚ฐ, ์ •๋ ฌ ๋“ฑ ๊ฐ€๋Šฅ ๋ฐฐ์—ด ๊ฐ์ฒด ndarray import numpy as np data = np.array([1,2,3,4,5]) print(data) print(type(data)) print(data.dtype) ์‹คํ–‰ ๊ฒฐ๊ณผ [1 2 3 4 5] โ˜†์‰ผํ‘œ ์—†์Œ!!!! int32 ๋ฐฐ์—ด ๊ฐ์ฒด ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ• : array() ๋ฉ”์†Œ๋“œ 2์ฐจ์›(2ํ–‰ 3์—ด) ๋žœ๋ค ์ˆ˜ ์ƒ์„ฑ : random.randn() ๋ฉ”์†Œ๋“œ import numpy as np data = np.random.randn(2,3) print(data) print(data.shape) print(data.dtype) [[1.275644478 -0.0237722 1.0475675] [-0.86039567 1...

[๋ฐ์ดํ„ฐ ๋ถ„์„] pandas ๊ธฐ์ดˆ 2

code ๊ตญ๊ฐ€์ฝ”๋“œํ‘œ ๊ตญ์ ์ฝ”๋“œ ๊ตญ์ ๋ช… 0 A01 ์ผ๋ณธ 1 A02 ๋Œ€๋งŒ 2 A03 ํ™์ฝฉ 3 A18 ์ค‘๊ตญ 4 A18 ์ด๋ž€ 5 A22 ์šฐ์ฆˆ๋ฒ ํ‚ค์Šคํƒ„ 6 A23 ์นด์žํ์Šคํƒ„ 7 A99 ์•„์‹œ์•„ ๊ธฐํƒ€ ๋ฐ์ดํ„ฐ ํ†ตํ•ฉ - ์˜†์œผ๋กœ ํ†ตํ•ฉ (merge) ๋ฐ์ดํ„ฐ ์˜†์œผ๋กœ ํ†ตํ•ฉํ•˜๊ธฐ(left ์กฐ๊ฑด) sample_1_code = pd.merge(left=arrived_1, right=code, how='left', left_on='๊ตญ์ ์ฝ”๋“œ', right_on='๊ตญ์ ์ฝ”๋“œ') left / right ์™ผ์ชฝ/์˜ค๋ฅธ์ชฝ ํ…Œ์ด๋ธ” how='left' ์™ผ์ชฝ ํ…Œ์ด๋ธ” ๊ธฐ์ค€์œผ๋กœ ๋‘ ํ…Œ์ด๋ธ” ๊ฒฐํ•ฉ how='inner' ๋ฐ์ดํ„ฐ ์˜†์œผ๋กœ ํ†ตํ•ฉํ•˜๊ธฐ(inner ์กฐ๊ฑด) left_on right_on ์™ผ์ชฝ/์˜ค๋ฅธ์ชฝ ํ…Œ์ด๋ธ”์˜ ๊ธฐ์ค€์นผ๋Ÿผ์€'๊ตญ๊ฐ€์ฝ”๋“œ' ๋งค์นญ๋˜๋Š” ๊ฐ’์ด ์—†๋Š” ๊ฒฝ์šฐ NaN์œผ๋กœ..

[๋ฐ์ดํ„ฐ ๋ถ„์„] ํ•„์ˆ˜ ํŒŒ์ด์ฌ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ

1. Numpy (๋„˜ํŒŒ์ด) Numpy ๋Š” Numerical Python์˜ ์ค„์ž„๋ง๋กœ, ์ž๋ฃŒ๊ตฌ์กฐ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์‹ ์ˆ  ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋Œ€๋ถ€๋ถ„์˜ ๊ณผํ•™ ๊ฒŒ์‚ฐ ์–ดํ”„๋ฆฌ์ผ€์ด์…˜์—์„œ ํ•„์š”ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ๊ณ ์† ๋ฐฐ์—ด ์ฒ˜๋ฆฌ, ๋ฐ์ดํ„ฐ๋ถ„์„ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์‚ฌ์šฉํ•  ๋ฐ์ดํ„ฐ ์ปจํ…Œ์ด๋„ˆ์˜ ์—ญํ• ์„ ํ•œ๋‹ค. ํŒŒ์ด์ฌ์„ ์œ„ํ•œ ๋งŽ์€ ์‚ฐ์ˆ  ๋„๊ตฌ๋Š” Numpy ๋ฐฐ์—ด์„ ๊ธฐ๋ณธ ์ž๋ฃŒ๊ตฌ์กฐ๋กœ ๊ฐ€์ •ํ•˜๊ณ  ์žˆ๊ฑฐ๋‚˜ Numpy์™€ ์‰ฝ๊ฒŒ ์—ฐ๋™ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•œ๋‹ค. Numpy ๊ฐ€ ์ œ๊ณตํ•˜๋Š” ๊ธฐ๋Šฅ ๋‹ค์ฐจ์› ๊ฐ์ฒด ndarray ๋ฐฐ์—ด์›์†Œ๋ฅผ ๋‹ค๋ฃจ๊ฑฐ๋‚˜ ๋ฐฐ์—ด ๊ฐ„์˜ ์ˆ˜ํ•™ ๊ฒŒ์‚ฐ ์ˆ˜ํ–‰ํ•˜๋Š” ํ•จ์ˆ˜ ๋””์Šคํฌ๋กœ๋ถ€ํ„ฐ ๋ฐฐ์—ด ๊ธฐ๋ฐ˜์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ฝ๊ฑฐ๋‚˜ ์“ธ ์ˆ˜ ์žˆ๋Š” ๋„๊ตฌ ์„ ํ˜•๋Œ€์ˆ˜ ๊ฒŒ์‚ฐ, ํ‘ธ๋ฆฌ์— ๋ณ€ํ™˜, ๋‚œ์ˆ˜ ์ƒ์„ฑ๊ธฐ ํŒŒ์ด์ฌ ํ™•์žฅ๊ณผ C. C++์—์„œ Numpy ์˜ ์ž๋ฃŒ๊ตฌ์กฐ์— ์ ‘๊ทผํ•˜๊ณ  ๊ฒŒ์‚ฐ๊ธฐ๋Šฅ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ด์ฃผ..

๋ฐ˜์‘ํ˜•