UX/Today I learned :

[데이터 μ‹œκ°ν™”] μ‹œκ°ν™”λ₯Ό μœ„ν•΄ ν•„μš”ν•œ 데이터

주영 🐱 2021. 3. 29. 14:23
728x90

데이터 μ‹œκ°ν™”μ— μ ν•©ν•œ λ°μ΄ν„°λŠ”?

 

둜우 데이터 (Row data)

 


 

<ν†΅κ³„ν‘œμ™€ λ‘œμš°λ°μ΄ν„°μ˜ 차이>

 

좜처: 톡계청, μ„±/연령별 μ·¨μ—…μž

ν†΅κ³„ν‘œμ—μ„œ ν•˜λ‚˜μ˜ 셀은 μ—¬λŸ¬ 데이터λ₯Ό ν¬ν•¨ν•œλ‹€. (λΉ¨κ°„ 셀은 λ‚¨μž,2018λ…„11μ›”,50-59μ„Έ 3가지 정보λ₯Ό 포함)

λ‘œμš°λ°μ΄ν„°λ‘œ ν†΅κ³„ν‘œ λ§Œλ“€κΈ° = 데이터 μ‹œκ°ν™” κ³Όμ •

ν†΅κ³„ν‘œ - 데이터 μ‹œκ°ν™” 차트 μœ ν˜• 쀑 ν•˜λ‚˜

 

λ‘œμš°λ°μ΄ν„°λŠ” ν•˜λ‚˜μ˜ 셀은 ν•΄λ‹Ή 셀이 ν¬ν•¨λœ μ—΄μ˜ μ •λ³΄λ§Œ 포함

각 μ—΄μ˜ μ…€μ˜ 값은 펏번째 ν–‰(header)의 μ •λ³΄λ§Œ λ‹΄κ³  있음

μ‹œκ°ν™” κ³Όμ •μ—μ„œ νŠΉμ • λ³€μˆ˜(λ‘œμš°λ°μ΄ν„°μ˜ μ—΄)만 μ„ νƒν•œλ‹€.

 

데이터 μ‹œκ°ν™” 차트 = 둜우 λ°μ΄ν„°μ˜ λ³€μˆ˜λ₯Ό νŠΉμ • κΈ°μ€€μœΌλ‘œ 데이터 μ‘°ν•©, κ³„μ‚°ν•œ κ²°κ³Όλ₯Ό μ‹œκ°ν™” μš”μ†Œλ₯Ό ν™œμš©ν•˜μ—¬ ν‘œν˜„ν•œ 것

 

 

 

λ‘œμš°λ°μ΄ν„°μ˜ λ³€μˆ˜

  • μˆ˜μΉ˜ν˜• λ³€μˆ˜ = 계산 κ°€λŠ₯ν•œ 숫자 ν˜•νƒœμ˜ κ°’
  • λ²”μ£Όν˜• λ³€μˆ˜ = κ°œλ³„ ν•­λͺ©(category)둜 λΆ„λ₯˜λ˜λŠ” κ°’
    • 4가지 μœ ν˜• (숫자,λ‚ μ§œ,지역,ν…μŠ€νŠΈ)
    • 비ꡐ 집단을 λ§Œλ“œλŠ” κΈ°μ€€

ex) age λŠ” μˆ˜μžμ§€λ§Œ μˆ˜ν•™μ  계산이 λ¬΄μ˜λ―Έν•˜λŠλͺ¨ λ²”μ£Όν˜• λ³€μˆ˜λ‘œ ν™œμš©ν•˜λŠ” 것이 일반적

 


일반적으둜 λ‘œμš°λ°μ΄ν„°κ°€ μ•„λ‹Œ ν†΅κ³„ν‘œλ₯Ό μ œκ³΅ν•˜κΈ° λ•Œλ¬Έλ° λ‘œμš°λ°μ΄ν„°λ‘œ 데이터λ₯Ό 직접 μ •μ œ

 

톡계청, ν”Όλ²— μ˜΅μ…˜

ν”Όλ²— μ˜΅μ…˜ μˆ˜μ •ν•œ λ’€ μ…€ 병합 ν•˜μ§€ μ•Šκ³  λ‹€μš΄λ‘œλ“œ

 

 

λ³„λ„μ˜ SWν™œμš©:

μ—‘μ…€, μ˜€ν”ˆ 리파인

http://openrefine.org/

 

OpenRefine

Welcome! OpenRefine (previously Google Refine) is a powerful tool for working with messy data: cleaning it; transforming it from one format into another; and extending it with web services and external data. OpenRefine always keeps your data private on you

openrefine.org

 


λ‹€μ–‘ν•œ μ‹œκ°ν™” μœ ν˜•

 

λ§‰λŒ€ 차트

μž₯점 : λ°μ΄ν„°μ˜ 크기 직관적 확인 κ°€λŠ₯

 

 

파이 차트 , 트리맡

 

파이 차트 - 원을 νšŒμ‚¬ μ „μ²΄μ˜ 맀좜,각 비쀑 ν‘œν˜„

각 ν•­λͺ© λΉ λ₯΄κ²Œ 확인 κ°€λŠ₯

 

트리맡 - 파이의 μ‚¬κ°ν˜• 버전, λ°μ΄ν„°μ˜ 크기에 따라 쑰각의 크기 , μƒ‰μ˜ μ§„ν•˜κΈ° 달라짐

 

 

μ ν•©ν•œ μ‹œκ°ν™” μœ ν˜•μ„ μ„ νƒν•˜λŠ” 것이 μ€‘μš”ν•˜λ‹€.

 

 

 

μ‹œκ°ν™” 차트 μœ ν˜•μ„ μ„ νƒν•˜λŠ” 기쀀은 κ·Έ λͺ©μ μ— 따라 크게 5κ°€μ§€λ‘œ ꡬ뢄할 수 μžˆλ‹€.

비ꡐ

κ°€μž₯ 기본적인 λͺ©μ , 거의 λͺ¨λ“  μ‹œκ°ν™” 차트 μœ ν˜•

 

좔이

μ‹œκ°„μ˜νλ¦„μ— λ”°λ₯Έ λ°μ΄ν„°μ˜ λ³€ν™”

νƒ€μž„λΌμΈ 차트, 사건별 κΈ°κ°„μ˜ 길이

비쀑

전체 데이터쀑 항볡이 μ°¨μ§€ν•˜λŠ” 비쀑

100% λˆ„μ  λ§‰λŒ€μ°¨νŠΈ

 

관계

보톡 2개 μ΄μƒμ˜ 데이터 μ§€ν‘œλ₯Ό ν•˜λ‚˜μ˜ μ‹œκ°ν™”λ‘œ ν‘œν˜„ν•˜μ—¬ λ°μ΄ν„°κ°„μ˜ 관계 νŒŒμ•…

λ„€νŠΈμ›Œν¬ μ‹œκ°ν™”

 

지도

데이터가 μœ„μΉ˜ 정보λ₯Ό 포함할 경우

λ°˜μ‘ν˜•