데이터 뢄석/Today I learned :

[λ§ˆμΌ€νŒ…μ„ μœ„ν•œ 데이터뢄석5] μ„ ν˜•νšŒκ·€ 예츑

주영 🐱 2022. 12. 3. 17:14
728x90
λ°˜μ‘ν˜•

y=bx+a의 직선을 νšŒκ·€μ‹μœΌλ‘œ ν•˜λŠ” λͺ¨λΈμ΄λ‹€. (y: μ’…μ†λ³€μˆ˜, dependent variable, x:λ…λ¦½λ³€μˆ˜, independent variable, b:νšŒκ·€μ„  기울기, a:μ§μ„ μ˜ y절편)

데이터가 정말 좔세선이 λ§žλŠ”μ§€μ— λŒ€ν•΄ λͺ¨λΈ 검증

- R^2(R-squared) 계산(0~1μ‚¬μ΄μ˜ κ°’μœΌλ‘œ 클수둝 적합도가 λ†’λ‹€λŠ” 의미)

- P-Value 계산- 귀무가섀이 참일 경우, 데이터가 λ°œμƒν–ˆμ„ κ°€λŠ₯μ„±(κ·€λ¬΄κ°€μ„€μ˜ λ°œμƒκ°€λŠ₯성이지 μ›λž˜ 가섀이 참이냐λ₯Ό λ”°μ§€λŠ” 것은 μ•„λ‹˜. μ—‘μ…€μ—μ„œ ToolPak으둜 κ²Œμ‚°μ΄ κ°€λŠ₯, 0.05보닀 μž‘μœΌλ©΄ λ°μ΄ν„°λŠ” ν†΅κ³„μ μœΌλ‘œ μœ μ˜ν•˜λ‹€κ³  간주됨)

y=bx+a 계산(n = 데이터 수)

 

λ°˜μ‘ν˜•