데이터 뢄석/Today I learned :

[λ§ˆμΌ€νŒ…μ„ μœ„ν•œ 데이터뢄석6] 디지털 κ΄‘κ³ μ˜ μ„±κ³Ό μΈ‘μ • μ§€ν‘œ

주영 🐱 2022. 12. 3. 17:48
728x90

디지털 κ΄‘κ³ μ˜ μ„±κ³Ό μΈ‘μ • μ§€ν‘œλŠ” 클릭 μˆ˜κ°€ μ•„λ‹ˆλ‹€!

ν”νžˆ 디지털 κ΄‘κ³ μ˜ μ„±κ³Ό μΈ‘μ • μ§€ν‘œλŠ” μ‹€ν—˜κ³Ό κ΄€μΈ‘, 두 λ²”μ£Όλ‘œ λ‚˜λ‰œλ‹€. 

1. μ‹€ν—˜μ  방법(experimental Methods)

- 잘 κ³„νšλœ μ‹€ν—˜μ„ 톡해 κ΄‘κ³  μ„±λŠ₯을 ν‰κ°€ν•˜λŠ” λ°©λ²•μ΄μž κ΄‘κ³ νš¨κ³Όλ₯Ό ν‰κ°€ν•˜λŠ” κ°€μž₯ 쒋은 방법

κ²€μ • κ°€μ„€(test hypothesis)은 λ¦¬μ„œμΉ˜μ—μ„œ μž…μ¦ν•˜κ³  싢은 것에 μ§‘μ€‘ν•œλ‹€. 귀무가섀을 κΈ°κ°ν•˜κ³ , λŒ€μ•ˆμ„ μˆ˜μš©ν•  수 μžˆλŠ”μ§€ μ—¬λΆ€λ₯Ό κ²€μ •ν•˜λŠ” 것이 λͺ©μ μ΄λ‹€. κ²€μ • 가섀은 κ°•λ ₯ν•œ κ°€μ„€(strong hypothesis)이어야 ν•œλ‹€. κ°•λ ₯ν•œ 가섀은 who(audience), what(behavior of audience), why, where, when을 ν¬ν•¨ν•˜κ³  μžˆλŠ” 가섀이닀. 예λ₯Ό λ“€λ©΄, 35-44μ„Έ λ„€λœλž€λ“œμ˜ λ„μ‹œμ—μ„œ μ‚΄κ³  μžˆλŠ” 여성은 ν¬λ¦¬μŠ€λ§ˆμŠ€μ— νŽ˜μ΄μŠ€λΆμ—μ„œ μ§„ν–‰λ˜λŠ” 우리 μΊ νŽ˜μΈμ— 높은 μ „ν™˜μœ¨μ„ 보일 것이닀, μ™œλƒν•˜λ©΄ 우리 캠페인의 핡심인 꽃 배달이 κ·Έ 그룹에 어필이 될 것이기 λ•Œλ¬Έμ΄λ‹€. 

 

μ‹€ν—˜ 섀계

λ§ν–ˆλ“―μ΄ 잘 μ§œμ—¬μ§„ κ³„νšμ΄ ν•„μš”ν•˜λ‹€.

두 그룹으둜 λ‚˜λˆˆλ‹€. 

treatment group (test group) control group
receive treatment don't receive treatment

κΉ”λ”ν•œ ν†΅μ œκ°€ 어렡기에 ,λ¬΄μž‘μœ„ν™”λ₯Ό μ‚¬μš©ν•œλ‹€. 

Randomized controlled trial(RCT)

-  μœ„μ˜ 두 그룹에 λ¬΄μž‘μœ„λ‘œ ν• λ‹Ήν•˜μ—¬ κ²°κ³Όλ₯Ό 비ꡐ함

Intention-to-treat analysis (ITT)

- biasλ₯Ό ν”Όν•˜κΈ° μœ„ν•΄, μ‹€ν—˜ 초기 μ›λž˜ ν• λ‹Ήν•œ 그룹으둜 진행, 쀑도 νƒˆλ½ν•œ μ‹€ν—˜μžκΉŒμ§€ 포함

 

μ‹€ν—˜μ„ 톡해 가정을 μž…μ¦ν•œλ‹€. 

μ‹€ν—˜ κ²°κ³ΌλŠ” ꡬ체적 κ²°κ³Ό 수치(μœ„μ˜ μ˜ˆμ‹œλ‘œ 보면 캠페인 진행후, 10%κ°€ λŠ˜μ—ˆλ‹€. )와 신뒰ꡬ간(λ‹€μ‹œν–ˆμ„ λ•Œ λ™μΌν•œ κ²°κ³Όλ₯Ό 보일 κ°€λŠ₯μ„±)

즉, 10% lift in results, 90% confidence interval 이런 μ‹μœΌλ‘œ λ‚˜μ˜€κ²Œ λœλ‹€. 

결둠은 가정을 수용, 기각 λ‘˜ 쀑 ν•˜λ‚˜λ‹€. 

 

2. 관츑을 ν†΅ν•œ 방법 (Observational Methods)

- κ΄€μΈ‘λœ 정보듀을 μˆ˜μ§‘ν•˜μ—¬ 인과관계λ₯Ό μΆ”μΈ‘ν•œλ‹€. μ£Όμ œλ‚˜ λ³€μˆ˜ ν†΅μ œ 없이 κ³„νš μ—†λ‹€λŠ” κ²ƒμ—μ„œ μ‹€ν—˜κ³Ό 차이가 μžˆλ‹€. 

 

 

λ°˜μ‘ν˜•