머신러닝 정의와 분류

딥러닝/Today I learned :

머신러닝 정의와 분류

주영 🐱 2021. 6. 4. 15:59

728x90

▷ 머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다.

▷ 어떤 작업 T에 대한 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상됐다면,

이 프로그램은 T와 P에 대해 E로 학습한 것이다.

스팸 필터 - 스팸메일 구분 머신러닝 프로그램

시스템이 학습하는데 사용하는 샘플 = 훈련세트 training set

각 훈련 데이터 = training instance | 샘플

이 경우 작업T = 새 메일이 스팬인지 구분하는 것

경험 E = 훈련데이터

성능 측정P는 직접 정의해야 한다. (ex - 정확히 분류된 메일의 비율) = 정확도 accuracy , 분류 작업에 사용된다.

머신러닝은 다음 분야에 뛰어나다 :

기존 솔루션으로는 많은 수동 조정과 규칙이 필요한 문제 : 하나의 머신러닝 모델이 코드를 간단하게 만들고 전통적인 방법보다 더 잘 수행되도록 할 수 있다.
전통적인 방법으로는 해결 방법이 없는 복잡한 문제 : 가장 뛰어난 머신러닝 기법으로 해결 방법을 찾을 수 있다
유동적인 환경 : 새로운 데이터에 적응할 수 있다
복잡한 문제와 대량의 데이터에서 인사이트 얻기

구체적인 머신러닝 작업의 사례 :

생산 라인에서 제품 이미지를 분석해 자동으로 분류하기 :이미지 분류, CNN 사용
뇌 스캔하여 종양 진단하기 : 시맨틱 분할 작업,CNN으로 이미지의 각 픽셀 분류
뉴스 기사 자동 분류 : 자연어 처리 (NLP), 텍스트 분류 작업. RNN,CNN,트랜스포머로 해결
토론 포럼에서 부정적 코멘트 자동으로 구분 : NLP
긴 문서 자동 요약 : NLP
챗봇 : NLU , NLP 컴포넌트
다양한 성능 지표 기반으로 회사의 내년도 수익 예측하기 : 회귀 모델 사용
음성 명령에 반응하는 앱 : RNN, CNN 트랜스포머
신용카드 부정거래 감지 : 이상치 탐지 작업
구매 이력을 기반으로 고객을 나누고 각 집합에 맞는 마케팅 전략 : 군집 작업
복잡한 데이터셋을 명확한 그래프로 표현하기 : 데이터 시각화 , 차원 축소 기법
과거 구매 이력을 기반으로 고객이 관심을 가질 수 있는 상품 추천 : 과거 구매 이력을 인공 신경망에 주입하고 다음에 구매할 가능성이 가장 높은 상품 출력
지능형 게임 봇bot : 보통 강화학습RL ,ex 알파고

머신러닝 시스템의 종류

학습하는 동안의 감독 형태나 정보량에 따라

지도학습, 비지도학습, 준지도 학습, 강화학습

지도 학습 supervised learning

알고리즘에 주입하는 훈련 데이터에 레이블이라는 원하는 답이 포함된다

- 분류(ex 스팸필터)

- 회귀 (예측변수라 부르는 특성,속성(주행거리, 연식, 브랜드..)들을 이용해 중고차 가격같은 타겟 수치를 예측)

- 일부 회귀 알고리즘은 분류에 사용 혹은 그 반대 (로지스틱 회귀는 분류에 사용 - 클래스에 속할 확률을 출력한다.)

중요한 지도학습 알고리즘 :

k- 최근접 아웃
선형 회귀
로지스틱 회귀
서포트 벡터 머신
결정 크리와 랜덤 포레스트
신경망

비지도 학습 unsupervised learning

알고리즘에 주입하는 훈련 데이터에 레이블이 없음. 알아서 학습

중요한 비지도학습 알고리즘 :

군집
- k- 평균
- DBSCAN
- 계층 군집 분석
- 이상치 탐지, 특이치 탐지
- 원-클래스
시각화와 차원 축소, 특성 추출
- 주성분 분석
- 커널PCA
- 지역적 선형 임베딩
- t-SNE
연관 규칙 학습
- Apriori
- Eclat

준지도 학습 semisupervised learning

일부만 레이블이 있는 데이터를 다루는 알고리즘

지도+비지도 학습

강화 학습 reinforcement learning

매우 다른 종류의 알고리즘

학습하는 시스템 = 에이전트 , 환경을 관찰해 행동을 실행하고 그 결과로 보상 혹은 패널티를 받는다

시간이 지나면서 최상의 전략인 정책을 스스로 학습한다,

정책은 상황 속 에이전트가 어떤 행동을 선택해야할지를 정의한다.

(보행 로봇 만들기 ,알파고)

'딥러닝 > Today I learned :' 카테고리의 다른 글

머신러닝의 주요 도전 과제 (0)	2021.07.24
머신러닝 분류 2 (0)	2021.07.23
[딥러닝] 텐서플로(tensorflow) 설치하기 (0)	2021.04.09
[딥러닝] 딥러닝 구현 위한 가상환경 구축하기 (0)	2021.04.07
[딥러닝] 오토인코더의 구조 (0)	2021.04.06

현재글머신러닝 정의와 분류

TIL

마케팅, 배당투자계산기, 특수문자이모티콘, 오블완, 1인개발, 1인개발자, 오픽, 오픽모의고사, 딥러닝, 오픽기출, 1인개발마케팅, 오픽공부법, 오픽AL, 오픽 AL, 오픽 모의테스트, 오픽1주, 배당투자, 오픽IH, 안드로이드개발, 티스토리챌린지,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TIL