model.train() 과 model.eval()의 스위칭은 필수일까?

자연어 처리/Today I learned :

model.train() 과 model.eval()의 스위칭은 필수일까?

주영 🐱 2023. 1. 20. 21:18

728x90

자연어처리에서 다운스트림 태스크 중 예를 들면 분류하는 문제에서,

모델을 학습시킬 때 train 과 validation 으로 먼저 성능을 채점한 후,레이블이 없는 새로운 인풋으로 test셋을 넣어 예측된 레이블 값을 얻는다. train 과 validation을 하는 과정에서, train을 하기전 model.train() 으로 train상태로 만들어주고, train이 끝나면 model.eval()로 스위칭하여 검증을 하고 다시 train- eval 하는 식으로 에포크 만큼 돌게 된다.

이 때 , train 할 때는 무조건 train mode, validation 할 때는 무조건 validation 모드에 있어야 하기 때문에 스위칭은 필수 이다.

코드에서도 이를 수동으로 명시해야 하는지 궁금했었는데

만약 eval 이 with 문 안에 있으면 검증이 끝나면 자동으로 train 모드로 변환이 되어 model.train() 과 model.eval()을 한번씩만 쓰면 된다. 하지만 그렇지 않을 경우 model.train() 과 model.eval() 이 끝나는 때에 model.train() 을 다시 명시해 주어 훈련모드로 변환을 해주어야 한다.

따라서 스위칭은 필수적이다!

코드 예시

model.train()
for epoch in range(train_epoch):
........

(생략)

optimizer.zero_grad()
            loss = output.loss
            loss.backward()

            optimizer.step()


                    model.eval()

                    for .... in tqdm(......):

                        output = model(....)

                        logits = output.logits
                        loss = output.loss

...

(생략)

model.train()

저작자표시 비영리 변경금지

'자연어 처리 > Today I learned :' 카테고리의 다른 글

코랩 프로, 프로 플러스 써본 후기 (0)	2023.01.21
자연어 처리에서의 하이퍼 파라미터 종류, 설정 (0)	2023.01.20
자연어처리 모델이 태스크를 수행하는 방법은? (인 컨텍스트 러닝, 제로샷, 원샷 퓨샷 러닝) (0)	2023.01.17
언어모델 GPT (1)	2023.01.17
버트를 활용한 영화리뷰 분류 (0)	2023.01.16

현재글model.train() 과 model.eval()의 스위칭은 필수일까?

TIL

오픽IH, 데이터시각화, 티스토리챌린지, 1인개발, 안드로이드앱개발, 오픽AL, 오픽 모의테스트, 오픽 AL, 1인개발자, 배당투자계산기, 오픽기출, 오픽, 오픽모의고사, 오블완, 특수문자이모티콘, 배당투자, 안드로이드개발, 오픽공부법, 딥러닝, 오픽1주,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

TIL