Topic. Trainer 의 TrainingArguments 주요 파라미터를 설명합니다. * TrainingArguments parameter type / optional / default explain cutoff_len 모델에 들어갈 시퀀스의 최대 길이를 설정합니다. Optimizer AdamW 를 주로 사용 lr_scheduler 훈련중 learning rate를 조절해주는 옵션입니다. constant(고정), linear(선형), cosine(코사인형) per_device_train_batch_size int 선택 사항 8 훈련을 위한 GPU/TPU 코어/CPU당 배치 크기입니다. per_device_eval_batch_size int 선택 사항 8 평가를 위한 GPU/TPU 코어/CPU당 배치..
2023. 12. 18. 11:41 / Tech엠지대표