Topic. adapter_model.bin 파일이 1kb 로 깨져서 생성되는 문제를 해결합니다.
열심히 하이퍼파라미터를 조정하며 인내의 시간을 기다려 fine-tuning이 완료되었을 때
생성된 adapter model이 1kb (443byte) 인 누가봐도 이상한 현상
가중치가 사라졌다...
열심히 디버그를 돌리다가 save_checkpoint 나 save_model 시 아래 구문이 실행되며
가중치를 모두 초기화 하여 저장하는 현상이 있다는 것을 알았습니다.
old_state_dict = model.state_dict
model.state_dict = (
lambda self, *_, **__: get_peft_model_state_dict(self, old_state_dict())
).__get__(model, type(model))
소스에서 위 문구가 발견된다면 지워버립시다.
LLM Fine-tuning 소스가 올라온지 얼마 안됐을 때 peft에서 처리하지 못한 부분을 위와같이 처리하였다가
이제 peft 모델이 업데이트 되며 저 구문이 문제를 일으킨거같긴 한데...
정확한 이유를 아시는 분있으면 공유 부탁드립니다.
'A.I.(인공지능) & M.L.(머신러닝) > Development Environments' 카테고리의 다른 글
[실습] vast.ai 인스턴스간 파일 전송 (0) | 2024.04.12 |
---|---|
[문제해결] 머신러닝, 딥러닝 GPU 사용률이 올라가지 않는현상 (0) | 2024.03.08 |
[실습] WSL 환경 CUDA 설치 (0) | 2024.03.07 |
[실습] Model Fine-tuning 환경설정시 시행착오(Linux Ubuntu) (1) | 2024.01.11 |
[실습] A.I. Pre-trained Model Fine-tuning 을 위한 환경설정(Linux Ubuntu) (0) | 2024.01.05 |