본문 바로가기

개발

Accelerate + deepspeed 학습시 deepspeed config 정보 가져오기

 

Accelerate launch로 실행한 학습 코드 상에서 deepspeed의 config 정보들을 활용하고 싶을 때가 있어서 찾아봤다.

 

training_args = TrainingArguments()

# TrainingArguments 객체 생성 과정에서 accelerate_config.yaml, deepspeed_config.json
# 정보들이 training_args에 저장된다.

# accelerate_config.yaml의 deepspeed config 내용: training_args.deepspeed_plugin
# deepspeed config.json 내용: training_args.deepspeed_plugin.hf_ds_config.config