안된다...
생각해보면 안되는 게 당연하 것 같기도...
'개발' 카테고리의 다른 글
Accelerate + deepspeed 학습시 deepspeed config 정보 가져오기 (0) | 2024.09.04 |
---|---|
[Transformers] IterableDatasetShard의 동작 (1) | 2023.12.19 |
RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn (0) | 2023.12.15 |
LLaMA2 LoRA 적용과 tokenizer의 padding_side (1) | 2023.12.15 |
NotImplementedError: Cannot copy out of meta tensor; no data! (0) | 2023.12.15 |