distributed-train

distributed-train은 분산 처리 기술을 활용하여 모델 학습의 효율성을 극대화하는 방법을 실습하는 과정입니다.

1. 데이터 분산 처리 (DP & DDP)

2. 모델 분산 처리 (PP, TP, MP)

3. Mixed Precision Training

4. Deepspeed (ZeRO)

말평 실습 with deepspeed

teddysum에서 주최하는 일상 대화 요약의 베이스라인 모델인 llama-3-Korean-Bllossom-8B에 Deepspeed를 적용하여 모델을 fine-tuning 합니다.
bash scripts/finetune.sh명령어를 통해 Deepspeed를 활용한 분산 학습을 실습합니다.
이 단계를 통해 Deepspeed의 ZeRO 최적화 기법을 활용한 대규모 모델 학습의 성능 향상을 직접 경험할 수 있습니다.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
src		src
train-bllossom-with-deepspeed		train-bllossom-with-deepspeed
.gitignore		.gitignore
1_dp_tutorial.py		1_dp_tutorial.py
2_ddp_tutorial.py		2_ddp_tutorial.py
3_mixed_precision_tutorial.py		3_mixed_precision_tutorial.py
4_mp_with_accelerate_tutorial.ipynb		4_mp_with_accelerate_tutorial.ipynb
5_zero_dp_tutorial.py		5_zero_dp_tutorial.py
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

distributed-train

1. 데이터 분산 처리 (DP & DDP)

관련 블로그: DataParallel(DP) vs DistributedDataParallel(DDP)

2. 모델 분산 처리 (PP, TP, MP)

관련 블로그: Pipeline Parallelism(PP)와 Tensor Parallelism(TP)

3. Mixed Precision Training

관련 블로그: Mixed Precision Training

4. Deepspeed (ZeRO)

관련 블로그: ZeRO-DP

말평 실습 with deepspeed

About

Releases

Packages

Languages

yjoonjang/distributed-train

Folders and files

Latest commit

History

Repository files navigation

distributed-train

1. 데이터 분산 처리 (DP & DDP)

관련 블로그: DataParallel(DP) vs DistributedDataParallel(DDP)

2. 모델 분산 처리 (PP, TP, MP)

관련 블로그: Pipeline Parallelism(PP)와 Tensor Parallelism(TP)

3. Mixed Precision Training

관련 블로그: Mixed Precision Training

4. Deepspeed (ZeRO)

관련 블로그: ZeRO-DP

말평 실습 with deepspeed

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages