NLP에서 다루는 Dataset들을 다루는 곳입니다. Benchmark와 Training으로 나누어져 있으며,
Benchmark는 SQuAD, WNLIdataset과 같이 Benchmark dataset에 대해 다루고,
Training은 Pile, C4 dataset과 같이 Pre-trining corpus에 대해 다룹니다.
Dataset
Folders and files
Name | Name | Last commit date | ||
---|---|---|---|---|
parent directory.. | ||||