diff --git a/dataset/README.md b/dataset/README.md
index 22970d4b..2a2d4a23 100644
--- a/dataset/README.md
+++ b/dataset/README.md
@@ -9,6 +9,6 @@ This will point to the training data we use for training various models.
 | [public-data](https://huggingface.co/datasets/cfli/bge-e5data) | Public data identical to [e5-mistral](https://huggingface.co/intfloat/e5-mistral-7b-instruct) |
 | [full-data](https://huggingface.co/datasets/cfli/bge-full-data) | The full dataset we used for training [bge-en-icl](https://huggingface.co/BAAI/bge-en-icl) |
 | [bge-multilingual-gemma2-data](https://huggingface.co/datasets/hanhainebula/bge-multilingual-gemma2-data) | The full multilingual dataset we used for training [bge-multilingual-gemma2](https://huggingface.co/BAAI/bge-multilingual-gemma2) |
-| [reranker-data](Shitao/bge-reranker-data)                    | a mixture of multilingual datasets                           |
+| [reranker-data](https://huggingface.co/datasets/Shitao/bge-reranker-data)                    | a mixture of multilingual datasets                           |