Word2Vector 模型 下面提供一些训练好的 Word2Vector 模型,供大家使用。 201710 使用 2017 年 10 月的 Wiki 中文语料训练,使用 Skip-Gram 模型训练,单词维数 300,训练窗口 10。 【模型】Google_word2vec_zhwiki1710_300d.bin 【语料】zhwiki_1710_preprocessed.simplied.zip 注:语料已经使用 AHANLP 做过分词处理(未去停用词)。 201709 使用 2017 年 9 月的 Wiki 中文语料训练,使用 Skip-Gram 模型训练,单词维数 300,训练窗口 5。 【模型】Google_word2vec_zhwiki1709_300d.bin 【语料】zhwiki_1709_preprocessed.simplied.zip 注:语料已经使用 AHANLP 做过分词和去停用词处理。 旧版 单词维数 200。 【模型】wiki_chinese_word2vec(Google).model 【语料】wiki_chinese_preprocessed.simplied.txt.tar.gz 注:语料已做过预处理。