diff --git a/README.md b/README.md index 462dbe7..78fe245 100644 --- a/README.md +++ b/README.md @@ -1,6 +1,15 @@ # 考研词汇词频排序数据 -经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530个,根据四六级、考研英语、专四专八约200套试卷文本,按照出现的词频进行排序。单词释义来自百度翻译 API。前 2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词的词义经过了人工的粗略校对。其余单词的词义校对工作尚未有计划进行。异形词(即对考纲当中有多种写法的单词)由于数量庞大,尚未有意愿更新。 +经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照出现的词频对词汇表进行排序。 + +排序使用了词形还原策略,所以与实际试卷呈现略有差异。 + +单词释义来自百度翻译 API。 + +前 2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词的词义经过了人工的粗略校对。其余单词的词义校对工作尚未有计划进行。 + +异形词(即对考纲当中有多种写法的单词)由于数量庞大,尚未有意愿更新。 + [vocabulary.json](https://github.com/awxiaoxian2020/NETEMVocabulary/blob/master/vocabulary.json) 中的词义未经人工校对。 本仓库数据基于 [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/) 共享,程序基于 [MIT License](https://github.com/awxiaoxian2020/NETEMVocabulary/blob/master/LICENSE).