数据来源于中国软件杯,数据量较少。共包含14534条数据,9分类包括包括:财经 、房产 、教育、科技、军事、汽车、体育、游戏和娱乐。使用jieba库进行分词,限制输入特征为600。本项目没有针对模型详细调整参数,只设置了学习率衰减并训练200个epoch,使用Pytorch框架在测试集上可以达到0.86的准确率,而使用Tensorflow框架在测试集上可以达到0.92的准确率,测试集上损失函数均收敛至0.04。
-
Notifications
You must be signed in to change notification settings - Fork 0
基于LSTM的文本分类系统设计
License
hhhhpaaa/Text_classification
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
基于LSTM的文本分类系统设计
Topics
Resources
License
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published