评测数据集包含的中文糖尿病问题一共分为6类,包括诊断、治疗、常识、健康生活方式、流行病学、其他。数据以 6:1:1 的比例划分为训练集、验证集和测试集。总计6000条数据。数据集都是以 .txt 格式存储。训练集、验证集和测试集包含question和label,分类数据集包含class和label。
参赛者需要预测测试集中糖尿病问题对应的分类,预测完成后需将测试数据集空缺的类别标签数据进行填充。
https://tianchi.aliyun.com/competition/entrance/532153/information
特定场景下的分类问题
可联系repo维护者