语言技术平台3.2.0版 发布
- [增加] 分词模块增量模型训练工具。使用户可以在语言技术平台基线模型的基础之上增加训练数据,从而获得特定领域性能更好的模型。
- [修改] Boost.Regex到1.56.0,由于旧版本Boost.Regex的
match_results
类存在竞争问题,这一修改修复了multi_cws_cmdline
随机出错的问题。 - [修改] 使自动化测试脚本支持Windows运行以及多线程测试
- [修改] 将原
examples
文件夹下的示例文件转移到test
文件夹下并纳入语言技术平台的编译链 - [测试] 新版语言技术平台通过
cygwin
编译测试 - [测试] 多线程程序
multi_ltp_test
,multi_cws_cmdline
以及multi_pos_cmdline
在Windows通过测试
语言技术平台(Language Technology Platform,LTP)是哈工大社会计算与信息检索研究中心历时十年开发的一整套中文语言处理系统。LTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块(包括词法、句法、语义等6项中文处理核心技术),以及基于动态链接库(Dynamic Link Library, DLL)的应用程序接口,可视化工具,并且能够以网络服务(Web Service)的形式进行使用。
从2006年9月5日开始该平台对外免费共享目标代码,截止目前,已经有国内外400多家研究单位共享了LTP,也有国内外多家商业公司购买了LTP,用于实际的商业项目中。
2010年12月获得中国中文信息学会颁发的行业最高奖项:“钱伟长中文信息处理科学技术奖”一等奖。
2011年6月1日,为了与业界同行共同研究和开发中文信息处理核心技术,我中心正式将LTP开源。
2013年9月1日,语言技术平台云端服务"语言云"正式上线。
关于LTP的使用,请参考LTP使用文档v3.0
- 百度云
- 当前模型版本3.2.0
-
语言技术平台面向国内外大学、中科院各研究所以及个人研究者免费开放源代码,但如上述机构和个人将该平台用于商业目的(如企业合作项目等)则需要付费。
-
除上述机构以外的企事业单位,如申请使用该平台,需付费。
-
凡涉及付费问题,请发邮件到[email protected]洽商。
-
如果您在LTP基础上发表论文或取得科研成果,请您在发表论文和申报成果时声明“使用了哈工大社会计算与信息检索研究中心研制的语言技术平台(LTP)”,参考文献中加入以下论文: Wanxiang Che, Zhenghua Li, Ting Liu. LTP: A Chinese Language Technology Platform. In Proceedings of the Coling 2010:Demonstrations. 2010.08, pp13-16, Beijing, China. 同时,发信给[email protected],说明发表论文或申报成果的题目、出处等。