v1.7.6 最后的武士 The Last Samurai
接下来是一个全新的时代,我们的征途是星辰大海。此后1.x分支将继续提供稳定性维护,两个版本面向的场景不同,2.0基于深度学习,面向对精度要求极其高的场景,例如端到端的问答系统解决方案;而1.x基于传统机器学习和特征工程,面向搜索引擎等对速度要求较高的场景。2.0需要时间打磨,1.x将会持续维护,保证稳定性。
- 新增 DocVectorModel.nearest(java.lang.String, int) 方法 fix #1332
- 词法分析器新增空格处理 fix #797
- 修订现代汉语补充词库 fix #1330
- NGramDictionaryMaker等默认UTF-8编码 fix #1320
- WordVectorModel支持自定义Map类型:#1304
- 修复信息熵计算中的除零错误 fix #1366
- 修复Nature的线程安全性
- tfidf,idf的数据可以通过加载idf文件得到
- 开放 CoreStopWordDictionary.dictionary #1356
- 修复加载自定义停用词文件无效
- 兼容数据包data-for-1.7.5.zip 或 分流 或 网盘
md5=1d9e1be4378b2dbc635858d9c3517aaa
- Portable版同步升级到v1.7.6
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.6</version>
</dependency>
🎉感谢所有在issue中提出宝贵建议的用户!