1 最近有问答需求,需要用到分词器,对比了目前国内开源代码,筛选出了HanLP,HanLP在持续更新,即使是Java简易版识别准确率比较高。非常值得使用。
2 使用方法(maven)pom.xml
<!-- 分词器 -->
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.6.8</version>
</dependency>
3 使用方法(希望对有需求的朋友有帮助)
String word ="我的报销";
Listterms =HanLP.segment(word);
terms.forEach(term -> {
System.out.println(term.word + term.nature);
});