请注意,本站并不支持低于IE8的浏览器,为了获得最佳效果,请下载最新的浏览器,推荐下载 Chrome浏览器
欢迎光临IT大师技术资料资讯网。软件开发交流群:60831381

让盘古分词支持最新的Lucene.Net 3.0.3

 dotey  2013/05/27  188

包放到了Nuget上,方便下载。 https://github.com/JimLiu/Lucene.Net.Analysis.PanGu另外对比了一下MMSeg和Pangu,发现各有优缺点,没有做特别深入的比较,先用MMSeg好了。本文转自:http://www.cnblogs.com/dotey...
阅读全文 188

通过盘古分词自定义规则功能实现软件版本号的提取

 eaglet  2010/08/20  164

个接口后,我们编译成一个动态库,这里假设为 CustomRuleExample.dll 最后 我们需要将这个动态库拷贝到和PanGu.dll 相同的目录中,然后修改 PanGu.xml 配置文件,打开自定义规则开关,方法如下: 在 MatchOption 中将 CustomRule 这个开关设置为...
阅读全文 164

Lucene.Net

 piziyimao  2013/01/31  56

ng content) {//创建HTMLFormatter,参数为高亮单词的前后缀PanGu.HighLight.SimpleHTMLFormatter simpleHTMLFormatter =new PanGu.HighLight.SimpleHTMLFormatter(""...
阅读全文 56

HubbleDotNet 索引分词的测试方法和分词技巧

 eaglet  2012/02/15  79

t.xml 这个配置文件来对文本进行分词,如果不加 SqlClient 参数,则是调用program/hubbledotnet/default/PanGu.xml 这个配置文件分词。 SqlClient 的功能主要是帮助进行查询字符串的分词,HubbleCommand 这个类中有一个函数 Get...
阅读全文 79

盘古分词--功能简介

 eaglet  2009/08/13  116

键词高亮组件,但这个组件对中文的支持不是特别好,特别是如果还有多元分词的情况,处理的就更不好。盘古分词提供了一个针对中文和英文的关键词高亮组件 PanGu.HighLight ,其对中文的支持要好于Lucene 那个高亮组件。同义词输出(后续版本提供)Lucene.net 接口及示例在PanGu4...
阅读全文 116