|
|
| 不同规则的中文分词对Lucene索引的影响 | 在中文全文索引中为了建立反向索引需要对文档中的句子进行切分,相关理论请参见车东的介绍。在lucene 1.3 以后的版本中支持中文建立索引了,他默认的切分规则是按一个个汉字分的。这里主要对比以下3种中文切分对lucene 索引的影响。
阅读全文:不同规则的中文分词对Lucene索引的影响 |
|
田春峰 | 2006-11-9 14:20:00 |
|
| Lucene In Action ch 4 笔记(I)--Analysis | 本章详细的讨论了 Lucene的分析处理过程和几个Analyzer在indexing过程中要把需要indexing的text分析处理一下,经过处理和切词,然后建立index而不通的Analyzer有不同的分析规则,因此在程序中使用Lucene时...
阅读全文:Lucene In Action ch 4 笔记(I)--Analysis |
|
| 2006-11-7 20:59:00 |
|
| Lucene In Action ch 1 笔记 -- 基本概念 | 最近想看看Lucene, 在网上找了一些中文资料看看, 看了一些 但是感觉概念还是不太清楚,有时都被自己搞糊涂了. 没办法就下了一本Lucene In Action 今天看完第一章后 结合以前看的一些中文资料 慢慢的才搞明白了一些基本概念,在此记录下来 以备需者。
阅读全文:Lucene In Action ch 1 笔记 -- 基本概念 |
|
| 2006-11-4 0:06:00 |
|
| Lucene搜索引擎分词原理 | Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构,本文就其分词原理进行简单介绍。
阅读全文:Lucene搜索引擎分词原理 |
|
| 2006-10-27 12:16:00 |
|
| Lucene全文检索应用示例及代码简析 | Lucene是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包及架构,提供了完整的查询引擎和索引引擎,实现了一些通用的分词算法,预留很多词法分析器接口。本文以某网站系统中使用Lucene实现全文检索的代码为例,简单演示Lucene在实际项目中的应用。
阅读全文:Lucene全文检索应用示例及代码简析 |
|
| 2006-10-27 12:13:00 |
|
| Lucene 搜索引擎倒排索引原理 | Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构,本文将对其倒排索引原理进行分析。 阅读全文:Lucene 搜索引擎倒排索引原理 |
|
xzall | 2006-10-27 11:24:00 |
|
| 深入Lucene索引机制 | Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。
在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住的是,Lucene 不是一个完整的应用程序,而是一个信息检索包,它方便你为你的应用程序添加索引和搜索功能。
阅读全文:深入Lucene索引机制 |
|
周登朋 | 2006-10-26 19:49:00 |
|
|