使用Lucene实现一个简单的布尔搜索功能

更新时间：2017年04月12日 09:54:10 作者：鸿武

Lucene是一个全文搜索框架，而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用，它只是提供了一种工具让你能实现这些产品。接下来通过本文给大家介绍使用Lucene实现一个简单的布尔搜索功能

什么是lucene

Lucene是apache软件基金会jakarta项目组的一个子项目，是一个开放源代码的全文检索引擎工具包，但它不是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎，部分文本分析引擎（英文与德文两种西方语言）。

Lucene是一个全文搜索框架，而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用，它只是提供了一种工具让你能实现这些产品。

在布尔查询的对象中，包含一个子句的集合，各个子句间都是如“与”、“或”这样的布尔逻辑。Lucene中所遇到的各种复杂查询，最终都可以表示成布尔型的查询。下面代码就是实现了一个简单的布尔查询。

package LuceneSearch; 
import org.apache.lucene.analysis.standard.StandardAnalyzer; 
import org.apache.lucene.document.Document; 
import org.apache.lucene.document.Field; 
import org.apache.lucene.index.IndexWriter; 
import org.apache.lucene.index.Term; 
import org.apache.lucene.search.BooleanClause; 
import org.apache.lucene.search.BooleanQuery; 
import org.apache.lucene.search.Hits; 
import org.apache.lucene.search.IndexSearcher; 
import org.apache.lucene.search.TermQuery; 
/** 
 * 布尔搜索测试 
 * @author sdu20 
 * 
 */ 
public class BooleanQueryTest { 
 static final String INDEX_STORE_PATH = "E:\\编程局\\Java编程处\\Index\\"; 
 public static void main(String[] args) { 
 // TODO Auto-generated method stub 
 try{ 
  IndexWriter writer = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),true); 
  writer.setUseCompoundFile(false); 
  //创建8个文档 
  Document doc1 = new Document(); 
  Document doc2 = new Document(); 
  Document doc3 = new Document(); 
  Document doc4 = new Document(); 
  Document doc5 = new Document(); 
  Document doc6 = new Document(); 
  Document doc7 = new Document(); 
  Document doc8 = new Document(); 
  Field f1 = new Field("bookname","钢铁是怎样炼成的",Field.Store.YES,Field.Index.TOKENIZED); 
  Field f2 = new Field("bookname","英雄儿女",Field.Store.YES,Field.Index.TOKENIZED); 
  Field f3 = new Field("bookname","浮生六记",Field.Store.YES,Field.Index.TOKENIZED); 
  Field f4 = new Field("bookname","太平广记",Field.Store.YES,Field.Index.TOKENIZED); 
  Field f5 = new Field("bookname","文化苦旅",Field.Store.YES,Field.Index.TOKENIZED); 
  Field f6 = new Field("bookname","白夜行",Field.Store.YES,Field.Index.TOKENIZED); 
  Field f7 = new Field("bookname","白毛女",Field.Store.YES,Field.Index.TOKENIZED); 
  Field f8 = new Field("bookname","子不语",Field.Store.YES,Field.Index.TOKENIZED); 
  doc1.add(f1); 
  doc2.add(f2); 
  doc3.add(f3); 
  doc4.add(f4); 
  doc5.add(f5); 
  doc6.add(f6); 
  doc7.add(f7); 
  doc8.add(f8); 
  writer.addDocument(doc1); 
  writer.addDocument(doc2); 
  writer.addDocument(doc3); 
  writer.addDocument(doc4); 
  writer.addDocument(doc5); 
  writer.addDocument(doc6); 
  writer.addDocument(doc7); 
  writer.addDocument(doc8); 
  writer.close(); 
  System.out.println("创建索引成功"); 
  IndexSearcher searcher = new IndexSearcher(INDEX_STORE_PATH); 
  //创建两个词条对象 
  Term t1 = new Term("bookname","生"); 
  Term t2 = new Term("bookname","记"); 
  TermQuery q1 = new TermQuery(t1); 
  TermQuery q2 = new TermQuery(t2); 
  BooleanQuery query = new BooleanQuery(); 
  query.add(q1,BooleanClause.Occur.MUST); 
  query.add(q2,BooleanClause.Occur.MUST); 
  Hits hits = searcher.search(query); 
  for(int i = 0;i<hits.length();i++){ 
  System.out.println(hits.doc(i)); 
  } 
  System.out.println("搜索成功"); 
 }catch(Exception e){ 
  System.out.println(e.getStackTrace()); 
 } 
 } 
}

BooleanClause.Occur类主要有3种表示，即MUST、MUST_NOT和SHOULD。MUST与MUST_NOT不难理解，一看名字就知道是什么意思，而SHOULD是一个比较特殊的约束，当它与MUST联用时，它将失去意义。检索的结果为MUST子句的检索结果。当它与MUST_NOT联用时，SHOULD的功能就与MUST一样，就退变为MUST和MUST_NOT的查询结果。当SHOULD与SHOULD联用时，它们就表示一种“或”关系。最终检索结果为所有检索子句的检索结果的并集。

上面代码就是查询索引中有“生”字和“记”字的文档，程序运行结果截图如下

索引目录文件夹下截图如下

以上所述是小编给大家介绍的使用Lucene实现一个简单的布尔搜索功能，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持！

您可能感兴趣的文章:

解析Orika的MapperFacade 属性赋值的使用问题
在我们实际开发中，常常会有对象与对象之间的转化，或者把一个对象的数据转化到另一个数据之中，如果我们手动的一个一个的set就会比较麻烦，代码段看起来也会比较长。而Orika的MapperFacade就是解决这个问题的，实现对象属性的复制
2021-12-12
Java多线程状态及方法实例解析
这篇文章主要介绍了Java多线程状态及方法实例解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-02-02
避免Java中的内存泄漏的三种方法
在Java开发中,内存泄漏（Memory Leak）是一个常见但令人头疼的问题,本文将深入探讨什么是内存泄漏、常见的泄漏原因、如何识别和避免内存泄漏,以及通过代码示例展示如何优化Java程序以减少内存泄漏的发生,需要的朋友可以参考下
2024-07-07
Java 删除文件及文件夹删除不了的解决
这篇文章主要介绍了Java 删除文件及文件夹删除不了的解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2021-09-09
Mybatis中的resultType和resultMap使用
这篇文章主要介绍了Mybatis中的resultType和resultMap使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-09-09
Java实现的对称加密算法AES定义与用法详解
这篇文章主要介绍了Java实现的对称加密算法AES,结合实例形式分析了对称加密算法AES的定义、特点、用法及使用场景,需要的朋友可以参考下
2018-04-04
Java调用shell命令涉及管道、重定向时不生效问题及解决
这篇文章主要介绍了Java调用shell命令涉及管道、重定向时不生效问题及解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2022-12-12
SpringCloud微服务集成Dubbo的详细过程
Apache Dubbo 是一款易用、高性能的 WEB 和 RPC 框架，同时为构建企业级微服务提供服务发现、流量治理、可观测、认证鉴权等能力、工具与最佳实践，这篇文章主要介绍了SpringCloud微服务集成Dubbo,需要的朋友可以参考下
2024-03-03
java 获取当前函数名的实现代码
以下是对使用java获取当前函数名的实现代码进行了介绍。需要的朋友可以过来参考下
2013-08-08
一文详解Elasticsearch和MySQL之间的数据同步问题
Elasticsearch中的数据是来自于Mysql数据库的，因此当数据库中的数据进行增删改后，Elasticsearch中的数据，索引也必须跟着做出改变。本文主要来和大家探讨一下Elasticsearch和MySQL之间的数据同步问题，感兴趣的可以了解一下
2023-04-04

使用Lucene实现一个简单的布尔搜索功能

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具