`
lovnet
  • 浏览: 6705345 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
文章分类
社区版块
存档分类
最新评论

利用Lucene.net搭建站内搜索(1)---了解Lucene.net

阅读更多
提到Lucene,想必园子中的老鸟们都有所耳闻,已经是数年前就出现的开源技术。很多站点都是利用它搭建自己网站的站内搜索。由于最近也在做数据检索方面的东西,也学习了下Lucene.net的使用。先来看下最终的效果:



看上去还算是那么回事,我将利用几篇文章,和大家学习下Lucene.net创建索引,分词,检索等方面的知识。由于初学,有什么问题还望指教。


此文先来和大家了解下Lucene.net,介绍给没有接触过的新手。
Lucene:一个开源的使用Java语言编写的全文搜索引擎开发包。Lucene.net是使用在.NET平台下的搜索引擎开发工具,利用Lucene.net我们可以比较容易的搭建自己的数据检索程序。里面包含了很多API,我们可以不必很深入的了解他们是如何实现的,通过合理的使用,就可以实现想要的效果。但是Lucene.net是开源的,感兴趣的朋友可以研究下,对大家的学习会很相当的有帮助!
当然,千万不要妄想利用Lucene.net实现像Google,Baidu那样的效果,一个真正的搜索引擎可不是几个API可以搞定的,想了解搜索引擎的朋友参看:
http://www.cnblogs.com/gaoweipeng/archive/2009/09/20/1570357.html

那么Lucene.net能为我们做什么呢?
Lucene可以对任何的数据做索引和搜索。 Lucene不管数据源是什么格式,只要它能被转化为文字的形式,就可以被Lucene所分析利用。也就是说不管是MS word, Html ,pdf还是其他什么形式的文件只要你可以从中抽取出文字形式的内容就可以被Lucene所用。你就可以用Lucene对它们进行索引以及搜索
没错,Lucene.net的核心技术就是方便的为我们创建索引,以及检索功能,当然这中间还需要分词等技术。

与传统数据库检索相比,Lucene.net具有以下特点:



更多Lucene.net资料:
Java版的可以在这里找到:http://lucene.apache.org/

dotNet版的可以在这里找到:http://incubator.apache.org/lucene.net/

园子中Lucene.Net 2.3.1开发介绍http://space.cnblogs.com/group/topic/4683/

Andrew Smith对Lucene.NET的介绍:http://www.codeproject.com/KB/library/IntroducingLucene.aspx

.NET3.5平台下的Linq to Lucene:http://www.codeplex.com/linqtolucene


分享到:
评论

相关推荐

    Lucene.Net+盘古分词C# Demo

    Lucene.Net+盘古分词是一个常见的中文信息检索组合。但是随着盘古分词停止更新,与Lucene.Net3.0...为了使得大家少走弯路,本人利用Lucene.Net2.9+盘古分词2.3搭建了一个Demo,里面包含了两个模块的源码,方便大家研究。

    Lucene.Net+盘古分词Demo

    Lucene.Net+盘古分词是一个常见的中文信息检索组合。但是随着盘古分词停止更新,与Lucene...为了使得大家少走弯路,本人利用Lucene.Net2.9+盘古分词2.3搭建了一个Demo,里面包含了两个模块的源码,方便大家研究。 以上。

    使用Lucene.NET实现站内搜索

    提到Lucene,想必大家都有所耳闻,已经是数年前就出现的开源技术。很多站点都是利用它搭建自己网站的站内搜索。由于最近也在做数据检索方面的东西,也学习了下Lucene.net的使用。

    Lucene4.X第九讲-Lucene搜索深入实战

    本课程由浅入深的介绍了Lucene4的发展历史,开发环境搭建,分析lucene4的中文分词原理,深入讲了lucenne4的系统架构,分析lucene4索引实现原理及性能优化,了解关于lucene4的搜索算法优化及利用java结合lucene4实现...

    lucene2.9.1所有最新开发包及源码及文档

    1. 搭建Lucene的开发环境:在classpath中添加lucene-core-2.9.1.jar包 2. 全文搜索的两个工作: 建立索引文件,搜索索引. 3. Lucene的索引文件逻辑结构 1) 索引(Index)由若干块(片段)(Segment)组成 ★2) 块由...

    搜索引擎的搭建(Lucene)代码

    搜索引擎的搭建(Lucene)文章对应的代码。详细介绍https://blog.csdn.net/yyhui95/article/details/72526193

    Lucene4.X 第十五讲-Lucene高级进阶

    本课程由浅入深的介绍了Lucene4的发展历史,开发环境搭建,分析lucene4的中文分词原理,深入讲了lucenne4的系统架构,分析lucene4索引实现原理及性能优化,了解关于lucene4的搜索算法优化及利用java结合lucene4实现...

    1004_ASP.NET基于Ajax+Lucene构建搜索引擎的设计和实现(源代码+论文)_1004.zip

    1004_ASP.NET基于Ajax+Lucene构建搜索引擎的设计和实现(源代码+论文)_1004.zip

    一款基于asp.net技术业内领先的Web2.0社区平台

    是一款基于asp.net技术业内领先的Web2.0社区平台。结合我们提供的博客、 相册、文件、网摘、迷你博客、资讯、论坛、活动、圈子等应用模块,您可以快速的搭建web2.0特征的在线社区。借助SpaceBuilder平台的 服务...

    单点登录源码

    单点登录, SSM框架公共模块 ├── zheng-admin -- 后台管理模板 ├── zheng-ui -- 前台thymeleaf模板[端口:1000] ...## 环境搭建(QQ群内有“zheng环境搭建和系统部署文档.doc”) #### 开发工具: ...

    小旋风垂直搜索平台,快速拱建垂直搜索引擎

    小旋风是一款集多任务、多线程智能网络爬虫、基于xml / xpath的路径规则的数据抽取系统、无缝集成lucene.net2.3全文索引系统,高性能中文分词组件、多数据库支持的综合垂直搜索引擎平台。 它帮您快速搭建任何一个您...

    SNS源代码,社区系统,基于.net3.5+sql,C#,aspx

    其采用asp.net mvc进行开发,可以使用SQL Server数据库或者MySql数据库,借助Lucene实现的全文检索。 基封装了数据访问、缓存、文件存储、自运行任务、图像处理、邮件发送等技术构件以及动态、通知、私信、积分、...

    一款基于asp.net技术业内领先的Web2.0社区平台。

    SpaceBuilder采用世界领先的技术体系架构、优异的缓存技术、基于Lucene的全文检索技术,可以承载千万级的数据,并提供良好的安全性及用户体验,表现层采用asp.net mvc及jQuery开发,是迄今为止基于asp.net技术领域最...

    基于SSM框架构建积分系统和基本商品检索系统源码.zip

    #### (二)[建立商品数据库和Lucene的搭建](http://blog.csdn.net/jack__frost/article/details/68947868) #### (三)[ Redis系列(一)--安装、helloworld以及读懂配置文件]...

    java版qq餐厅源码-demo:这是一个测试存储库!

    java版qq餐厅源码 姜向俊的个人简历 1.个人信息 姓名:姜向俊 性别:男 现居住地:山东济宁 毕业院校:山东大学 联系电话:18678763121 ...可以基于.NET的任何平台/技术搭建架构,对设计模式也有一定的了解。 (2)

    基于JFinal的开源博客系统JFinal_Blog2.0版本.zip

    3、解决Lucene全文检索出现"too many open files "的bug问题; 4、解决Linux中tomcat容器乱码问题(URLEncoding="UTF-8"); 二、开源地址: 1、OSC介绍:http://www.oschina.net/p/jfinal_blog 2、GIT版本:...

    基于JFinal的开源博客系统JFinal_Blog2.0版本

    3、解决Lucene全文检索出现"too many open files "的bug问题; 4、解决Linux中tomcat容器乱码问题(URLEncoding="UTF-8"); 二、开源地址: 1、OSC介绍:http://www.oschina.net/p/jfinal_blog 2、GIT版本:...

    SpaceBuilder2.0_SDK.zip

    SPB最新版本v2.0采用asp.net mvc开发,是迄今为止基于asp.net技术的最强大的社区产品,采用了世界领先的技术体系架构、优异的缓存技术、基于Lucene的全文检索技术,可以承载千万级的数据,并提供良好的安全性及用户...

    博客、相册、文件、网摘、迷你博客、论坛、活动、圈子

    SpaceBuilder采用世界领先的技术体系架构、优异的缓存技术、基于Lucene的全文检索技术,可以承载千万级的数据,并提供良好的安全性及用户体验,表现层采用asp.net mvc及jQuery开发,是迄今为止基于asp.net技术领域最...

Global site tag (gtag.js) - Google Analytics