首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Lucene的站内搜索引擎研究
引用本文:马志强,刘利民,苏依拉,马瑞明.基于Lucene的站内搜索引擎研究[J].内蒙古工业大学学报,2009(1).
作者姓名:马志强  刘利民  苏依拉  马瑞明
作者单位:内蒙古工业大学信息工程学院 内蒙古电力工程技术研究院
基金项目:国家自然科学基金资助项目(60673015);; 内蒙古工业大学科学研究项目(X200806)
摘    要:网站提供的站内查询系统存在着系统不能自动采集网络信息,以及模糊查询结果准确率低等缺点.因此,应用搜索引擎的工作原理,设计了一种基于Lucene的站内搜索引擎系统,实现了站内信息的增量采集、自动分词和建立倒排索引功能.该系统的建立,提高了用户站内搜索的准确率和查全率,使站内信息资源能得到充分利用.

关 键 词:搜索引擎  Lucene  中文分词

THE STUDY OF INTRANET SEARCH ENGINE BASED ON LUCENE
MA Zhi-qiang,; LIU Li-min,; SU Yi-la,; MA Rui-ming.THE STUDY OF INTRANET SEARCH ENGINE BASED ON LUCENE[J].Journal of Inner Mongolia Polytechnic University(Social Sciences Edition),2009(1).
Authors:MA Zhi-qiang  ; LIU Li-min  ; SU Yi-la  ; MA Rui-ming
Institution:1.School of Information Engineering; Inner Mongolia University of Technology; Hohhot 010051; China; 2.Inner Mongolia Research Institute of Electric Power Engineering; Hohhot 010020; China);
Abstract:The service of intranet query is provided on web site.However,it still has some disadvantages.First,the service system can t collect information automatically.Second,the accuracy of fuzzy query response is very low.With a view to surmounting these disadvantages,on the working principle of search engine,the intranet search engine based on Lucene is designed.The increment collection of information,automatic segmentation of Chinese words and creation function of inverted index have all become available.Consequ...
Keywords:search engine  Lucene  Chinese word segmentation
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号