您现在正在浏览:首页 > 论文 > 计算机 > 毕业设计-新闻搜索引擎的设计与实现

免费下载毕业设计-新闻搜索引擎的设计与实现

  • 资源类别:论文
  • 资源分类:计算机
  • 适用专业:程序设计
  • 适用年级:大学
  • 上传用户:848894807
  • 文件格式:word+java
  • 文件大小:1.29MB
  • 上传时间:2011-11-24 22:56:51
  • 下载次数:0
  • 浏览次数:78

安全检测:瑞星:安全 诺顿:安全 卡巴:安全

资料简介
毕业设计-新闻搜索引擎的设计与实现,正文共42页,15152字,附源程序。
内容摘要
网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。
本文首先介绍了搜索引擎的发展历史、分类、最新发展状况及所面临的问题等。接着详细介绍了基于Lucene的全文搜索引擎的系统结构,然后介绍网络机器人的原理和实现。又详细介绍了lucene的原理及基于lucene的搜索引擎的实现过程。详细介绍了如何解析网页提取网页内容,如何创建索引,并进行搜索,怎样进行分页等主要功能的代码并给了详细的讲解。接着介绍服务器,开发工具及运行环境。最后以添加两条URL并解析网页,然后搜索并显示,并给出了运行的关键步骤的截图,条理清晰。最后一章介绍了系统的展望,和还有待与完善和提高的地方。
本人在介绍搜索引擎的章节中除了详细的阐述技术核心外还结合了新闻搜索引擎的实现代码来说明,图文并茂、易于理解。
关键词: 网络机器人 搜索引擎 网页解析 URL
目 录
一、绪论 1
(一)开发搜索引擎的目的和意义 1
(二)搜索引擎的发展史 1
1.Google新闻搜索 2
2.百度新闻搜索 2
3.搜狐新闻搜索引擎 3
(三)搜索引擎的分类及其工作原理 3
(四)所面临的问题及可能的原因 4
(五)本章小结 4
二、 搜索引擎的结构 5
(一)搜索引擎的构成 5
(二)什么是网络机器人 5
1.网络机器人 5
2.网络机器人的程序分析 6
3.如何解析HTML 7
4.如何提高程序性能 10
(三)什么是基于TOMCAT的WEB服务器 10
(四)本章小结 11
三、基于LUCENE的全文搜索引擎 12
(一)LUCENE全文检索介绍 12
(二)LUCENE的原理分析 12
1.全文检索的实现机制 12
2.Lucene的索引效率 13
3.Lucene和其他一些全文检索系统/应用的比较 15
4.Lucene的创新之处 16
5.Lucene的组成结构 16
6.中文切分词机制 16
(三)LUCENE创建索引 17
(四)LUCENE索引的追加 20
(五)LUCENE删除索引 20
(六)LUCENE恢复索引 21
(七)对索引进行搜索 21
(八)本章小结 26
四、系统实现 27
(一)系统界面设计 27
1.首页面设计 27
2.搜索结果页面设计 28
3.系统其他辅助类 30
(二)系统开发和运行环境 30
(三)系统运行关键步骤截图 31
(四)本章小结 36
五、总结与展望 37
参考文献 38
致谢 39
资料文件预览
共1文件夹,1个文件,文件总大小:1.56MB,压缩后大小:1.29MB
  • 毕业设计-新闻搜索引擎的设计与实现
    • Microsoft Word文档毕业论文 小型WEB搜索引擎的设计与实现.doc  [1.56MB]
下载地址
资料评论
注意事项
下载FAQ:
Q: 为什么我下载的文件打不开?
A: 本站所有资源如无特殊说明,解压密码都是www.xuehai.net,如果无法解压,请下载最新的WinRAR软件。
Q: 我的学海币不多了,如何获取学海币?
A: 上传优质资源可以获取学海币,详细见学海币规则
Q: 为什么我下载不了,但学海币却被扣了?
A: 由于下载人数众多,下载服务器做了并发的限制。请稍后再试,48小时内多次下载不会重复扣学海币。
下载本文件意味着您已经同意遵守以下协议
1. 文件的所有权益归上传用户所有。
2. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
3. 学海网仅提供交流平台,并不能对任何下载内容负责。
4. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
5. 本站不保证提供的下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
返回顶部