您现在正在浏览:首页 > 论文 > 计算机 > 毕业设计-基于java的搜索引擎的实现

免费下载毕业设计-基于java的搜索引擎的实现

  • 资源类别:论文
  • 资源分类:计算机
  • 适用专业:互联网技术
  • 适用年级:大学
  • 上传用户:名字真难取727
  • 文件格式:word
  • 文件大小:938.24KB
  • 上传时间:2009-3-8 0:04:06
  • 下载次数:0
  • 浏览次数:175

安全检测:瑞星:安全 诺顿:安全 卡巴:安全

资料简介
毕业设计 基于java的搜索引擎的实现 共60页,26481字
摘 要
随着互联网的不断发展和日益普及,网上的信息量在爆炸式增长,如何在最短时间内找到我们所需要的资料就成了一个非常关键的问题。为了解决这个问题,Web搜索引擎就随之出现了,并得到了飞速发展,现在已经成为互联网上仅次于电子邮件的第二大网络服务。
首先,本文讲述了Web搜索引擎的历史和现状。
其次,本文介绍了Web搜索引擎的基本原理和技术。
再次,本文分析了Web搜索引擎的系统结构,并着重从网络蜘蛛,索引引擎和Web查询服务三个部分进行了详细的描述。与此同时,本文描述了在Java开发环境下,如何设计实现一个利用开源工具包的Web搜索引擎——WebCdf,包括Web信息搜集索引器WebSpider和Web查询服务器Search两个子系统。
WebCdf搜索引擎从指定的Web页面开始解析,把获得的链接放入工作队列,在万维网上进行广度优先搜索,并把每个页面的URL地址和文本进行索引存入数据库,然后Web服务器接收客户端请求,从数据库中返回页面信息。
本文介绍和研究了一系列与Web搜索引擎相关的技术,包括网页抓取、相关性排序(VSM)、信息提取、信息索引等,这些技术将被应用到文中提出的系统设计方案中。
最后,本文简单地讲述了搜索引擎的未来发展趋势。
关键词: 互联网,搜索引擎,信息提取,Java

目 录
1 概述 1
1.1引言 1
1.2 搜索引擎的发展历史 2
1.3 搜索引擎的现状介绍 3
1.4 小结 4
2 相关技术 5
2.1 相关抓取技术 5
2.2 相关排序技术 6
2.3 信息索引技术 8
2.4 提高索引性能 8
2.5 其它相关技术 9
2.5.1数据存储 9
2.5.2 中文分词 10
2.6 小结 10
3 Web搜索引擎的原理分析 11
3.1 基本原理 11
3.2 网页搜集 12
3.3 预处理 13
3.4 查询服务 14
3.5 搜索引擎的技术指标 15
3.6 小结 15
4 Web搜索引擎的系统结构 16
4.1系统概述 16
4.2系统各个部分功能 17
4.2.1网络蜘蛛 17
4.2.2 索引与检索 18
4.2.3 Web查询服务器 18
4.3 系统开发工具及资源 18
4.4 小结 19
5 两种Spider的实现 20
5.1 Pages-Spider的实现 20
5.1.1 Pages-Spider介绍 20
5.1.2 Pages-Spider结构分析 20
5.1.3 Pages-Spider程序结构 22
5.1.4 Pages-Spider实现 26
5.1.5小结 28
5.2 Mp3-Spider的实现 29
5.2.1 Pages-Spider程序结构 29
5.2.2 Mp3s-Spider结构分析 29
5.2.3 Mp3s-Spider实现 31
5.2.1 小结 33
6 基于Lucene的全文索引实现 34
6.1 Lucene全文检索介绍 34
6.2 Lucene的特性分析 34
6.2.1 Lucene的核心部分——索相与排序 34
6.2.2 Lucene相关度积分公式 35
6.2.3 Lucene特性 36
6.3 Lucene的工作原理 37
6.3.1 全文检索的实现机制 37
6.3.2 Lucene的索引效率 37
6.3.3 中文分词问题 38
6.4索引功能的实现 39
6.4.1 分词实现 39
6.4.2 PAGES-索引功能实现 39
6.4.3 MP3S-索引功能实现 40
6.5索引合并的实现 41
7 基于Tomcat的服务器实现 43
7.1 Tomcat介绍 43
7.2 客户端设计 43
7.3 服务端设计 46
7.4 部署Tomcat项目 48
7.5 小结 49
8 总结与展望 50
8.1 设计总结 50
8.2 未来展望 51
参考文献 53
致 谢 55
资料文件预览
共1文件夹,1个文件,文件总大小:1.45MB,压缩后大小:938.24KB
  • 毕业设计-基于java的搜索引擎的实现
    • Microsoft Word文档基于java的搜索引擎的实现.doc  [1.45MB]
下载地址
资料评论
注意事项
下载FAQ:
Q: 为什么我下载的文件打不开?
A: 本站所有资源如无特殊说明,解压密码都是www.xuehai.net,如果无法解压,请下载最新的WinRAR软件。
Q: 我的学海币不多了,如何获取学海币?
A: 上传优质资源可以获取学海币,详细见学海币规则
Q: 为什么我下载不了,但学海币却被扣了?
A: 由于下载人数众多,下载服务器做了并发的限制。请稍后再试,48小时内多次下载不会重复扣学海币。
下载本文件意味着您已经同意遵守以下协议
1. 文件的所有权益归上传用户所有。
2. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
3. 学海网仅提供交流平台,并不能对任何下载内容负责。
4. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
5. 本站不保证提供的下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
返回顶部