您现在正在浏览:首页 > 论文 > 计算机 > 硕士学位论文-应用于中文人名搜索引擎的Web信息提取技术研究

免费下载硕士学位论文-应用于中文人名搜索引擎的Web信息提取技术研究

  • 资源类别:论文
  • 资源分类:计算机
  • 适用专业:计算机软件与理论
  • 适用年级:研究生
  • 上传用户:linlin420669
  • 文件格式:NH
  • 文件大小:2.12MB
  • 上传时间:2008-8-5 23:37:52
  • 下载次数:6
  • 浏览次数:175

安全检测:瑞星:安全 诺顿:安全 卡巴:安全

资料简介
硕士学位论文 应用于中文人名搜索引擎的Web信息提取技术研究,共51页
摘要:Web信息提取是指从Web文档中自动提取出所需信息的过程。本文研究Web信息提取并应用于面向主题的搜索引擎中,这里的主题是针对于中文人名的查找。 本文主要的工作是针对有关Web上中文人名的信息,研究Web信息提取技术,设计搜索引擎中的信息提取模块,并进行实验测试。本文从网页内容中提取关于人名的四个属性(出生年份、职业、相关地点、相关机构)。 论文中详细说明了信息提取模块的系统流程设计和流程中各个子模块的实现方法以及使用到的具体技术。针对不同的人名网页内容类型,本文使用了相应的提取模式的方法。对于“个人介绍类”网页,本文使用了知识工程方法(Knowledge Engineering Approach),人工构建了模式库;对于“个人活动类”网页,本文使用了自动训练方法(Automatic Training Approach),提出了一种新的模式提取算法,用来自动地从训练集中提取模式。最后针对Web上的某一中文人名网页集进行信息提取实验,实验证明信息提取模块的处理效果较好,能够从网页文本中提取出比较准确的信息。
关键词:信息提取; 搜索引擎; 模式匹配;
资料文件预览
共1文件夹,1个文件,文件总大小:2.15MB,压缩后大小:2.12MB
  • 硕士学位论文-应用于中文人名搜索引擎的Web信息提取技术研究
    • NH应用于中文人名搜索引擎的Web信息提取技术研究.NH  [2.15MB]
下载地址
资料评论
注意事项
下载FAQ:
Q: 为什么我下载的文件打不开?
A: 本站所有资源如无特殊说明,解压密码都是www.xuehai.net,如果无法解压,请下载最新的WinRAR软件。
Q: 我的学海币不多了,如何获取学海币?
A: 上传优质资源可以获取学海币,详细见学海币规则
Q: 为什么我下载不了,但学海币却被扣了?
A: 由于下载人数众多,下载服务器做了并发的限制。请稍后再试,48小时内多次下载不会重复扣学海币。
下载本文件意味着您已经同意遵守以下协议
1. 文件的所有权益归上传用户所有。
2. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
3. 学海网仅提供交流平台,并不能对任何下载内容负责。
4. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
5. 本站不保证提供的下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
返回顶部