您现在正在浏览:首页 > 论文 > 计算机 > 基于条件随机场的元数据自动提取技术电子书

免费下载基于条件随机场的元数据自动提取技术电子书

  • 资源类别:论文
  • 资源分类:计算机
  • 适用专业:计算机应用技术
  • 适用年级:大学
  • 上传用户:xiahuanboys
  • 文件格式:pdf
  • 文件大小:735.66KB
  • 上传时间:2009-3-20 3:32:00
  • 下载次数:0
  • 浏览次数:51

安全检测:瑞星:安全 诺顿:安全 卡巴:安全

资料简介
基于条件随机场的元数据自动提取技术电子书
摘要
伴随着数字图书馆技术的发展,电子文档成为人们获取信息的主要来源。为了使用户更方便快捷地发现所需要的文献资源,元数据信息提取技术的研究得到越来越多的关注。元数据信息的自动提取解决了早期主要靠人工阅读文档找出相应的元数据这项费时费力的工作,并为电子资源的有序组织、适度控制和高效检索提供更为便利的条件。随着机器学习理论的逐渐成熟,元数据的自动提取成为了当今的研究热点。本文主要对基于条件随机场的元数据自动提取的相关技术进行了研究。
首先,针对以单词为单位组成的论文头部文本序列来进行元数据提取时存在任务量大,抽取精度低等问题,提出一种文本分块策略来对其进行分块,详细阐述了分块的过程,使得每一个抽取域和一个具体的文本分块相对应。在分块的基础上利用文本中含有特征词等信息,通过定义特征提取规则来确定其状态。在路径搜索过程中,采用启发式搜索算法来确定剩余块的状态。其次,为了实现引文元数据的精确抽取,根据引文信息格式的多样性和提取域的密集性,在条件随机场模型的基础上融合重排序来提取引文元
数据,将条件随机场和重排序形成串行处理流程,通过对条件随机模型生成的多个候选标注进行等级排序实现引文元数据的提取。最后,对上述研究方法进行了实验验证及分析,和原有的方法进行了对比,并对今后的研究工作进行了展望。
关键词 元数据提取;条件随机场;文本分块;启发式搜索;重排序

··································11
2.3 条件随机场和其他模型的比较···························································12
2.3.1 隐马尔可夫模型·············································································12
2.3.2 最大熵马尔可夫模型·····································································14
2.4 条件随机场的优点与不足···································································16
2.5 条件随机场的参数估计·······································································16
2.5.1 最大似然估计·················································································17
2.5.2 参数估计的优化·············································································18
2.6 本章小结·······························································································20
第3 章 基于启发式搜索的论文头部元数据提取··········································21
3.1 元数据概述···························································································21
3.1.1 论文元数据的作用·········································································21
3.1.2 论文头部数据集的定义·································································22
3.2 论文头部的特征选择···········································································23
3.2.1 局部特征······································································
资料文件预览
共1文件夹,1个文件,文件总大小:818.74KB,压缩后大小:735.66KB
  • 基于条件随机场的元数据自动提取技术电子书
    • Adobe Acrobat可导出文档格式文件20090416094421500.pdf  [818.74KB]
下载地址
资料评论
注意事项
下载FAQ:
Q: 为什么我下载的文件打不开?
A: 本站所有资源如无特殊说明,解压密码都是www.xuehai.net,如果无法解压,请下载最新的WinRAR软件。
Q: 我的学海币不多了,如何获取学海币?
A: 上传优质资源可以获取学海币,详细见学海币规则
Q: 为什么我下载不了,但学海币却被扣了?
A: 由于下载人数众多,下载服务器做了并发的限制。请稍后再试,48小时内多次下载不会重复扣学海币。
下载本文件意味着您已经同意遵守以下协议
1. 文件的所有权益归上传用户所有。
2. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
3. 学海网仅提供交流平台,并不能对任何下载内容负责。
4. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
5. 本站不保证提供的下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
论文相关下载
返回顶部