您现在正在浏览:首页 > 论文 > 计算机 > 毕业设计-基于视觉分析的目标检测与简单行为分析研究与实现——语音模块

免费下载毕业设计-基于视觉分析的目标检测与简单行为分析研究与实现——语音模块

  • 资源类别:论文
  • 资源分类:计算机
  • 适用专业:信息工程
  • 适用年级:大学
  • 上传用户:pxdlove
  • 文件格式:word+pdf
  • 文件大小:655.17KB
  • 上传时间:2013-10-20 1:11:26
  • 下载次数:0
  • 浏览次数:21

安全检测:瑞星:安全 诺顿:安全 卡巴:安全

资料简介

毕业设计-基于视觉分析的目标检测与简单行为分析研究与实现——语音模块,共29页,11069字,附开题报告等
主要内容
1.研究内容和研究路线
本课题是基于视觉分析的目标检测与简单行为分析研究与实现的子项目
――目标检测,主要研究路线是:利用PC机作为算法仿真平台,结合VS2010软
件以及OpenCV计算机视觉库,针对实时的视频监控图像,分析部分已存在的
目标检测算法,并尝试在不同的背景下高效的实现,其次,对实验过程中出现
的各种问题认真总结归纳并找出解决方法,从而提出改进的方案,力求提高算
法的实时性和鲁棒性。
目标检测就是在一段序列图像中的每幅图像中实时的将变化区域从背景
中提取出来。它是进一步对目标进行分类、跟踪、行为理解与识别的关键和基
础。结合对小组项目的流程分析以及任务的分配,本课题的主要研究内容有:
1)视频图像的采集:通过计算机摄像头捕获环境中实体目标,将所获图像
转换成数字信号传给计算机,并且对序列图像进去噪锐化等预处理,使感兴趣
的区域可视化效果得到改善,找到良好的互动范围和背景,从而提高视频分析
的准确性。
2)目标的检测:结合背景建模所构建出来的背景图像,利用不同的目标检
测算法,在已经预处理完成的序列图像中进行图像分割,将人物和背景分离,
并对提取出来的目标进行简单的行为分析,正确理解和表述使用者的动作,为
后续的操作提供数据。
3)为人机交互模块保留接口参数:由于是小组项目的子课题,要配合其它
模块,合理保留接口参数。
2. 拟取得的预期研究成果:
1)各种传统的目标检测算法的仿真实现;
2)基于对已有的目标检测算法的研究而提出的新的解决方案,并完成新算
........

摘要 伴随计算机技术的发展,采用语音和计算机进行交互操作是未来人机交互的发展趋势。在2000年到2010年间,语音识别技术被誉为信息技术领域十大重要的科技发展技术之一。与此同时,语音识别技术正在逐步成为人机接口的关键技术。脱离鼠标和键盘,用语音进行命令操作是语音识别的根本目标。本文简单介绍了语音识别技术的发展历史,分析了语音识别技术的工作原理,阐明了自行开发语音识别模块的基本过程。同时,本文描述了语音识别技术的常用方法,其中侧重介绍了动态时间规整法的算法原理以及基于Ms Speech SDK开发的基本步骤及实现方法,通过两种方法的学习,对比出了各自的特点,最终确定使用Visual Studio 2010 与Ms Speech SDK为平台进行二次开发,达到使计算机能够识别出非特定人的简单语音操作并做出“启动”、“退出”的操作命令。
关键词:语音识别;Ms Speech SDK;动态时间规整法

目录 - 4 -
第一章 绪论 - 6 -
1.1语音识别技术的目的及意义 - 6 -
1.2 课题的目的、任务及章节安排 - 6 -
2.1语音识别技术概念 - 7 -
2.2语音识别的历史研究背景 - 7 -
2.2.1 国外研究历史 - 7 -
2.2.2国内研究历史 - 8 -
2.3语音识别系统分类 - 8 -
2.4语音识别技术的发展趋势 - 8 -
第三章 语音识别技术的主要研究方法 - 10 -
3.1语音识别技术的基本原理 - 10 -
3.1.1 语音信号预处理 - 10 -
3.1.2 语音信号特征参数的提取 - 12 -
3.2语音识别技术的主要方法 - 13 -
3.2.1隐马尔科夫模型(HMM) - 13 -
3.2.2矢量量化技术(VQ) - 14 -
3.2.3动态时间规整法(DTW) - 14 -
第四章 基于Ms Speech SDK开发的语音模块 - 19 -
4.1 Ms Speech SDK 简介 - 19 -
4.2 Ms Speech SDK 的主要接口 - 19 -
4.3 Ms Speech SDK 工作原理 - 20 -
4.4 基于Ms Speech SDK开发的语音模块流程 - 21 -
4.4.1配置环境 - 21 -
4.4.2 编译实现 - 21 -
4.5 基于Ms Speech SDK开发的语音模块演示 - 22 -
4.5.1 语音模块说明书 - 22 -
4.5.2 语音模块功能演示 - 23 -
第五章总结 - 25 -
致谢 - 26 -
本科在读期间成果 - 27 -
参考文献 - 28 -

课题的目的、任务及章节安排
本次毕业设计所选的课题名称为:基于视觉分析的目标检测与简单行为分析研究与实现——语音模块。主要任务是通过对比Microsoft Speech SDK与动态时间规整方法(DTW)确定语音模块的建立使人能够通过自己的语音控制并命令程序,使其能够识别非特定人发出的简单语音,做到“启动”、“结束”等简单操作。其目的在于通过对Microsoft Speech SDK的学习与使用,基本理解语音识别技术的相关概念,与语音识别的工作原理,从而加深语音技术方面的相关知识。论文共分六个章节,各章节具体内容见下:
第一章 主要是阐述选题意义和背景;
第二章 描述语音识别技术的主要概念;
第三章 简要介绍语音识别技术的主要方法,重点介绍动态时间规整(DTW)算法原理及实现;
第四章 阐述Ms Speech SDK的工作原理、开发步骤以及实现结果;
第五章 总结,根据实验过程和结果,分析两种方法的特点并对此次毕业设计进行总结。

资料文件预览
共2文件夹,6个文件,文件总大小:964.13KB,压缩后大小:655.17KB
  • 毕业设计-基于视觉分析的目标检测与简单行为分析研究与实现——语音模块
    • 基于视觉分析的目标检测与简单行为分析研究与实现——语音模块
      • Microsoft Word文档基于视觉分析的目标检测与简单行为分析研究与实现——语音模块.doc  [941.00KB]
      • Adobe Acrobat可导出文档格式文件中期检查表.pdf  [3.64KB]
      • Adobe Acrobat可导出文档格式文件开题报告.pdf  [6.25KB]
      • Adobe Acrobat可导出文档格式文件成绩单.pdf  [2.49KB]
      • Adobe Acrobat可导出文档格式文件答辩记录单.pdf  [2.42KB]
      • Adobe Acrobat可导出文档格式文件进度报告.pdf  [8.33KB]
资料评论
注意事项
下载FAQ:
Q: 为什么我下载的文件打不开?
A: 本站所有资源如无特殊说明,解压密码都是www.xuehai.net,如果无法解压,请下载最新的WinRAR软件。
Q: 我的学海币不多了,如何获取学海币?
A: 上传优质资源可以获取学海币,详细见学海币规则
Q: 为什么我下载不了,但学海币却被扣了?
A: 由于下载人数众多,下载服务器做了并发的限制。请稍后再试,48小时内多次下载不会重复扣学海币。
下载本文件意味着您已经同意遵守以下协议
1. 文件的所有权益归上传用户所有。
2. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
3. 学海网仅提供交流平台,并不能对任何下载内容负责。
4. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
5. 本站不保证提供的下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
返回顶部