硕士论文-基于K最邻近的标签传播模型检测图像型垃圾邮件的研究,共68页,39320字,附实践报告书、答辩文稿等。
摘要
随着网络信息技术的日益普及和迅速发展,使用电子邮件进行交流,极大地满足了人与人之间的通信需求。但是,垃圾邮件作为互联网中具有争议的副产品,也愈演愈烈,尤其是图像型垃圾邮件(Image Spam),它不仅严重地浪费了资源,而且可能会阻塞和瘫痪网络,影响用户之间的正常沟通。因此,开发高效率的Image Spam检测技术是社会迫切需要的。
论文介绍了Image Spam检测技术的背景、目的和意义,阐述了Image Spam的定义、特征、构造方法、检测难点,分析了比较常用的Image Spam检测方法,并指出了这些方法的优势与不足,从而提出了基于K最邻近的标签传播模型(K-Labels Propagation Model,KLPM)的Image Spam检测方法。论文的主要工作和贡献是:
(1)提出了基于牛顿(Newton)稀疏表示的方法来消除图像的噪声:利用Newton法处理小波变换后的系数,使系数稀疏化。该方法能够在消除图像噪声产生影响的同时,尽可能多地保留图像的细节,从而提高检测方法的精度。
(2)提出了利用SURF算法来提取图像的尺度和旋转不变特征。该算法对图像旋转、仿射变换、尺度缩放等图像的变化都能保持一定的不变性和可区分性。
(3)提出了改进的均值聚类算法来聚类图像的特征,构成特征向量,计算图像之间的相似性,保证了图像之间的可比性。
(4)提出了标签传播模型分类器,基本思想是:将每幅图像视为一个节点,并打上标签,通过在完全连接图上传播标签,从而对测试图像进行分类。并在此基础上,改进了该分类器,从而设计了基于KLPM的Image Spam检测方法,基本思想是:先通过基于Newton稀疏法的消噪模型来预处理图像,再获取图像聚类中心点信息;然后提取所有图像的加速鲁棒性特征描述符信息,进行均值聚类;最后采用KLPM检测Image Spam。此外,通过实验比较了多种方法,证实了论文方法具有较好的分类效果。
关键词: 图像型垃圾邮件,牛顿法,稀疏表示,均值聚类,标签传播模型
目录
第一章 绪论 1
1.1 研究背景 1
1.2 研究目的与意义 2
1.3 研究内容与结构 3
1.3.1 论文的研究内容 3
1.3.2 论文的内容结构 4
第二章 图像型垃圾邮件检测方法的综述 5
2.1 图像型垃圾邮件的介绍 5
2.1.1 图像型垃圾邮件的定义 5
2.1.2 图像型垃圾邮件的特征 5
2.1.3 图像型垃圾邮件的构造 7
2.2 图像型垃圾邮件检测的挑战 9
2.3 图像型垃圾邮件的检测方法 10
2.3.1 基于分类算法的检测方法 11
2.3.2 基于垃圾邮件位置的检测方法 12
2.3.3 基于图像特征的检测方法 13
2.4 本章小结 15
第三章 基于Newton稀疏表示法的图像消噪 16
3.1 图像噪声 16
3.1.1 噪声模型 16
3.1.2 噪声特性 17
3.1.3 图像质量的评价方法 18
3.2 传统的图像消噪方法 19
3.3 稀疏表示的理论 20
3.3.1 稀疏表示的理论背景 21
3.3.2 稀疏表示的理论基础 21
3.4 基于稀疏表示法的图像消噪 23
3.5 基于Newton稀疏表示法的图像消噪 25
3.5.1 Newton法的理论介绍 25
3.5.2 基于Newton法的消噪模型 26
3.5.3 基于Newton法的消噪算法 27
3.5.4 实验结果与分析 27
3.6 本章小结 28
第四章 基于标签传播模型的图像型垃圾邮件检测 29
4.1 图像的特征提取与处理 29
4.1.1 提取图像特征 30
4.1.2 优化图像特征 34
4.2 标签传播模型的研究 35
4.2.1 标签传播的思想 35
4.2.2 构建标签传播模型 36
4.2.3 标签传播的可行性 38
4.3 实验与讨论 39
4.3.1 实验评价指标 39
4.3.2 实验数据集 40
4.3.3 实验与结果分析 40
4.4 本章小结 41
第五章 基于KLPM的图像型垃圾邮件检测 42
5.1 图论基础 42
5.2 基于K最邻近的标签传播模型检测方法的研究 43
5.2.1 构建K最邻近的标签传播模型 44
5.2.2 基于KLPM的图像型垃圾邮件的检测方法 45
5.2.3 图像标签的获取 47
5.3 实验与讨论 47
5.3.1 KLPM中K值的确定 48
5.3.2 基于KLPM的方法与其他方法的比较 49
5.4 本章小结 52
第六章 总结与展望 54
6.1 论文完成的工作 54
6.2 未来的研究方向 55
参考文献 56
附录1 攻读硕士学位期间撰写的论文 59
附录2 攻读硕士学位期间申请的专利 60
致谢 61
资料预览图片: