您现在正在浏览:首页 > 论文 > 计算机 > 毕业论文-基于k-匿名的隐私泄露检测算法(K-Q算法)

免费下载毕业论文-基于k-匿名的隐私泄露检测算法(K-Q算法)

  • 资源类别:论文
  • 资源分类:计算机
  • 适用专业:计算机电子与信息工程
  • 适用年级:大学
  • 上传用户:xuehai
  • 文件格式:word
  • 文件大小:649.72KB
  • 上传时间:2013-8-13 0:50:21
  • 下载次数:0
  • 浏览次数:0

安全检测:瑞星:安全 诺顿:安全 卡巴:安全

资料简介

毕业论文-基于k-匿名的隐私泄露检测算法(K-Q算法),共36页,15169字
摘要
在一些开发性较强的用户平台如社交网络,微博平台等,用户数据往往是公开的,任何注册用户甚至匿名用户都可以直接查看这些数据,如果不采取一定的措施来防止潜在的隐私泄露,将会造成敏感数据的泄露,从而危害到数据的发布者甚至整个平台。传统的隐私保护手段主要是对单次发布的数据进行一定的泛化和抑制来保证用户数据的发布的安全性,同时也保证了其一定的可用性,如隐藏掉某个字段或对某个字段进行归一化等。但这些方法只能保证当前查询的输出没有泄露隐私数据,并不能保证它的输出和已有的发布数据进行联合分析时没有隐私泄露的可能,而这正是共谋欺诈和推理攻击技术所带来的隐私泄露。面对海量查询和数据,现有的系统往往无法辨别出查询历史中的哪些查询是可能造成敏感数据泄露的,因为这些数据窃取行为和用户的正常访问行为并无二义,超出了传统信息安全领域所理解的范畴。
对开放性极强的数据共享平台上的海量数据和大量查询,防止推理攻击而造成的间接性隐私泄露一直是隐私保护领域的研究重点,已有工作需要耗费较大的系统资源来维护整个查询历史及其结果,无法同时保证检测代价的最小化和查询响应的低延迟。要快速的输出查询结果,必须要及时对当前查询的输出和所有相关历史查询输出进行联合计算,而这显然需要耗费较大的时间(计算代价)和空间(存储历史查询输出的代价),特别是在海量查询的情况下。针对这一问题,本文提出了一种基于k-匿名的隐私泄露检测算法(K-Q),K-Q算法只需耗费较少资源维护查询输出的KData以及查询历史构成的KGraph即可保证推理攻击的实时检测。在真实数据集上的实验,证明了K-Q算法在检测准确率和内存消耗上明显优于已有的相关元组的推理检测算法。
关键词:K-匿名;数据共享平台;隐私泄露检测;推理攻击
中图分类号:TP3

目录
指导小组成员名单 0
目录 1
摘要 2
Abstract 3
第一章 绪论 4
1.1. 引言 4
1.2. 本文工作 6
1.3. 本文组织结构 7
第二章 相关工作及研究背景 8
2.1 推理攻击与隐私保护 8
2.1.1推理攻击方法 9
2.1.2 推理攻击的防御 10
2.2 匿名和泛化 10
第三章 隐私泄露检测和查询结果泛化 11
3.1 问题描述和相关定义 11
3.2 系统框架介绍 12
3.3 K-Q算法 13
3.3.1 KData 13
3.3.2 KGraph 14
3.3.3 泄露检测算法 K-Q 15
3.3.4 匿名和泛化 17
第四章 实验 19
第五章 总结和将来工作 21
参与文献 22
攻读学位期间作者的研究成果 24

本文工作
 在本文中,我们的工作主要包括两大部分,一个是对新的查询进行即时隐私泄露检测,模拟推理攻击检测现有查询是否会某个或多个历史查询构成一个攻击组合从而间接泄露隐私数据;另一个是在检测到隐私泄露后如何对当前查询结果进行泛化和匿名,保证查询结果的可用性和推理攻击的避免。下面分别对这两个部门进行总体描述。
 如何在新的查询到来时就能及时计算出检测结果,需要对新查询的输出数据和历史相关查询的输出数据进行链接分析以保证查询没有违背系统设置的隐私标准。在查询较少的情况下,我们可以及时的去数据库取出数据或预先进行缓存,但当用户基数较大,查询较频繁时采用这些手段必将极大地增加响应延迟,但是没有历史查询的输出数据进行联合分析是无法保证检测结果的准确性的。
 通过研究发现,链接分析的结果是一份新的数据集D,该数据集的结构为所有参与链接分析的数据集的结构的并集,从而问题简化为判断数据集D是否泄露了敏感数据,而这时根据K-匿名算法就可以得出结论。而K-匿名算法的计算往往只需要标识符集下的数据集合的计数,并不要完整的数据集,因此本文提出了一种基于K-匿名模型的概要结构KData来对单次查询的输出进行归纳,KData主要存储的就是各标识符集下的数据集合的计数,该信息相对于完整的数据集占很小的比例,本文通过实验进行了验证。该归纳信息既避免了存储所有的数据记录,也保证了链接分析的可行性。
 同时链接分析涉及到与当前查询相关的历史查询输出的联合计算,因此有必要维护历史查询之间的结构关系。本文提出的图状结构KGraph就是对各个历史查询节点之间关系的维护,各个节点存储的就是KData,每条边表示两个查询之间是可以链接分析的,主要体现为拥有相同的字段集合。
 在此基础上形成了基于KData和KGraph的实时检测算法K-Q, 该算法可以很好地平衡查询响应的低延迟和隐私泄露检测的实时性,对已有的工作如[8-10]进行了有效的改进,最后通过多个实验证明了该算法的有效性。
 最后,根据K-Q算法的输出结果和预先配置的隐私策略来对当前查询的输出进行一定的泛化和抑制以避免推理攻击的存在,从全局角度了保证了数据的安全,同时没有对用户的访问行为作过多的干扰,确保了服务的一致性。由于泛化和抑制的结果会作为后续查询到来时进行检测分析的输入,因此本文在已有的泛化和抑制的方法上结合K-Q算法进行了改进,保证了算法的一致性。
本文组织结构
本文共分为五章,下面是余下各章的简介。
第二章介绍本文的相关工作及研究背景。首先对防止推理攻击的隐私保护工作进行了介绍,主要从防御手段和算法优劣等方面来展开;其次对k-匿名系列算法进行了回顾,描述了对发布数据进行匿名和泛化的相关研究;
第三章描述了本文的主要工作。
第四章介绍了针对本文工作所进行的实验。
第五章总结了本文的研究工作。我们回顾了本文的主要贡献,并展望了将来进一步的工作。

资料文件预览
共1文件夹,1个文件,文件总大小:674.05KB,压缩后大小:649.72KB
  • 毕业论文-基于k-匿名的隐私泄露检测算法(K-Q算法)
    • Office 2007以上版本的Microsoft Word文档毕业论文-基于k-匿名的隐私泄露检测算法(K-Q算法).docx  [674.05KB]
下载地址
资料评论
注意事项
下载FAQ:
Q: 为什么我下载的文件打不开?
A: 本站所有资源如无特殊说明,解压密码都是www.xuehai.net,如果无法解压,请下载最新的WinRAR软件。
Q: 我的学海币不多了,如何获取学海币?
A: 上传优质资源可以获取学海币,详细见学海币规则
Q: 为什么我下载不了,但学海币却被扣了?
A: 由于下载人数众多,下载服务器做了并发的限制。请稍后再试,48小时内多次下载不会重复扣学海币。
下载本文件意味着您已经同意遵守以下协议
1. 文件的所有权益归上传用户所有。
2. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
3. 学海网仅提供交流平台,并不能对任何下载内容负责。
4. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
5. 本站不保证提供的下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
论文相关下载
返回顶部