拉普拉斯分布的特征函数推导,拉普拉斯分布概率密度函数

  拉普拉斯分布的特征函数推导,拉普拉斯分布概率密度函数

  在最近的差分隐私研究中,首先用java实现了mhdjm分发,并制作了Hive交互接口。后来我用python画图,准备做一个非交互的数据发布。

  我简单介绍一下差分隐私的原理。苹果用它来实现信息安全。这里有一个例子来帮助理解。考虑一个医疗数据场景:

  上图显示了一个医疗数据集D,其中的每条记录都表明了一个患者是否患有癌症。当数据集发布为科研数据或社会调查时,他只为用户提供前n行的统计查询服务。这里选择了count query,用count (n)表示前n行有多少人得了癌症。

  这里攻击者A知道Jack排在第三行(医疗数据记录一般是按照一定的顺序排列的,比如身份证号等。),而且由于不能直接访问D(注意D只提供count (n)查询服务),A一开始并不知道Jack的第二列属性值是否为1,但是A可以通过下面的攻击获取Jack的个人隐私信息(是否患有癌症):count(3)-count (2)。

  那么在这种情况下差分隐私技术是如何保证信息安全的呢?我们可以把删除Jack的数据集(或修改)看作D’,要求A根据D’得到的计数值的概率分布与D’得到的相似。假设count (3)的输出可能来自{1.5,2},那么count(2)以近似概率输出{1.5,2}中的任意值,拉普拉斯机制可以实现这个功能。-DP的值用于控制概率分布的相似性。当它更小时,exp()更接近于1。

  Mhdjm分布图:

  代码就不说废话了,java代码:

  【java】查看纯文本import org . Apache . commons . math 3 . distribution . laplace distribution;doublelaplaceMechanismCount(longrealCountResult,double epsilon){ LaplaceDistributionld=newLaplaceDistribution(0,1/epsilon);double noise=LD . sample();returnrealCountResult噪音;} python代码:

  [python]查看纯文本importnumpyasnploc,scale=0。1.s=np.random.laplace (loc,scale,1) ss=s [0] printss其中和scale调整保护的大小。

拉普拉斯分布的特征函数推导,拉普拉斯分布概率密度函数