更改

添加753字节 、 2022年6月19日 (日) 21:33
无编辑摘要
第2行: 第2行:       −
整个过程为了避免数据集的信息在统计信息和潜在特征时泄露,生成了一个与数据集整体相关,但与个体数据信息完全独立的中间量,通过中间量同样可推理出数据分析想要的结果,但不会暴露个体信息的隐私。该过程中,将中间量与结果统计信息的最优互信息定义为协同披露信息量,作为协同披露的度量方法。
+
整个过程为了避免数据集的信息在统计信息和潜在特征时泄露,生成了一个与数据集整体相关,但与个体数据信息完全独立的中间量,通过中间量同样可推理出数据分析想要的结果,但不会暴露个体信息的隐私。该过程中,将中间量与结果统计信息的最优互信息定义为协同披露信息量,作为协同披露的度量方法。<ref name=":0">Rassouli, B. ,  Rosas, F. E. , &  Gunduz, D. . (2019). Data disclosure under perfect sample privacy. IEEE Transactions on Information Forensics and Security, PP(99), 1-1. </ref><ref name=":1">Rassouli, B. , Rosas, F. , & Gunduz, D. . (2018). Latent Feature Disclosure under Perfect Sample Privacy. ''2018 IEEE International Workshop on Information Forensics and Security (WIFS)''. IEEE.</ref>
    
==历史==
 
==历史==
第13行: 第13行:       −
真实、全面、及时、充分地进行数据披露至关重要,只有这样,才能使数据真正发挥价值,让背后的潜在信息对个人甚至社会,产生有效地帮助。
+
真实、全面、及时、充分地进行数据披露至关重要,只有这样,才能使数据真正发挥价值,让背后的潜在信息对个人甚至社会,产生有效地帮助。<ref name=":0" /><ref name=":1" />
    
===数据隐私(Data Privacy)===
 
===数据隐私(Data Privacy)===
第34行: 第34行:       −
由于<math>W</math>可以通过<math>X</math>直接数据披露产生,故可以定义,<math>W</math>对于<math>X</math>有马尔可夫依赖。由于<math>Y</math>是从数据集<math>X</math>中变化产生,故<math>Y</math>对<math>X</math>也存在马尔可夫依赖。因此可以用,<math>p_{W|X}</math>和<math>p_{Y|X}</math>两个条件表示<math>W</math>对<math>X</math>,<math>Y</math>对<math>X</math>的映射关系。这样<math>W-X-Y</math>就可以构成一条马尔科夫链。
+
由于<math>W</math>可以通过<math>X</math>直接数据披露产生,故可以定义,<math>W</math>对于<math>X</math>有马尔可夫依赖。由于<math>Y</math>是从数据集<math>X</math>中变化产生,故<math>Y</math>对<math>X</math>也存在马尔可夫依赖。因此可以用,<math>p_{W|X}</math>和<math>p_{Y|X}</math>两个条件表示<math>W</math>对<math>X</math>,<math>Y</math>对<math>X</math>的映射关系。这样<math>W-X-Y</math>就可以构成一条马尔科夫链。<ref name=":0" /><ref>Rosas FE, Mediano PAM, Jensen HJ, Seth AK, Barrett AB, Carhart-Harris RL, et al. (2020) Reconciling emergences: An information-theoretic approach to identify causal emergence in multivariate data. PLoS Comput Biol 16(12): e1008289.</ref>
    
=== 中间量与数据集个体数据的独立性 ===
 
=== 中间量与数据集个体数据的独立性 ===
第40行: 第40行:  
<math>p_{Y|X}</math>是中间量<math>Y</math>关于数据集的映射,表示由于<math>Y</math>是从数据集<math>X</math>中变化产生。由于中间量可推理出数据分析想要的结果,但不会暴露个体信息的隐私,故我们需要定义<math>Y\perp X_{i}, \forall i=1,...,n</math>,这里<math>\perp</math>表示相互独立,在信息论中可以用互信息为0表示,即<math>I(Y,X_i)=0</math>。
 
<math>p_{Y|X}</math>是中间量<math>Y</math>关于数据集的映射,表示由于<math>Y</math>是从数据集<math>X</math>中变化产生。由于中间量可推理出数据分析想要的结果,但不会暴露个体信息的隐私,故我们需要定义<math>Y\perp X_{i}, \forall i=1,...,n</math>,这里<math>\perp</math>表示相互独立,在信息论中可以用互信息为0表示,即<math>I(Y,X_i)=0</math>。
   −
所有可产生<math>Y</math>满足<math>Y\perp X_{i}, \forall i=1,...,n</math>的映射<math>p_{Y|X}</math>,可以写成一个集合<math>\mathcal{A}=\{p_{Y|X}|Y\perp X_{i}, \forall i=1,...,n\}</math>。
+
所有可产生<math>Y</math>满足<math>Y\perp X_{i}, \forall i=1,...,n</math>的映射<math>p_{Y|X}</math>,可以写成一个集合<math>\mathcal{A}=\{p_{Y|X}|Y\perp X_{i}, \forall i=1,...,n\}</math>。<ref name=":0" />
    
=== 中间量与所需指标的非独立性 ===
 
=== 中间量与所需指标的非独立性 ===
<math>W</math>与<math>X</math>直接可以产生协同披露,还需要满足<math>I(W,X)\ne 0</math>,即中间量要和所需要的指标与潜藏信息存在关联,若<math>W\perp Y</math>,则通过<math>Y</math>无法判别出任何<math>W</math>的信息。若无法产生任何满足条件的中间量 ,那么协同披露也无法完成。
+
<math>W</math>与<math>X</math>直接可以产生协同披露,还需要满足<math>I(W,X)\ne 0</math>,即中间量要和所需要的指标与潜藏信息存在关联,若<math>W\perp Y</math>,则通过<math>Y</math>无法判别出任何<math>W</math>的信息。若无法产生任何满足条件的中间量 ,那么协同披露也无法完成。<ref name=":0" />
    
== 协同信息披露的度量方法 ==
 
== 协同信息披露的度量方法 ==
第53行: 第53行:       −
表示在所有<math> \mathcal{A}=\{p_{Y|X}|Y\perp X_{i}, \forall i=1,...,n\} </math>中的映射<math> p_{Y|X} </math>所产生的<math>\displaystyle{ Y }</math>中,寻找与<math> W </math>的最大互信息,该互信息被称为协同披露信息量。
+
表示在所有<math> \mathcal{A}=\{p_{Y|X}|Y\perp X_{i}, \forall i=1,...,n\} </math>中的映射<math> p_{Y|X} </math>所产生的<math>\displaystyle{ Y }</math>中,寻找与<math> W </math>的最大互信息,该互信息被称为协同披露信息量。<ref name=":0" />
    
== 协同披露的性质 ==
 
== 协同披露的性质 ==
92

个编辑