协同信息披露

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
千伏电压讨论 | 贡献2022年6月18日 (六) 18:53的版本 →‎基本条件
跳到导航 跳到搜索

协同信息披露(协同披露)是一种保证完美样本隐私的数据披露技术,因为它揭示了整个数据集的特征,但不涉及其任何组成元素。协同信息披露的目标和普通信息披露相同,都是要推断数据集的统计信息和潜在特征,不同的是它既能提供隐私又能提供实用性,同时又不会违反与数据隐私相关的条件和要求。


整个过程为了避免数据集的信息在统计信息和潜在特征时泄露,生成了一个与数据集整体相关,但与个体数据信息完全独立的中间量,通过中间量同样可推理出数据分析想要的结果,但不会暴露个体信息的隐私。该过程中,将中间量与结果统计信息的最优互信息定义为协同披露信息量,作为协同披露的度量方法。

历史

数据披露(Data Disclosure)

数据披露主要是指数据持有者、收集者以某种形式,把数据反映的相关的信息,向社会公众公开披露的行为。数据披露是让数据背后的信息与使用者连接的桥梁。


例如:投资者和社会公众对上市公司数据信息的获取,主要是通过大众媒体阅读各类临时公告和定期报告。投资者和社会公众在获取这些数据信息后,可以作为投资抉择的主要依据。公告和报告就可以认为是数据批量的一种途径。

真实、全面、及时、充分地进行数据披露至关重要,只有这样,才能使数据真正发挥价值,让背后的潜在信息对个人甚至社会,产生有效地帮助。

数据隐私(Data Privacy)

数据隐私(data privacy)是2018年公布的计算机科学技术名词。可以定义为:

(1)数据中直接或间接蕴含的,涉及个人或组织的,不宜公开的,需要在数据收集、数据存储、数据查询和分析、数据发布等过程中加以保护的信息。

(2)保护数据隐私的能力,通常采用数据匿名化、数据扰动、数据加密、差分隐私等技术。

协同信息披露就属于要在保障数据隐私的同时,完成数据披露的一个重要手段。

基本条件

原始数据集用$T_*=\min\{T, X_{k:n}\}$表示,其中表示组个体数据,统计信息和潜在特征用集合表示,中间量用表示。