1. Why 推荐系统?

1)个性化信息检索 和 推荐系统

个性化信息检索是指根据用户的个性化特征,返回与用户需求相关的检索结果。技术主要包括用户建模、检索算法和个性化服务等。

推荐系统根据用户历史行为和偏好,向用户推荐个性化信息。技术主要包括用户建模、内容建模、协同过滤等。

个性化检索有着推荐的影子,比如在音乐搜索中“一个人的夜晚听什么歌”,在搜索结果中就需要结合用户兴趣推荐一些歌曲;在电商搜索中,搜“T恤”,不同用户对价格、品牌、材质等有不同偏好,这也需要推荐来满足。

2. Intro

提出模型:User Privacy Controllable Synthetic Data Generation model, 基于用户的喜好合成用户间的交互数据。它提供了特定的隐私保证的前提下,实现了最大化合成数据在数据层面和item层面的可用性。

3. Related Work

已有的隐私保护策略及其缺陷:Federated learning and Differential privacy; 他们只是在模型训练过程和结果收集的阶段进行了隐私保护,然而隐私泄露问题仍然存在于直接将用户交互数据共享给其他组织或者公开时。

此外,用户对不同的类型的隐私的保护意愿不同。比如对药品相关的隐私保护意愿强于日常用品。已有的方法忽视了这一点。

main idea

  1. 合成具有隐私保护性的数据,来代替原始数据,同时需要尽可能地保留原数据中的关键信息。

    利用合成数据来平衡数据可用性和隐私保护的有效性已经被验证,如:constructed the desired data by adding noise to the Fourier coefficients so that the original data could not be easily re-identified.

  2. 在数据层面,提出一个选择模块,用来选择哪些对用户的偏好影响较小的item; 在item层面,提出一个合成数据的生成模型,用来合成对应的item数据。

  3. 此外,提供了一个privacy-utility-trade-off 策略。

4. Proposed Model

问题定义:Given a dataset containing the real user-item interaction data, we aim to generate the synthetic interaction data under users’ privacy preferences。