当前,政府层级的数据处理面临的最大问题是:如何平滑的将数据从 A 迁移到 B。这不仅在不同领域之间带来了许多技术挑战,当政府开始“数据培训”时,这也成为一个复杂的法律问题,因为涉及到的服务器过多。如:数据经过 A,B,C 和 D 站,而 B 和 C 在法律上不允许看到 A 和 D 可以看到的所有数据。因此,存在复杂的过程来精确验证 B 和 C 的访问权限是什么,然后在将数据推送到 D 时重新整合它们的结果。一个明显的例子是低排放区(LEZ),LEZ 禁止在市中心或仅在特定条件下允许车辆行驶,因为它们散发出太多有害物质。在法兰德斯,车辆与自然人进入 LEZ 时,联邦信息检查车牌号与所有人是否进入到了指定区域;最终数据经过处理,并判断是否允许车辆在城市内通行。
「SoLiD」生态系统通过「公民自有数据存储柜(Personl Online Data,Pod)」 来解决上述问题,这样的好处是所有的公共和私人数据都存储在一个地方。每个机构都不需要在 A 和 D 之间移动数据,而是请求公民授权自己能查看哪些数据。这样,数据就不必到处移动,并且可以自动评估每个数据请求是否是 GDPR 合规的。在线上和线下控制我们的个人数据是一个趋势性主题,有大量研究在此领域。这里面的关键概念是人们可以选择将个人数据存储在何处,这些数据是去中心化存储的。与 SoLiD 技术相似的还有区块链技术,它通常也被认为是个人数据管理的解决方案。SoLiD 相较区块链的优势是天生是协议化的,不需要各方沟通就可以互相交换数据,而区块链不认识彼此各方达成的协议。区块链对于在没有中央银行或中央管理机构的情况下进行支付的情况下非常有效,比特币是一个成功的案例。区块链可以跨多个节点复制数据,如果你在不需要受信任的第三方时,可以计划使用区块链。如果你是核心参与者,或者各方之间相互信任, 那么你不需要区块链。而且,区块链的不变性意味着无法删除数据,这可能是一个挑战 GDPR 第 17 条赋予的人们删除其个人数据的权利。
重要的是,SoLiD 不是应用程序或平台,而是协议:开放的标准和约定。它基于现有的 Web 标准,包括 Linked Data 技术栈,任何人都可以实现他们。
论文推荐:SoLid 通过让公民控制自己的数据简化政府流程
图片 1. Current applications are a combination of app and data. Thereby, the app becomes a centralisation point, as all interactions with that data have to go through the app. By introducing the concept of a personal data pod, Solid pushes data out of applications, such that the same data can be managed with different applications. This removes the dependency on a centralised application, as data can be stored independently in a location of the citizen’s choice.
Data Pod 是个人存储柜,可以存在于 Web 上的任何位置,例如你自己搭建的服务器,社区搭建的免费服务器或政府提供的存储空间。在 Pod 中,所有者拥有数据创建、编辑、和控制管理的权限。所有者可以决定授予哪些人拥有权限,例如允许家庭成员看到他们的假期照片或允许同事阅读会议笔记。而且,人员、组织和应用程序可以向 Pod 的公共收件箱发布请求以获取对个人数据的访问权限。人们至少拥有一个数据柜,但他们还可以拥有其他多个 Pod,例如用于家庭数据、工作数据和医疗数据等。
而典型的中心化应用程序要求用户将数据存储在应用程序,SoLiD 通过使数据个人化来扭转这一局面,并允许用户授权哪些应用程序可以用我的数据。虽然简单的应用程序只需要一个 Pod,但 SoLiD 的真正功能在于让应用程序组合来自多个 Pod 的数据,这减少了很多数据对齐会产生的成本。例如,SoLiD 上的社交网络应用程序可以将个人信息(例如帖子、朋友、评论和喜欢的信息)存储在个人数据柜中,而他们的可视化需要组合不同数据 Pod 的数据。这解决了两个基本问题,首先,数据不再需要在不同的应用程序中复制,因为应用程序将指向单个副本。二是,不再出现同步问题:因为只有一个副本数据,应用程序不会再有不同步的数据。
为了我们的目的,SoLiD 精确地解决了上述“数据传输”问题。数据不再在不同的政府机构之间移动,每个政府机构都直接使用原始数据来源,即公民的数据柜。这解决了多个副本和同步的问题,以及 GDPR 问题,即哪个机构有权访问哪些公民的哪些数据。因为每个机构都单独对 Pod 进行请求,因此对 Pod 的读写是一个重要的话题,接下来我们会讨论这个问题。
4. 解决方案:使用 SoLiD 交换公民个人信息
在本节中,我们解释了使用 SoLiD 在公民和政府之间共享数据的方法。我们首先会解释需求, 之后我们会讨论两种场景, 在这两个场景中:(1)公民的数据(例如:电子邮件地址、电话号码)存储在 Pod 中;(2)重用权威政府数据,例如文凭等信息。
4.1 需求
对于我们的用例,我们假设所有公民都可以使用全局唯一的统一资源标识符(URI)(称为WebID)来唯一标识。该 WebID 指向有关公民的更多详细信息的,尤其是指向个人数据柜(Pod)。此外,我们假设所有政府部门和组织都具有 WebID 和 Pod。所需的组件 Fig2 所示。通常,SoLiD Pod 具有公共收件箱,任何人都可以在其中发布消息。然后消息只能由所有者读取、修改和删除。我们假定所有 Pod 都满足此约定,因为我们使用了此约定来保证用户之间的通信。
论文推荐:SoLid 通过让公民控制自己的数据简化政府流程
4.2 用例:公民共享个人信息
Flemish 政府开发了一种数字助理,可提供市民与不同政府部门互动。一个有用的例子是向公民提供有关公共服务状态的通知。由于大多数公民几乎没有与政府之间的互动,相比较与私营部门之间的互动, 联系信息以及有关其偏好的信息通常已经过时。用了 SoLiD 之后,角色互换了,市民的 Pod 成为主要联系信息和偏好的来源。该用例解决了第一个挑战, 避免了用户必须在各个公共和门户网站中保持其数据的最新状态。
我们使用电子邮件地址说明此用例,该用例适用于任何个人信息。
前提条件:公民爱丽丝(A)可以通过其 WebID 唯一标识,同时 A 在 SoLiD Server(S)上托管有一个个人在线数据存储(Pod)。同样,组织(O)具有一个WebID 和一个 Pod。
用例 1.1:共享个人数据。A 使用安全的令牌访问向 O 请求身份验证,成功通过身份验证后,A 可以通过网页按钮授权的形式授予 O 访问其电子邮件地址的权限,成功后,O 可以从 A 的 Pod 中读取电子邮件地址。拓展功能:若 A 不再信任 O,A 可以撤回 O 对她电子邮件地址的访问权限。
用例 1.2:管理个人数据。A 使用安全的另外访问 O 请求身份验证,身份验证成功后,A 可以在 O 提供的用户界面将其电子邮件地址添加到其自己的 Pod 中。扩展功能:A 可以修改或删除她的电子邮件地址。
用例 1.3:请求访问个人数据。O 将「访问 A 的电子邮件地址」请求发布到 A 的公共收件箱。看到此请求后,A 授予 O 读取对她电子邮件地址的访问权限,并将通知发送到O 的公共收件箱。收到通知后, O 可以查看 A 的电子邮件地址。
4.2 用例:公民授权权威个人信息
政府的目标是使公民能够重用存储在不同政府级别的权威数据源中的个人信息。比如,在申请新工作时共享大学颁发的文凭。或者在申请贷款时获得有关其收入的信息(如 Fig3 所示)。该用例解决了上文提到的第二个挑战。首先,公民不同意政府与其他人共享他们的数据,因此我们将公民的学位信息存储在公民自己的 Pod 中。换句话说,在 GDPR 的上下文中,数据主体是数据的控制者。这种情况表明,SoLiD 重塑了公民、其权威数据以及应用程序之间的关系。如果公民拒绝授权,则政府可以像今天在税收领域一样行使这项权利。
未来研究的新途径包括如何保持对用户权威数据(如住所)最大程度的利用。这应确保公民共享的信息与私营部门的关系始终是最新的。另一个明显的点是,这项研究旨在告知用户同意重用数据是他们的天赋人权。这个概念称为 “知情同意”。此外,所有操作都应透明地记录在 SoLiD Pod 中,包括:访问数据、修改数据、授权同意和撤销权利,这与我们银行帐户中的财产相当。这种细粒度和结构化的日志还可以通过使用机器学习算法来检测异常和数据泄露。为了更完整,未来的研究应该关注于不同的挑战,如如何打造可持续的商业模式。
SoLiD 建立在现有 Web 标准和方法上(例如关联数据和去中心化,因此 SoLiD 可以被视为过程创新,而不是技术创新),因此与 SoLiD Pod 的集成非常简单。我们已经使用电子邮件地址说明了这种简单度,但目的是将其扩展到所有个人数据。
Berners-Lee, T.; Verborgh, R. Welcome to Solid. (2019).
https://rubenverborgh.github.io/Solid-DeSemWeb-2018/#title Accessed 9 July 2019
Buyle, R., Van Compernolle, M., De Paepe, D., Scheerlinck, J., Mechant, P., Mannens, E.,
& Vanlishout, Z. Semantics in the wild: a digital assistant for Flemish citizens. In Proceedings of the 11th International Conference on Theory and Practice of Electronic Governance (pp. 1-6). ACM (2018). doi: https://doi.org/10.1145/3209415.3209421
Cruellas, J. C., Karlinger, G., Pinkas, D., & Ross, J. Xml advanced electronic signatures
(xades). W3C Recommendation (2003). http://www.w3.org/TR/XAdES Accessed 9 July
2019
Decker, C., & Wattenhofer, R. (2013, September). Information propagation in the bitcoin
network. In IEEE P2P 2013 Proceedings (pp. 1-10). IEEE.
de Montjoye, Y. A., Wang, S. S., Pentland, A., Anh, D. T. T., & Datta, A. On the Trusted
Use of Large-Scale Personal Data. IEEE Data Eng. Bull., 35(4), 5-8 (2012)
Esposito, C., De Santis, A., Tortora, G., Chang, H., & Choo, K. K. R. (2018). Blockchain:
A panacea for healthcare cloud-based data security and privacy?. IEEE Cloud Computing,
5(1), 31-37.
European Commission. Regulation (EU) 2016/679 of the European Parliament and of the
Council of 27 April 2016 on the protection of natural persons with regard to the processing
of personal data and on the free movement of such data, and repealing Directive 95/46. Official Journal of the European Union (OJ), 59(1-88), 294 (2016)
European Commission. Guidelines on Consent under Regulation 2016/679 Luxembourg:
Publications Office (2018) https://ec.europa.eu/newsroom/article29/itemdetail.cfm?item_id=623051 Accessed 9 July 2019
European Commission. It’s your data – take control. Luxembourg: Publications Office
(2018). https://ec.europa.eu/commission/sites/beta-political/files/data-protection-overviewcitizens_en.pdf Accessed 9 July 2019
Fatema, K., Hadziselimovic, E., Pandit, H. J., Debruyne, C., Lewis, D., & O'Sullivan, D.
Compliance through Informed Consent: Semantic Based Consent Permission and Data
Management Model. In Proceedings of the 5th Workshop on Society, Privacy and the Semantic Web - Policy and Technology (PrivOn2017), Vienna, Austria (2017)
Harrison, T. M., Pardo, T. A., & Cook, M. Creating open government ecosystems: A research and development agenda. Future Internet, 4(4), 900-928. MDPI AG (2012). doi:
https://doi.org/10.3390/fi4040900
Janssen, M., Charalabidis, Y., & Zuiderwijk, A. Benefits, adoption barriers and myths of
open data and open government. Information systems management, 29(4), 258-268 (2012).
doi: https://doi.org/10.1080/10580530.2012.716740
Jia, J., Jin, G. Z., & Wagman, L. The short-run effects of GDPR on technology venture investment (No. w25248). National Bureau of Economic Research (2018). doi:
10.3386/w25248
Mansour, E., Sambra, A. V., Hawke, S., Zereba, M., Capadisli, S., Ghanem, A., ... &
Berners-Lee, T. A demonstration of the solid platform for social web applications. In Proceedings of the 25th International Conference Companion on World Wide Web (pp. 223-
15
226). International World Wide Web Conferences Steering Committee (2016). doi:
https://doi.org/10.1145/2872518.2890529
Mun, M., Hao, S., Mishra, N., Shilton, K., Burke, J., Estrin, D., ... & Govindan, R. Personal data vaults: a locus of control for personal data streams. In Proceedings of the 6th International Conference on Emerging Networking Experiments and Technologies (p. 17).
Narayanan, A., Toubiana, V., Barocas, S., Nissenbaum, H., & Boneh, D. A critical look at
decentralized personal data architectures. arXiv preprint arXiv:1202.4503 (2012)
Pollock, R. (2011, March 11). Building the (Open) Data Ecosystem.
http://blog.okfn.org/2011/03/31/building-the-open-data-ecosystem/ Accessed 9 July 2019
Solid. Welcome to Solid (2019). https://solid.inrupt.com/ Accessed 9 July 2019
Van Kleek, M., & OHara, K. The future of social is personal: The potential of the personal
data store. In Social Collective Intelligence (pp. 125-158). Springer, Cham (2014)
Verborgh, R. Ruben Verborgh on data & privacy. Imec Magazine (2019).
https://www.imec-int.com/en/imec-magazine/imec-magazine-january-2019/back-to-thefuture-how-we-will-regain-control-of-our-personal-data Accessed 9 July 2019
Vescovi, M., Perentis, C., Leonardi, C., Lepri, B., & Moiso, C. My data store: toward user
awareness and control on personal data. In Proceedings of the 2014 ACM International
Joint Conference on Pervasive and Ubiquitous Computing: Adjunct Publication (pp. 179-