数据挖掘：隐私保护与价值挖掘的度如何把握？

作者：吴俊宇责任编辑：甄清岚 2017.05.15 07:01 来源：通信世界网

2016年，iPhone用户数据泄露、LinkedIn超1.67亿个账户被销售等事件，敲响了大数据安全隐私保护的警钟。当时，LinkedIn1.67亿个账户中有1.17亿个账户信息同时包含电子邮件和密码。而且更值得关注的是，互联网公司也在深入挖掘用户数据背后的价值。

大数据价值显现 数据安全存隐忧

大数据的价值是显而易见的。当样本的数据量“达到某个拐点时，一切都变了”，统计学上的意义便凸显出来。但是，对于更多数据的获取，尤其是像基因等私人敏感的数据，由于各种原因，对于这些被研究者来说已经成为一个巨大的挑战。知识挖掘、机器学习、人工智能等技术的研究和应用使得大数据分析的能力越来越强大，同时也对个人隐私的保护带来了更加严峻的挑战。

一些大型的互联网公司能够将大量数据结合在一起，从而构造出某个人清晰的行为图谱，进而预测他们的偏好与行为。这些数据在消费者市场上非常有价值，能够精确地向确定的人群主动推送某些产品或者服务。

不幸的是，进入移动互联网时代，更多的个人数据每天在产生和曝光，但数据安全性却无从保障。

中国互联网协会发布的《2015中国网民权益保护调查报告》显示，78.2%的网民个人身份信息被泄露过，63.4%的网民个人网上活动信息被泄露过，网民因个人信息泄露、垃圾信息、诈骗信息等现象导致的总体损失约为805亿元。

2016年据媒体报道称，个人乘坐飞机的记录，还有通信运营商的数据、银联的数据，大都可以通过黑市买到。而且电商平台购物导致个人信息被贩卖，如何追究平台责任和卖家责任，法律并不清晰，而且很难取证。

除此之外，企业对于数据的使用目前也很难有所约束。因为用户的身份、地址、联系方式等信息目前都掌握在互联网公司手中，但与这些数据每天打交道的人到底要如何使用数据以避免隐私泄露，是一个非常值得思考的问题。

保护数据安全 需技术与法律并行

针对上述数据泄露导致的安全问题，目前业内已经出现了一些解决方案。尤其是在约束数据使用上，已经有不少互联网公司正在采用数据“脱敏”技术。

数据“脱敏”是指对某些敏感信息通过“脱敏”规则进行数据的变形，实现敏感隐私数据的可靠保护。在涉及客户安全或者商业机密的情况下，在不违反系统规则的条件下，对真实数据进行改造并提供测试使用，如身份证号、手机号、卡号、客户号等个人信息都需要进行数据“脱敏”。

数据“脱敏”的确可以让数据使用更为健康，即当个人信息与某个具体的人或者设备相关联时，一些隐私保护技术可以设法去除数据与个人身份之间的连接，同时，另外一些技术在努力把这些断开的连接复原。当知道一个人所关联的一些信息，就可以从不包括其个人识别信息的数据中推断出这个人的身份标志。

当然，除了上述技术外，法律层面上也需要对数据的使用进行规范。

万维网的发明者Tim Berners-Lee教授就曾认为，“斯诺登事件”之后，人们对互联网的隐私保护问题越来越关注，政府和一些大公司对在线活动的控制，使得互联网的开放性和独立性受到了严重威胁。为此，他呼吁制定一个权利法案，以保护互联网的独立性，并确保用户隐私不受侵犯。

2012年3月，欧盟也提出了相应的法规，《数据保护法规》(TheDataProtectionRegulation)。违反数据保护条例处罚最高可达公司全球营业额的4%，即对于谷歌这样的科技巨头而言，一旦处罚将会是几十亿美元。这一法规在去年已经审议通过，而且在两年内将 GDPR 条款转置成欧盟成员国法律，并将于 2018 年生效。

不过，有关互联网隐私数据的相关法律目前在国内还处于模糊状态。相比欧美在法律上对于数据与隐私的保护，在我国的法律中仅提及“公民的个人数据不得非法搜集、传输、处理和利用”，但我国《民法通则》并未将隐私权作为一项独立的人格权加以保护，所以隐私权方面，我国的立法暂时较为不明确。不过，随着互联网公司与用户信息的碰撞，未来还会出现更多现实案例，而国内法律也会在这种碰撞中逐渐完善。

通信世界网版权及免责声明:

1、凡本网注明“来源：通信世界全媒体”及标有原创的所有作品，版权均属于通信世界网。未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载我方内容的单位，也必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和本站来源。
2、凡本网注明“来源：XXX（非通信世界网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。

发表评论请先登录

发表评论

评价

共0条评论

...

热点文章

...

技术文章

...

会议活动

...

通信世界电子刊