文:Priscilla Chan
每次写有关大数据的文章,都会有读者提出有关私隐保障的担忧。的确,在大数据被广泛应用以提高社会效率的同时,个人资料无可避免地更容易被监控及商品化。在这个大数据世代,我们应该如何保障自己的私隐?以下几个範畴,值得大家留意。
修图软件有不少朋友拍照必用修图软件,照片不美白修饰一下,不会放到社交媒体分享。除了P图,也有不少人喜欢用贴纸滤镜,把自己的脸转变成得意动物、或者加上闪亮特效等等。和一班朋友用滤镜软件拍照,一起变身白兔、绵羊,笑声不绝,的确是开心的。
然而,这一类使用人脸识别技术的软件,难免会有私隐方面的隐忧。一个人脸识别数据库假如有越多不同性别、年龄、种族、肤色的人脸图像,则越容易提升它的演算法準确程度。因此这些软件都会不停收集使用者的人脸图像,以优化它的数据库。
有不少软件,除了你的人脸图像之外,还会收集你的个人资料,例如手机型号、解像度、网络存取、本地 IP、GPS定位等等[1]。这些个人资料数据,在市场上有价有市。去年就有传媒报道,在互联网平台有人公然兜售「人脸数据集」,5,000多张的人脸照片,仅售十元人民币[2]。而包含姓名、身分证照片、银行咭,手机号码的人脸照片,则只需四元人民币一份[3]。
商业机构固然有兴趣利用各种个人资料数据优化他们的市场推广和广告投放策略。在非商业用途方面,利用大数据达到政治目的的例子,在世界各地也屡见不鲜,其中最广为人知的例子莫过于剑桥分析(Cambridge Analytica)利用在社交媒体收集到的个人资料数据以影响选民的投票意欲的案例[4]。
除了把收集到的个人资料善价而沽,软件公司还可以透过收集到的数据直接牟利。大陆的「跑步维生素」[5]和的「运动标籤」(Sportag)[6]均是透过人脸识别技术配对马拉松赛事的图片库和用户面貌,以快速搜寻跑手的照片。跑手可以选择下载有水印的照片,或者付费下载没有水印的原相,而出售照片的收入则由平台与摄影师摊分[7]。这类型的服务,的确给希望留个美好回忆的运动员带来了方便;然而也无可避免地,带来了私隐方面的疑虑。
去年政府推出智能灯柱的时候,曾经引起不少市民对个人私隐的担忧。假如你对人脸识别技术有保留的话,除了关注智能灯柱的各类用途外,也应该尽量减少使用修图软件,和其他採用人脸识别技术的应用程式,以减低自己的人脸数据被不同机构收集的机会。
社交媒体的照片标籤、心理测验和「老脸挑战」除了修图软件,假如你对人脸识别技术有忧虑,也应该尽量减少使用社交媒体的照片标籤(Tag)功能。需知道每次你在社交媒体上载自己和朋友的照片的同时,其实也透露了不少有关你的个人资料,包括所在地点、社交圈子、喜好甚至情绪等等。
以Facebook为例,经过十多年的累积,他们已经建立了具全球数一数二规模的人脸识别数据库。所以,每当我们上载和朋友聚会的照片,Facebook所建议的人脸照片标籤,都差不多百分百準确无误。作为用户,最低限度,你应该设定其他人必须得到你的同意才可以在他们上载的照片上标籤你。
千禧年前后出生的婴儿,被称为「数位原住民」(Digital native)。有别于X世代、Y世代,他们未曾见过没有互联网和社交媒体的世界,他们也是首个自出生以来被大数据记录一举一动的世代。外在的监控,我们或许不能完全避免。假如你身为家长,最少可以考虑减少上载自己孩子的照片(以及一时意气在社交媒体上因为孩子所发的牢骚),因为每一点一滴,都会成为孩子的数码足印,足以影响其他人对他的观感,甚至日后求学和就业的机会。
每隔一段时间在社交平台,都会出现一些令普罗大众趋之若鹜的小游戏。因为程式设计有趣,用户都乐意在平台分享,吸引更多朋友参加,造成一传十、十传百的「viral」效果。较早期比较流行的是各类型的心理测验。后来,因为「剑桥分析」被揭发透过在Facebook上推出一款免费心理测验,在未经用户许可的情况下盗用超过五千万用户的个人资料,甚至被质疑透过盗取得来的个人资料数据左右2016年的选举[8][9],备受各方质疑,Facebook在2018年就冻结了超过400个有问题的类似应用程式[10]。
前「剑桥分析」业务总监布特妮.凯瑟(Brittany Kaiser)在她最近出版的自传《操弄:剑桥分析事件大揭祕》(Targeted)就详细透露了民主国家的选民如何在社交媒体被找到、瞄準和改变的过程。[11]她举例说2016年的大选,剑桥分析为了要左右选民支持,其中一个方法,就是以大数据和心理分析找到不同的选民族群,继而给他们投放度身订造的选举广告,影响他们的投票取向。例如他们发现很多中间偏左的传统女性选民,其实都倾向保守派,对她们来讲,传统价值比政治理念和对个别参选人的支持更为重要。于是阵营推出了一个讽刺希拉里「连自己的家都管不好」(Can’t Run Her Own House)的影片,从而在不知不觉间影响了这批选民的投票意欲。
沉寂了一段时间,社交媒体前阵子又流行起使用人脸识别技术的小游戏,其中最受欢迎的非透过程式滤镜把人的面容变老的「老脸挑战」(Faceapp),一时间脸书上充斥着朋友们的「年老容貌」。这个在短时间内在社交平台上收集大量人脸数据的软件,被发现其开发商为一俄罗斯公司,总部设于圣彼得堡,令不少人对它收集数据的目的和用途产生疑虑,更引起了英美朝野的关注[12]。
都说「免费的才是最贵」。社交媒体上的免费心理测验和小游戏,都设计得好玩有趣,在博得用户一笑之余,更可以令社交圈的其他朋友都争相加入参与。回答几个无聊心理测验问题,或者上载一张近照,看似无伤大雅。但是,在大数据的範畴,看似风马牛不相及的互动,再加上用户在社交网站的一举一动,例如社交圈的人际脉络、贴文的措词、讚好我的专页、浏览的文章、观看的视频(包括观看的时间长短、有否看完完整视频),数据公司可以轻而易举地,分析出用户的喜好、消费模式、政治取向,继而在你不知不觉间,透过个人化的信息推送,尝试影响你的消费甚至政治判断。
以社交媒体帐号登入(Social login)有不少软件和网上服务,都有让用户使用他们的社交媒体帐号直接登入(Social login)这个选项。对用户来说,Social login的好处,当然是方便,可以使用一个帐号走天涯,不用多记不同的登入密码。
然而,方便往往都有代价。首先,用户在使用社交媒体帐号登入其他网上服务的同时,其实已经同时授予该网上服务访问其社交媒体的权限,甚至容许对方嵌入追蹤软件获取自己的个人资料,包括姓名、电邮地址、年龄、生日日期、社交网络等的信息。如前所述,有关个人资料,会被服务提供者利用以优化他们的市场推广策略,甚至直接向用户推送广告,或者调控个人化服务费用等[13]。
此外,假如用户的社交媒体被黑客入侵的话,所有使用该社交媒体登入的服务,都可能同时被骇。在2019年,就有网络保安公司在亚马逊的云端数据库上发现涉及5.4亿名Facebook用户的个人资料[14],让人轻易下载。
假如用户有使用其社交媒体登入其他网上服务的习惯,黑客在取得其的社交媒体登入资料后,亦可以登入他其他的网上服务从而获得大量个人资料。例如从Uber就可以知道用户日常的行程和经常出现的地点;在Airbnb、Expedia等旅游网站除了可以得知用户的旅游习惯之外,还有机会可以获得用户甚至其亲朋戚友的护照等旅游证件资料;在Tinder等等的交友网站,更加可以了解到用户在交友感情方面鲜为人知的一面⋯⋯
社交媒体和各类流动软件已经成为了我们生活的一部份。我们的行蹤、喜好、社交网络、消费,因为大数据科技日趋成熟,而以前所未有的速度被广泛地记录和分析。有说 “Data is the new oil”,当油价江河日下,数据的而且确越来越值钱。作为普罗大众,大趋势我们可能控制不了,但是最少要有警觉性,不要因为方便、得意、免费,而令自己的个人资料予取予携。
参考资料:
(更新:附官方回应)小心玩出祸!证据显示「美图秀秀」会将大量个人资料传送到大陆(Unwire) 5000张10元,你被贱卖的人脸照会不会被用来人脸支付?(钱江晚报) 5000张10元,你被贱卖的人脸照会不会被用来人脸支付?(钱江晚报) 「剑桥分析」事件是什么?一文搞懂免费心理测验背后的故事(数位时代) 跑步维生素 运动标籤 人脸识别技术快速配对 Sportag助跑手秒寻参赛靓相(Start Up Beat) 「剑桥分析」事件是什么?一文搞懂免费心理测验背后的故事 (数位时代) 剑桥分析、"非死不可"与微信:数据安全大风暴(BBC) Facebook移除一心理测验App 指涉不当分享用户数据(Topick) 专访前「剑桥分析」业务总监:只要脸书的生意继续,民主就有危机 (报导者) FaceApp爆红引发隐私疑虑 使用它可能付出什么代价(BBC) The Security Risks of Logging in With Facebook(Wired) Facebook 再爆洩私隐 逾 5 亿用户资料被存Amazon云端 轻易下载(立场新闻)文章获作者授权转载,作者网誌、Medium。