微文吧

公众号

虚假新闻的数字侦探:用技术围猎谎言

- 全媒派© - 阅 51
米小巴,免费电商小程序

封面

如果这个时代还有“侠”,那乔纳森(Jonathan Albright)或许可以算一个。他不是记者,也不是程序员,当然,也不是传统媒体科学家,但他又是三种身份的结合体——一个学术名声在外、会破解数据、会爆料独家消息的,不知疲倦的网络侦探。本文来自微信公众号:全媒派(ID:quanmeipai),作者:Medium,原文标题:《遇见虚假新闻的数字侦探:非科班出身的我如何用技术围猎谎言》。



《连线》杂志发布了一篇人物特稿,讲述了一个非科班出身的独行侠乔纳森,如何成了揭露数字骗局的大侦探。


 2018年,佛罗里达的道格拉斯中学发生一起枪击案,17人死亡,其中多数是青少年。本是一场骇人的噩梦,不曾想,网络很快被指责和阴谋论占据。极端保守主义的YouTube创作者如艾利克斯(Alex Jones),称这些幸存的学生都是请来做戏的,目的是为“控枪法案”助力。短短一周,这些阴谋论视频在艾利克斯及其支持者的推动下,迅速蹿升至YouTube热门页(Trending)


本来只是互联网上某一角落的内容,竟然能迅速爬升至YouTube首页。惊讶于阴谋论的传播速度,乔纳森,哥伦比亚大学Tow数字新闻中心的调查总监,试图找到互联网的信息传播路径。


在美国人民急于得知互联网用户如何被操控之时,乔纳森正好有话想讲。随着中期选举临近,他正在抢占先机。


艾利克斯的视频登上热门后的那个周末,乔纳森独自待在曼哈顿北角的工作室里,彻夜在YouTube的阴谋论漩涡里追踪,视频跳转一个接一个,他成功收集近9000条数据。


周日,他在Medium上发布了调查结果《不真实的YouTube:变现了悲惨与虚假》,文中写道:“欢迎来到2018,几亿次点击造就文化反乌托邦的时代。”文章在周一登上了BuzzFeed News头条,也被收入《纽约时报》和《华盛顿邮报》。《连线》在周四见到他时,他正在猛喝一杯超强咖啡,以提神醒脑。


按照乔纳森的习惯,一旦有了新发现,他一定会迅速在Signal和Twitter上给记者发上一长串消息,包含了截屏、网页、结果判定的摘要,所有这些都是他单打独斗找到的证据,证实了信息被扭曲、被传播的过程。这也是乔纳森过去一年的做事习惯:半夜给记者发送一条大新闻,看起来疯狂,但有巨大价值。这价值的前提是,你得赶快扑上去,在他失去耐心将其公之于众之前。


所以,当乔纳森已经在科技圈掀起了不小的水花后,我以为可以见到一个如《国土安全局》中CIA官员的角色,或许乔纳森的家里应该贴满了扎克伯格、班农、普京的照片吧。最起码,应该是博士后们坐开几排,敲打着键盘,做出无数表格以供乔纳森取用吧。


《国土安全局》剧照


并非如此。


乔纳森的办公室,如果可以这么说的话,坐落在哥伦比亚大学新闻学院地下室,里面有一个闷热又阴暗的储藏室。见面当天,他穿了一件领间有扣的红白蓝相间的衬衣,下身是一条卡其色裤子,看上去比实际年龄小了十几岁,不像是已经40。他蹬着一双登山靴,似乎从一年多前从北卡罗来纳州搬来纽约后便没怎么穿过。


房间的一个洞里,两条塑料管塞进了一个蓝色的垃圾箱,这是为了防止水管渗漏毁了他的电脑所做的暂时举动。同事那一侧贴了照片,桌上摆满了书,房间看起来明亮了些。乔纳森这边几乎空空如也,只有一个取暖器和三个行李箱,看起来像是随时准备启程,赶往下个国外讲座。墙上的人造窗户开向了另一面的地下室,在乔纳森看来,这里如地狱一般。


但是,忽略这里简陋的环境,只有一台笔记本电脑,乔纳森立刻变身侦查数字犯罪的大侦探。他是去年十月《华盛顿邮报》曝光俄罗斯操纵Facebook用户的爆料者,也是《纽约时报》陈情俄罗斯利用假身份掀起美国网民民愤的研究贡献者。甚至早在大多数人知道剑桥分析(Cambridge Analytics)——这个声名狼藉、业已小时的数据公司的名字之前,他就在Github中发现了剑桥分析工具。


无数个挖掘数据的不眠之夜成就了乔纳森,记者们从这里搞懂科技巨头们巨大又不受控的力量从何而来,他成了一块宝贵的源泉,取之不竭。但他不是记者,也不是程序员,当然,也不是传统媒体科学家,但他又是三种身份的结合体——一个学术名声在外、会破解数据、会爆料独家消息的,不知疲倦的网络侦探。


今年初,乔纳森在Medium上发布的emoji表情新闻入围了数据新闻奖,而和他同期入围的,还有老牌媒体如FiveThirtyEight和彭博社。



“他呀,就是大学地下室里的典型人物,一心只想把一件事凿裂了,打开了。”新学院媒体设计教授大卫(David Carroll)如是说。因为此前发表对Facebook的批评,大卫和乔纳森成为了同盟。


但乔纳森可不止于此。当下的科技行业本能地强调积极效应,暴露的问题却不只是华而不实,更有危险藏于冰山之下,他像一个新生物,正好诞生于此刻。不少一度被褒奖为创造了现代世界的公司如Facebook和谷歌,如今也越来越多被指出其华服之下包裹的剧毒。早在硅谷和华盛顿危机初现时,乔纳森已经明白,科技改变了媒体,网络公共话语的研究将会成为当下世界最重要的课题。


在某种程度上,吸引大众的注意力是比较容易的。想知道真相的人越来越多,乔纳森恰好可以告诉他们。但问题是,正如乔纳森的洞察一样,真相来得太晚了——俄罗斯圣彼得堡的人已经操纵美国大选多年。提高民众意识,他只能做到这么多。随着中期选举临近,2020年选举在即,提前预知下一步总是很重要。


“任何事都不会有结局,不过,只要我们对这套生态有更多了解,我们就能知道如何解决。”


但问题在于:在事情变坏之前,有人愿意听他的吗?


这些,我以前从来没想到过


长久以来,乔纳森的研究无人在意,直到某个瞬间,竟然人人都关注了起来。乔纳森的早期项目之一是研究记者如何使用话题符号#。项目被拒绝了,“被每一家杂志拒绝”,“在和政治挂钩之前,没人在意我做了什么。”乔纳森说道,耸了耸肩。


不久后,乔纳森重新评估了自己的职业目标,“我不能只是政治宣传的第一响应者。”


乔纳森走起了曲线救国的道路,卓有成效。


从俄勒冈州立大学毕业后,乔纳森加入了雅虎,随后又成为谷歌的合作方,监控谷歌新闻和搜索结果。这份工作很无聊又磨人,“有人会一辈子做这份工作吗?我可不羡慕他们。”


但这份工作让他开始思考,人类行为如何影响了算法决策,“人类解决问题的样子太让人惊艳了,机器搞砸的,全靠他们清理或修复。”


意识到这一点后,乔纳森踏上了新西兰的求学之路,从奥克兰大学毕业,取得博士学位。那是2010年,科技世界的关键一年。


一年前,Twitter开发了话题超链接,改变了原来静态之下的繁荣场景,用工具找到了社交媒体里的蛮荒之地。


也是第一次,用户能够点击查看话题下的全部内容。新的数字链接让用户能建立全新的网络社区,当然,也包括黑暗社区。乔纳森研究了这些新功能如何帮用户组织起活动,比如占领华尔街运动、比如2011年的日本大地震和海啸。在他看来,话题成了新的首页,即将改变媒体与媒体消费。


2016年大选后不久的深夜,乔纳森无意中卷入了政坛旋涡。


乔纳森时任北卡罗来纳州依隆大学媒体分析副教授,同时也在皮尤研究院工作,研究互联网上的抬杠和假新闻现状。尽管做了调研,他依然和所有人一样感到惊奇:特朗普竟然击败了希拉里。尽管正在休假,但为了搞清楚事情起因,乔纳森启动了初步调查:搜集大学期间传播假新闻的网站,贴到一张谷歌表格里做进一步分析。


或许,这些网站之间存在某种相似的内在联系呢。


于是,借助开源工具,乔纳森连夜拆解了117个网站的内容,包括新纳粹媒体Stormfront、极端阴谋论网站Conspiracy Planet,最终得知,清单里的73.5万多个链接均指向这117个网站。为了找到链接与网站的对应关系,乔纳森找出明显指向至少一个黑暗网站的外链,排查出的结果有8万多个。他称这些网站为“微宣传机器(Micro-Propaganda Machine)”,给它们打上标签#MPM。


做完这一切,乔纳森已经连续工作了36个小时。其间,电脑一度因为数据压力过大数次崩溃。他把结果绘制成图,用一张复杂的数据可视化图片串起了所有网站。“这张图,展示的是大选前数天的整个假新闻生态”,乔纳森说道,依然沉浸于对新发现的敬畏情绪中,“这些,我以前从来没想到过。”


在骇人听闻的网络中心,是一个标有YouTube的巨型节点。


乔纳森把互联网上的假新闻图谱完整展示在公众面前。 “不只是Facebook”,他突然意识到,假新闻产业已经渗透进了整个互联网。假新闻网址和YouTube视频密切相关,甚至已经深入到亚马逊的书评、Pinterest上的链接,CafePress的自主设计T恤链接,以及大量主流媒体如《纽约时报》的链接。极右翼的宣传者正在与主流媒体分庭抗礼,试图反驳和歪曲他们的报道。


这条发现第一次引起了《卫报》记者卡罗尔·卡德沃拉迪尔(Carole Cadwalladt)的注意,这位英国记者因为报道剑桥分析公司如何暗地里搜集了8700万美国Facebook用户数据而名声在外。她正在做一则关于假新闻和阴谋论如何污染了谷歌搜索的报道,希望能和乔纳森约个稿。


这个故事对英国来说并不新鲜。但卡罗尔还是找到乔纳森,就他的发现,聊了好几个小时。第一次谈话时,卡罗尔说,“对于正在发生的事情,如何有一个宏观的了解,他绝对走在了其他学者和记者之前。”


事实上,乔纳森也是第一个向卡罗尔提起剑桥分析这家公司的人,“他在解释假新闻的工作机制时,提到有些公司如剑桥分析,可以追踪用户的上网痕迹”,卡罗尔解释道,“不论何时,当我说起剑桥分析时,总会说起乔纳森,以及让他不眠的深夜。”


十二月,卡罗尔完整发布了乔纳森的可视化数据表,后来的事情,被乔纳森形容为“雪崩”。他把那天文件的复印件存放在书桌抽屉里,那片漏水的天花板就是最好的保护伞。



尽管如此,他们二人却不知道,乔纳森的研究仅仅揭开了扭曲的互联网的一个角落。在假新闻图谱泡泡下,隐藏着俄罗斯的阴谋脚印:购买的广告、创建的网站、计划的活动。


那时,Facebook CEO扎克伯格依然强调,所谓的“假新闻影响票选”,荒谬至极。等到乔纳森终于集齐了证据,证明这不是一个荒谬的想法,时间又过了快一年。扎克伯格最终承认,大选结果的确受到了假新闻的左右。


“两年后再见报可就晚了”


2017年夏天,得到大量媒体关注后,乔纳森获得一份哥伦比亚大学的工作——进入Tow数字新闻中心担任研究总监。


毫不犹豫,乔纳森打包了登山靴,收起行李,搬进了曼哈顿的一间一室公寓。这里是纽约的富人区,距离依隆大学有500多英里,坐火车也要经过数个站点,而他在依隆大学的旧住址,依然还是新人的住所,前同事们住在这里,也在这里工作。


这位研究员的新住所远离了人群,正好让他有大量空闲时间埋首数据。正因此,乔纳森在另一个深夜里,守着他的笔记本,抓住了科技巨头们试图隐匿的真相。


几周前,Facebook发布了一条信息,摘出十几个小时国会听证会和海量突发新闻标题的精简版本。文章称,Facebook在2015年向俄罗斯网络研究机构(IRA)卖出3000条广告,用于在意识形态层面宣传社会和政治的分裂。文章既没有列出账号的名称,也没有提及目标群体或更多细节。


但乔纳森用了近一年的时间,对假新闻生态中的数据做句法分析。他在文章里列出了假新闻内容源使用的广告跟踪工具,揭露YouTube上的庞大视频网络的账号,这个系统有8万多条视频,甚至在同一时间上传上千条。


从乔纳森挖掘到的数据看,他找到了大量互相关联的Facebook账号,却无法揪出幕后主使。直到Facebook坦诚之时,乔纳森才确信,如果俄罗斯的确操纵了Facebook的信息,一定还有些细枝末节残存在他的表格里。


终于,Facebook向国会坦白,有1000万人收到了广告。但乔纳森却认为,强调广告,只是Facebook有意为之的声东击西。真正重要的是,到底有多少人被虚假的Facebook账号所摆布,而不只是付费广告,对于此,扎克伯格只字未提。或许,这个数字不小,虚假账号影响的人,可能远远多过广告受众。


乔纳森想要把争论的重点转向他所关心的事实,他再次开始数据挖掘。


当时,Facebook尚未向公众披露虚假账号的名单,他只能先找找媒体报道中提到的名字,比如《每日野兽报》提及的一个名为Being Patriotic的网站,在佛罗里达州组织过支持特朗普的集会,还有CNN找到的一个名为Blacktivist的俄罗斯网页,它得到的点赞,远远超过真正的黑命贵(Black LivesMatter)小组。几周之后,乔纳森还是挖出了IRA的470个虚假账户的6席。在他看来,这已经足够了。


乔纳森找到Facebook旗下一款工具CrowdTangle的漏洞,用它来定位每个账号面向的用户。差不多3天的时间里,他渐渐弄清楚CrowdTangle散落的线索,重新拼出一张完整的画面。“这不是非法获取”,乔纳森有点羞怯地回应道,“是一种变通措施吧。”


这是值得的。查找和搜集证据的工作结束后,乔纳森发现,仅仅是这6个账号发布的内容,已经被分享了3.4亿次之多,这意味着,每个账号每个关注者都看完了账号的全部内容——显然不太可能。


况且,乔纳森也知道,哪怕470个账号中只有一小部分具备这样的吸引力,那看过IRA的人数,可能远远超过Facebook官方所承认的1000万人。他尽力从Facebook和Instagram上搜集了所有发帖,整理上传到网盘后联系到《华盛顿邮报》,“让公众知悉这些信息,真的事关重大,两年后再见报可等不及了。”


《华盛顿邮报》在2017年10月5日刊发了报道,标题下写道:最新研究显示,俄罗斯的宣传内容可能已经分享了上亿次。


Facebook企业公关部很快发来邮件,询问乔纳森是否愿意就自己的发现和CrowdTangle CEO 布兰登(Brandon Silverman)聊聊。


“诡异、尴尬的对话。”这是乔纳森对这场被要求保密的谈话的描述。他知道自己命中了Facebook的神经,也知道这家社交巨头不会让自己侥幸躲开,“我知道的,一旦我的发现被公之于众,他们(Facebook)一定会找到,然后毁了它——事实的确如此。”


布兰登说,乔纳森发现了CrowdTangle产品bug,承认这事儿有些难堪,特别是对一个年轻的公司而言。他在接受《华盛顿邮报》时表示,“我的回应里可能涉及到自我打击了”。但布兰登也表示,他很钦佩乔纳森的努力,“他能挖出这一切,完全是因为深入进平台,我觉得很棒”,布兰登说,“在唤起公众对假新闻、网络操控等恶劣行为的意识上,乔纳森非常重要,也极有影响力。我觉得他所做的,正是我们需要努力的方向。”


几天后,Facebook修复了bug。CrowdTangle也修改了算法,让发帖曝光可以更准确一些。Facebook的确切断了乔纳森的小小成就,十分高效。但乔纳森早已收好数据,Facebook不可能追回来。


“没有乔纳森,我们一无所知”


在乔纳森看来,CrowdTangle的漏洞是一颗萌芽的种子,杂草一般生长,速度远超Facebook。


又是几个晨昏,乔纳森研究着找到的数据,很快他意识到,高度雷同的内容、账号出现在了新的平台上,那些讨论度不那么高的平台。他找到了Facebook尚未公开的那些在Instagram上链接到IRA的广告,快公司的记者很快注意到,发表了一篇事件报道。Facebook随后便悄悄在官方博客文章末补上一条,承认俄罗斯的黑手也伸进了Instagram。


乔纳森从Twitter的处理名单里找到和IRA相关的账户,在Tumblr等网站搜索同名帐户发布的可疑内容。结果是大量试图挑起愤怒情绪的极端帖子,掀起对美国黑人警察暴行的憎恨情绪。BuzzFeed新闻的克里格(Craig Silverman)在他的帮助下揭开了这一事件。一个月后,Tumblr发布公告,平台方的确发现了84个IRA账户。而乔纳森,几乎找到了其中的每一个。


“和乔纳森聊天,你能感觉到,你刚刚知道的事情,他在6个月甚至一年前就知道了。”克里格说。


我懂。甚至不止。乔纳森一条短信就带我发现了如此多我此前从未想要问过的问题,而它们也没有答案。


一如2月底那一次。读完Facebook总法律顾问科林(Colin Stretch)在国会作证后送去参议院的回答后,乔纳森意识到,在数小时的证词和32页长的回复里,科林从未提起,Instagram上有多少人关注了俄罗斯的假新闻账号。乔纳森惊觉自己的疏忽大意,事实上,俄罗斯在Facebook上发布了8万条内容的同时,甚至在Instagram上发布了12万条。


得到乔纳森的提示后,今年3月,我把问题抛给了Facebook,对方称,不公开Instagram上被俄罗斯账户影响的用户,是因为并没有对此进行过统计。但是,这家身价数十亿美元的巨头公司,此前可在国会熬过了数小时的审讯。


另一次,乔纳森提及,受到IRA控制的内容,在Reddit也不鲜见,不少相关账户已经被删除,但至少还有2个保持着活跃。当我向Reddit方面询问这件事时,对方将可疑账户关停了数小时。


BuzzFeed新闻的克里格把乔纳森的研究比作这个国家的一项“服务”,“如果乔纳森没有找到数据,没有思考跨平台流动、分享、发布、触达等那些不曾被捕捉的碎片信息,我们绝对不可能知道。”


然而,这些研究终于还是产生了代价。


当我问及乔纳森如何释放压力时,他的回答是去旅行,或者叫游历,为了工作。深夜和周末,乔纳森常常和表格作伴,里面充斥着人性最肮脏的思想碎片,比如那段关于佛罗里达州校园枪击案的阴谋论调。


但,这也正是他的动力来源。


枪击案发生时,乔纳森也在考虑慢下来,花点时间规划下一步,但他实在忍不住。“事实是,面对一位刚从大规模枪击案中侥幸存活的少年,艾利克斯却直呼他为骗子,这真TMD让人不敢相信。”乔纳森说,“没见过,不能这样的。”


到今年春末,距离乔纳森开始真相之旅已经快两年,他也开始意识到,这样的生活并不长远。尤其是考虑到距离太远,乔纳森变动的日程会对伴侣提出更高要求,比如更耐心一些。“对于从事这种工作的人,伴侣必须特别悠闲和冷静。”也就在今年春天,乔纳森的父亲死于癌症,他可能需要多花点时间休息,然后跨越大半个美国,回俄勒冈的家里看看。


最近,乔纳森繁忙的Twitter慢慢安静下来了,他正在准备一本书。Facebook发布了全新的研究计划,开放数据的同时给予学术独立性,乔纳森正在考虑加入。


CrowdTangle的CEO布兰登说,他希望这个计划可以让Facebook多多和乔纳森这样的人合作,“最好的情况是,好多乔纳森慢慢出现,有一群年轻人能给假新闻打上标记,让更多人提高对假新闻的认识。”


同时,科技巨头们对自己造成的一地混乱也承担起了责任。Facebook和其它科技公司对广告平台、数据分享政策和内容审查方法上做出了重大改变。


乔纳森知道,重新执笔学术,再向公众提醒那些遥远的威胁,或许无法抓住他们的注意力,或许也无法成为大报的头版。鉴于科技公司,联邦调查人员以及该国大片地区仍在回望过去,这一点尤其如此。但乔纳森做好了朝前看的准备,也希望从大局着想,而不是停在听证会上,纠结于科技公司们曾经造成的影响。


“我不能只是宣传的第一个响应者。”这是乔纳森今年5月时说的话,而在更早之前,我在漏水的天花板下第一次见到他。


但是,几分钟后,乔纳森突然有了一个新发现。几天前,众议院情报委员会上,民主党人在选举前公布了俄罗斯在Facebook上购买的所有广告,3500个。除了乔纳森搜集到的数据外,这也是对俄罗斯利用社交媒体影响投票的一次彻底梳理。乔纳森忍不住再次做了查验。把广告导入6000页长的PDF文件后,他看到了一些熟悉的影子。突然,他注意到一系列不同以往的广告,或许会让我感兴趣。


他建议我,好好做个调查。



本文来自微信公众号:全媒派(ID:quanmeipai),作者:Medium。

微文吧官方微信公众号 :sz_wwb

相关文章!
  • 实体联系模型|如何用ER图绘制业务实体(更新了一下配图)
    - 阅 26

    当你设计一个新的功能模块,服务端童鞋一定会追问你具体有哪几种实体以及之间的关系,如果你没想清楚或者描述含糊,那么就有必要学习一下ER图。你是否碰到过类似的问题?设计优惠券模块,有几个概念容易混淆。

  • 电商技术解密:如何让用户快速地打开商品详情页?
    - 阅 19

    如何尽量减少用户的流量,减少客户端与后台的交互,让用户在APP上有比较好的体验,这些都是在设计商详系统时候需要面临的挑战。今天来跟大家聊聊商详,商详是展示商品详情信息的一个页面,整个购物流程比较重要的一个部分

  • 善用Axure写PRD:如何设置手机APP原型?
    - 阅 27

    上篇文章聊了一下为什么375×667是移动端原型设计的最佳分辨率,今天我们来讲讲如何在Axure中如何设计375×667的原型。看起来再简单不过,其实这里面有很多讲究,请听我慢慢道来。如何创建APP页面新手一般是这样创建APP

取消

感谢您的支持,我会继续努力的!

扫码打赏,你说多少就多少
我要打赏

打开微信扫一扫,即可进行扫码打赏哦

会员登录
还没有账号立即注册

手机登录

保持登录
返回

您可以选择以下第三方帐号直接登录微文吧,一分钟完成注册