大数据不是神
阅读提示:过去人们迷信GDP,现在,大家都在谈论大数据,好像有了挖掘大数据就有了一切。
刘洪波
你在电脑上买了一回牛奶,于是你的电脑上会有数不清的牛奶、奶制品弹窗。这是大数据在起作用了。不光是卖商品,还包括新闻。你点开过某个新闻,类似的新闻会成群飞来。
如果你不曾注册,那还好,你可以清除浏览痕迹,暂时获得安静,如果你在网站上登录过,那么你所有的浏览行为已经存在了云端,删不删得了就不是由你说了算。大数据在远方建立了一个数字化的你,而且可以是永不磨灭的。
面对这个大数据时代,已经有太多乐观的声音,它是计算的飞跃,全面数字化的开端,精微行为预测的起点,智能革命的真正来临,如此等等。你的每一个微小行为都被作为数据收集了,你的每一个在线动作都既在取用此前的存贮,同时又被存贮进去,你一点也没有费力,网络构建了数字化的你。那些被你遗忘的,它不会遗忘;那些你不在意的,它没有不在意;久而久之,它成了一个可能比你自己还要了解你的你。烦恼也许只有一点,就像欧洲人讨要的“被遗忘权”、美国加州通过的“橡皮擦法律”,你总有些东西是不想“不可磨灭”,而希望人们都忘记掉的,那么应该有办法让科技公司彻底销毁。
但其实,大数据可能带来的问题,不只是“被遗忘”的权利受到损失,行为不能被擦掉,如上所述,它可能还建构了一个被歪曲的你。如前所述,当你购买过一个东西,当你读过某类文章,就会有成堆的同类东西向你涌来,网络并不会考虑你的需求是一次性的还是反复性的,也不会考虑你看那篇文章是随便看看、批判地看还是学习性地看、关注性地看。一个喜欢高热量食品的人,将被推荐更多的高热量食品。一个看过极端观点文章的人,网络会让你以为到处都是极端观点的人在说话。
有一个地方要开办新闻网站,决定要依靠大数据进行“抓取”,什么是点击的热点,就抓来什么,而自己去生产内容,则被认为是过时的。大概,也只有在“大数据时代”,这样的网站才好意思叫“新闻网站”。一个不生产新闻的新闻网站,最多算是二道贩子,而且比手工的二道贩子远远不如。手工的二道贩子,毕竟也还有个“编辑思想”,知道要选取哪一类的新闻、哪一种倾向的信息,而机器“抓取”出来的新闻,则只有点击数打底。
现在,网络上可以看到太多的穿越小说、玄怪小说,不穿越、不玄怪,似乎都不好叫网络文学似的。想必这也是有“大数据”支持的,因为这样的小说点击量、下载量、收到的钱都多。大数据放大了病态,并将病态极致化。
不时读到新闻,某人网上购物给了个差评,于是麻烦接踵而至,骚扰电话、骚扰短信没完没了,有的还收到了寿衣,有的波及到了同事。这足以形成吓阻效应,购物者不敢给予差评,卖家那里显示的就全是赞扬,赞扬又带来更多的销售,大数据则将显示那商家信誉很好。网上还常有投票活动,投票的都有谁呢,不知道,反正有人喜欢在网上投票,有大量的人不喜欢在网上投票,这里面可能有年龄、职业之类的差异,但其结果往往被视为“代表网民”,而代表网民又近乎代表整个社会。于是一种局部人群的意思,甚至局部人群被扭曲的意思,一旦被视为“大数据的结果”,就被看成了全局的意见和选择。
有一段时间,媒体和大V都讨伐高铁,好像高铁真的是十恶不赦的坏东西,而现在,大家知道高铁不仅提高了国人出行的效率,而且开始作为核心技术而迈向世界。大数据有时是暂时的,靠它去作决策,高铁是不是要依“民意”灭掉?
过去人们迷信GDP,现在,大家都在谈论大数据,好像有了挖掘大数据就有了一切,但我想,至少大数据挖掘不出本来没有的创意,挖掘不出一个社会应当具有的价值。这不是泼冷水,而是希望不要把大数据当成了神。
※版权作品,未经新民周刊授权,严禁转载,违者将被追究法律责任。