热门频道

谢文:另一个平行的数据地球    

谢文:另一个平行的数据地球

  谢文,媒体评论人。上世纪80年代毕业于中国人民大学,之后于1983年赴美留学,就读于哥伦比亚大学。曾担任和讯网CEO、雅虎中国总经理、一起网CEO等职务,而其中值得关注的,是谢文于2006年11月27日离开了仅任职41天的中国雅虎。自1996年涉足中国互联网起,谢文一直是中国互联网发展的重要参与者,并创造了中国第一家在线公司联众三年红的互联网神话。Web2.0概念刚刚兴起时,他是这一概念的重要推广者,他曾预言:谁要能把互联网的互动性做到最强,谁就会成为最成功的互联网公司。现在,他又是中国国内倡导大数据的主要人物。
  数据分析不是大数据
  《经济导报》:如果让您给大数据做一个严谨的定义,您会怎么做?
  谢文:现在大家比较有共识的定义是这样的,大数据是以TB为基本计量单位的且年增长量至少翻番的互联网动态三维数据,这三维是个人、社会和物质世界。但这样的定义似乎仍然不够清晰,人们还是不能明白它是什么。
  从最普遍的意义上给一个定义,我愿意说大数据是一种现象,世界的万事万物正在迅速地被数据化,而这种数据化形成了一个数字地球。这个数字地球给我们各种新型的生活方式、社会运行方式以及经济管理方式的变化,带来了无限的可能性。
  《经济导报》:现在很多公司都在利用大数据这个概念,他们搜集现有的某一方面的全数据,对其进行分析,而后希望以此为依据作出预测,您认为这是大数据产业吗?
  谢文:通常类似麦肯锡这样的咨询公司会这样定义大数据,这是他们的理解角度,即帮助别人处理数据。但我认为,如果只是这样说会有偏颇。一方面,这次的斯诺登事件告诉我们,当数据量达到足够大的时候,有能力做这些事的个人或者国家,就会滥用这个能力,侵犯个人隐私或者不当牟利。
  另一方面,一些公司在掌握的数据多了以后,可以衍生出新的服务方式,这些与预测其实并没有什么关系,这也是在利用概念。
  《经济导报》:所以您认为,现在在亚马逊页面上出现的那些关联销售的广告并非是大数据?
  谢文:严格地说,这种服务也算是利用数据来揭示二者之间的关联度,但是对于大数据而言,这种推测过于简单了。这种推测不用说在大数据时代,在历史上早就可以有,比如观察天气,看明天是否下雨;比如看到你说四川话,推测你喜欢吃辣椒。
  《经济导报》:那么您认为现在意义上的大数据,与麦肯锡、高盛、凯雷等一直在依靠数据分析来做决策的公司以前所做的事有什么区别?
  谢文:这是量变和质变的关系,如果只是在一个极其有限的范围,在一大批高度相关的数据之间寻找关系,那只能叫做数据挖掘。现在我们说的概念,远远超出这个范围。过去那些没有被数据化的或者很难被数据化的东西,被数据化了。之前,这些东西可能看似与要分析的对像并不关联,或者以前无法收集其数据。现在由于有能力了,把这些数据加入到分析的范围内,会获得更多新的视角与信息。比如,过去你不会想到今天的天气与人们更倾向于想吃些什么之间是否有联系,现在由于有了收集数据的方法,这些内容可以被分析,而其结果是这些看似不关联的数据之间确实存在关系。
  总之当一切都可以被数据化的时候,过去那些毫无关联的事情,现在都可以被重新研究。在这个基础上又可以产生更多更好的结论,用以提高效率或者作出决策。这与过去从那些本来就相关的数据之中得到结论是不同的。无论是从成本、技术或者各方面所需要的能力方面,现在和过去都有本质的区别。
  数字地球刚刚开始形成
  《经济导报》:您如何判断大数据现在所处的阶段以及未来的发展脉络?
  谢文:尽管有很多公司在较早前就做了类似大数据的工作,尽管麦肯锡在2011年就提出了大数据的概念,但我仍然认为,2013年可以看作是大数据的元年,与我们所处的世界相对应的那个由纯数字所组成的地球刚刚开始形成。
  大数据的形成需要有几个必要条件,一是人类有能力将万事万物比较便宜快捷普遍地数据化,这在人类历史早期是非常困难的,一定是在某种数据采集终端被大规模运用,比如计算器经过几十年的发展已经普及,搜集数据的传感器现在的廉价程度令人惊讶,智能手机作为移动的接收信息和搜集数据的终端也被广泛使用。
  第二是每个被采集的数据能够高速度地处理,互联网的出现以及云计算的发展,使得产生于全球的庞杂的信息可以被高速汇集,利用数据化的形式传输到任意一个点,并且可以被超级主机计算、分类和筛选,这些真的能带来非常好的效益。
  第三是包括个人、商业经营者和政府管理者都认识到大数据的优势,愿意为之投入,无论是购买服务还是投资研发。任何一项新技术,必须足够的投入才能迅速发展。否则都只能停留在梦想阶段,不能成为现实。
  《经济导报》:所以您认为,到现在为止仍然没有一种可见的产品或者服务,符合您所说的严格的大数据定义?
  谢文:是的,如我之前所说,严格地说,大数据应该是把若干种完全不相干的现像联系在一起进行分析。有一种是过去我们能够想到但是做不到的,比如由于收集能力不具备或者分析能力不足,无法得出结论的。另一种是我们目前想不到也做不到的,我们只是知道我们沿着现在的这种分析角度,总有一天能够找到宇宙的某种现象的规律,为人类服务。
  预测的未知与可知
  《经济导报》:您是否做过理想化的设想?未来大数据能让我们的生活变成什么样?
  谢文:在不远的将来,打开你的手机或者计算机的网页,你会发现你收到的全是你想要看的信息,而不是现在那些汗牛充栋的信息。即使是新闻网页,也会根据你可以看新闻的时间和你最感兴趣的话题,有选择地将新闻投放给你。
  再远一点,人们可以享受到更个性化的服务——你的手机可能帮你安排任何事,它会知道你什么时候饿了、情绪出现波动了或是经济上出现问题了,它会给你提供几个选择帮你解决问题。
  《经济导报》:很多人在解读大数据的功能之时,与您不一样的是,更愿意描绘它的预测作用,您认为大数据在这方面能带来变革性的效果吗?
  谢文:首先,我们人类对于未来的预知能力确实一直都在提高,比如10年以前的天气预报远远没有今天准确。股票市场、宏观经济、政治走向,这些大的趋势,在过去都只能依靠猜测,或者完全不可预知。但现在,我们有一定能力对其进行相对理性的分析和预测了。大数据时代的到来会使我们更加快速地发展这种能力。而且这种预测就不单单是针对大的预测,未来的预测会延伸到个人级别,让个体可以享受到这项成果。
  《经济导报》:关于大数据的预测,现在仍然存在一个关键的争论,人类的行为到底是否可以预知?比如在金融市场的反应,比如犯罪行为的预判,您怎么看这个问题?
  谢文:这涉及到哲学上的两种观点,可知论和不可知论。我个人认为,可知是必然的,但可知不等于已知。随着科技的发展,只要不惜一切代价,任何事情都是可知的。
  《经济导报》:如果是这样,当大数据发展到一定程度的时候,当什么都可以预测的时候,当大量“先知”出现的时候,是不是疾病、犯罪甚至金融市场的波动都会消失?
  谢文:这是另外一个话题,这也就是大数据并非万能的理由。可知和能知是有区别的,我之所以把可知加了一个限定语“不惜代价”,是因为可知是受到成本限制的。加入我们想办法准确掌握世界上所有人在金融方面的预期,就可以掌握金融市场的涨与跌。但是这个过程可能需要极高的成本,那么我们付出的代价就可能比得到的利益更大,这样的可知从经济上就没有意义。疾病与犯罪的预防也是一样,如果掌握这些基础数据的成本太高,远远大于其他管理手段的成本,那么这种预测可能也无法推广到每一个人。所以,对于大数据的作用,不能把它浮夸得过于强大,实际操作中,一定是有成本和效率的问题。
  大数据时代
  《经济导报》:那么我们应该如何期待大数据所带来的未来呢?
  谢文:虽然我们应该看到从实际角度出发我们无法做到的事情、需要看到现实与理想状态的差距,但是也应该看到,大数据时代在人类历史上首次让我们把这个差距无限地缩小,原来那些根本无法想象的事情现在已经变成了可能。大数据时代带来的社会进步、经济发展、个人生活发展以及人类生活方式变更的机会都是历史上从来都没有过的。未来若干年,我们都将受益于这种变化。所以,我一直希望人们能够充分地认识它,主动地参与到这种变革中去,避免消极和抵制新事物的情绪,大数据时代才能来得更快。
  《经济导报》:您认为这个时代会在多长时间后来临?
  谢文:在IT行业,非常巧合的是,1996年雅虎上市、2004年谷歌上市、2012年Facebook上市,间隔都是八年。技术的进步似乎沿着这样一个时间脉络,所以,纯粹个人猜测,我认为2015年左右大数据必有大创新出现,2020年前后必有大的成功公司上市。这些大的公司会以他们先进的技术成果带领我们进入大数据时代。
  当然这个时间也取决于人们对于它的态度。这也是大数据目前面临的最大瓶颈。大数据是一个伟大的新事物,只有人们意识到这一点并且把它当作一个未来必然的发展趋势去投入和探索,变成自己的服务模式和发展模式,这样才能使之成为一个新的产业,产生新的效益并消灭很多传统的产业,这场变革才能最终出现。

 

 

 

编辑声明:本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。联系方式:020-38814986
最新评论