前言:
1.本文数据和图片如果能够查证我都会在文章最后以链接户或者注释的形式给出数据来源。如果数据有误或者有不同意见可以联系 octaw@sina.com 欢迎探讨,我将感激不尽。
2.作者假设读者已经具备基础的计算机的知识,了解大数据的概念。我将给部分名词给做出解释,如果有没有解释到的地方可以查阅网上的资料。还望读者谅解。
即使是一个计算机的门外汉,估计也多少能嗅到IT技术热点的转变: 报纸杂志上再鲜有cloud或云这样的字眼,同样在国内各大技术类门户网站上,云计算的标签也已经退居二线,取而代之的,是Big Data,大数据。这种现象在国外的技术论坛、科技杂志特别是学术会议和期刊上有更加明显的体现。种种迹象虽然并不能代表“云”就像过去不少计算机领域内专家判断的那样只是个空泛的概念,但是一定可以反应出这样一个事实:新的科技浪潮正在加速到来。
那么我们应该如何应对呢?
首先需要了解大数据时代会给当下职场,商业运作,大学和科研机构带来哪些影响,以此确定自己是否在“打击“范围内。
目前大多数专家也许无法确切的预测大数据会给职场带来怎么样的改变。
但是我们已经能够从商业运作的角度观察到云服务提供商的动静,首先以阿里巴巴旗下的支付宝为例:
数据来源:支付宝”我的支付生活“个人数据
“我的支付生活”是支付宝的一次尝试,它将我个人的支付数据做了很细致的划分,甚至猜测本人的性格类型(比较准)。为什么说只是一次尝试呢?因为支付宝是准金融行业,数据比较敏感,涉及用户隐私,还没有到开放的阶段。可以这么理解,无论是出于娱乐或显摆的目的,你或许会希望自己看到甚至公布这些信息,但是你不希望这些数据作为开放数据被提供给未知的开发者,更不希望他们将分析结果告诉你,以你意想不到的方式通知你月初买了太多的零食,然后推荐你一些减肥产品的广告吧?开个玩笑。可以想象,如果聚集了整个城市人的支付数据,那么从这些数据里一定能够挖掘出足够的信息,这些信息经过不同形式的处理可以提供给不同需求的客户。比如阿里巴巴的另一项产品“数据魔方”[1] 的具体运用过程是:依据数据魔方关于热词的各项数据变化,及时调整优化商品标题,提高宝贝排名,进而获取更多流量,提高销量。而大数据跟个人最为密切的关系是对隐私的可能侵入。
“根据国泰君安的报告,2010年以来, 几乎所有IT巨头都先后发布了重量级产品来应对大数据的挑战,足见大数据已成为各大IT巨头争夺的下一个制高点。”[2]
如果说国内新兴技术已经是硝烟四起,那么国际上早已经处于巅峰对决的状态了。由于大数据是由“云”提供的平台,通常情况下只有足够的资本才能拥有足够的设备和配套服务,所以大数据属于IT巨头的战场,,云计算服务有一下几种提供方式:
l IaaS(Infrastructure as a Service,基础架构即服务)代表产品:亚马逊的AWS(Amazon Web Service)
Amazon Web Services 主页截图
2 paas(Platform as a Service,平台即服务)代表产品:Salesforce.com的Force.com、Google的App Engine和微软的Azure
3 SaaS(Software as a Service,软件即服务)代表产品:Google的Gmail
具体内容参见[3]
可见各个IT巨头都不同程度的以不同的方式拥有大量的用户的数据,即使我们熟知的App, Flipboard的数据也都存储于Amazon世界各地的服务器上。可以预见未来几年大数据产品将会遍地开花,并且渗透到人们生活的每一个角落:社交信息,网站点击以及停留时间,交易数据,甚至数字电视的收视情况都将会成为大数据共享平台下的数据来源,我们的生活将更加智能、便捷,但是悲观地说,不管云计算服务提供者做出什么样的承诺,我们也毫无隐私可言。
数据来源:WSJ中文网IBM广告