您现在的位置:融合网首页 > 云计算 >

VMware为大数据跑车建造云计算高速公路(2)

来源:博客 作者:zol 责任编辑:admin 发表时间:2012-08-10 20:36 
核心提示:VMware大数据落地版 大数据有太多的声音和讨论。可是如何落地,如何具体帮助业务呢。现举一个实际例子,在中信银行信用卡部,在2011年全年大概有1500多个宣传活动。以前推广一个宣传活动需要两周时间,用了大数据解

VMware大数据落地版

大数据有太多的声音和讨论。可是如何落地,如何具体帮助业务呢。现举一个实际例子,在中信银行信用卡部,在2011年全年大概有1500多个宣传活动。以前推广一个宣传活动需要两周时间,用了大数据解决方案只需要2-3天;承诺客户在刷满一定额度后赠送礼物,以前这种动作需要几天时间处理,现在只要达到规定金额,就可以将赠品实时送到客户手里。

在中信银行的风险评估中心,利用大数据去实时评估每一个客户每日的刷卡行为和信用度。以前要调整一个客户的信用额度可能需要在每个月,甚至每一季才能做到,现在每天都能去调整。中信银行采用了大数据解决方案后,进行了4000万次的客户信用额度调整。这在没采用大数据解决方案前是绝对做不到的。这个案例的背后就是VMware的大数据解决方案。

现实版的另一个大数据的使用者是Google。Google每天产生海量数据,它本身有一套很完整的分析体系和解决方案来处理这些数据,可以做进一步处理和使用。对于很多其他机构,比如政府和企事业单位,他们也想做同样的事情。但是必须使用特定厂商的硬件、软件和解决方案才能实现。 VMware希望在云时代去帮助这些企事业单位,不再被物理环境所限制,可以用更弹性、有效、低成本的方式去实现。未来将会看到银行业可以利用大数据来分析客户信用度和进行风险管理,零售行业可以通过大数据来分析他们的信息量,让供应链和资金链运作更通畅。

大数据是高速跑车 云计算是高速公路

如果说大数据是高速跑车,那么云计算就是高速公路。 有人说云计算和大数据是双胞胎,两个是不同的个体,互相依赖又相辅相成。首先在概念上两者有所不同,云计算改变了IT,而大数据则改变了业务。然而大数据必须有云作为基础架构,才能得以顺畅运营。没有云计算这样的高速公路,大数据这样的超级跑车就跑不起来。当市场对大数据这个超级跑车需求很高时,云计算这个高速公路就会往纵横各个方向发展,形成良性互动。

其次,大数据和云计算的目标受众不同,云计算是卖给CIO的技术和产品,是一个进阶的IT解决方案。而大数据是卖给CEO、卖给业务层的产品,大数据的决策者是业务层。由于他们能直接感受到来自市场竞争的压力,必须在业务上以更有竞争力的方式战胜对手。比如电信运营商可以用大数据分析手机用户流失的原因是什么。某家领先的手机运营商,他们采用大数据解决方案一个星期,就发现了原因,并使公司获得了1亿美元的高回报。

VMware是业界领先的云基础架构厂商,在IaaS、PaaS和SaaS领域都有很强的技术、产品和解决方案。在管理Hadoop平台时,VMware有相对应的产品,如vFabric Data Director和Serengeti。这两项技术都能对Hadoop平台进行有效管理,起到快速部署、一键式管理等功能。

VMware最近收购了一家公司Nicira,即进行线上服务分析的云服务公司。它可以使大量的数据,无论是预置数据,还是其他应用数据,都能轻松上传到它的服务中去,进行快速分析,并以图表进行展示结果。无论是大公司还是小公司,抑或某个部门,都很容易应用大数据技术。VMware致力于为高速跑车建造高速公路,让大数据和云进行有效结合。

虚拟化提高Hadoop的安全性、灵活性和易管理性

Hadoop是Apache基金会发起和研发的,是目前业界公认的开放平台之一。授权公司可以发布自己相应的Hadoop版本。以Hadoop为代表的分布式系统,是大数据系统必要但不充分的组成部分。必要性是因为现在的大数据中很多数据是机器产生的数据,或者是物联网各种各样的探测器、电脑产生的日志,这些是人为产生的,而且数量巨大,不适合把它直接放到数据库中去。而Hadoop就提供了全新的方式,可以轻松进行平面扩展,把这些数据放在库里进行任意的数据分析。Hadoop成功的建立了这个环境,使得围绕Hadoop的软件能够提供各种各样的功能,完成智能分析工作。

说它是不充分的理由是因为我们需要对数据进行分析,客户可以把数据放池子里,Hadoop则把这些数据分成几百个、几千个节点,这是在特定的某些应用场景必须进行的部分。但是更多的应用场景是需要实时的反应,互动的反应,这时候就需要其他技术,包括内存类检索技术,甚至在数据产生时要进行实时反应的技术。这些技术都结合在一起,才是一个完整的大数据处理系统。所以VMware及其合作伙伴一直在实时反应、互动和内容检索等方面不断努力。

VMware的战略方向是和业界领先的不同版本都进行合作,以开放的态度建立一个生态圈,支持所有版本的Hadoop都能在VMware的虚拟化平台上运行。在这个指导方向下,VMware做了如下几方面的工作。一方面是和社区紧密合作,VMware开发者和和社区的开发者一起,输入Apache源代码库。Hadoop在它产生的时候,并没有考虑到虚拟环境,它是一个物理环境的技术,比如机器和机架的物理概念,但没有虚拟机的概念,VMware加进去的代码就加进了虚拟机的概念,虚拟机的概念和其他概念有一些不一样,需要特殊处理,在源代码里就知道它在虚拟环境中运行,进行优化。通过VMware的努力,使得现在的Hadoop开源技术,能够在虚拟化环境里运行。能够让它十分钟甚至更短的时间之内,从无到有,产生新集群。VMware的目标就是为超级跑车创造一条宽敞大道,使得大数据跑车能够快速跑起来。

另外, VMware虚拟化对Hadoop的作用,就是使它更接地气,并从现实角度适用于云计算环境,使它更易于管理并且安全。

第一、让Hadoop适用于多租户环境,很多时候公司里需要Hadoop或者大数据系统,往往不只是一个部门,不同部门在私有云里有可能都需要自己的Hadoop集群。在公有云上就有更多类似的需求,虚拟化就提供了一个很好的架构,可以使得多个集群之间非常灵活的同时运行,不互相影响。

第二、提高Hadoop的安全性。现在业界的基本方案都是在一个Hadoop平台上运行,信息保护非常不安全,相互能看到各自的数据。VMware的虚拟化在不同集群之间产生强隔离。

第三、提高Hadoop的可伸缩性。因为Hadoop集群,物理环境一旦产生了,要加节点,尤其是减节点是很不容易的。Hadoop需要观察每个部门,或随着时间推移上下的波动的需求。在虚拟化情况里,就会使得它很容易进行这样伸缩加减节点。

最后一点是增加CPU的利用率。 根据Hadoop社区的普遍反应,4万个节点集群,平均CPU利用率只有20-30%,虚拟化则大大提高了这种利用率。(责任编辑:admin)

  • “扫一扫”关注融合网微信号

免责声明:我方仅为合法的第三方企业注册用户所发布的内容提供存储空间,融合网不对其发布的内容提供任何形式的保证:不保证内容满足您的要求,不保证融合网的服务不会中断。因网络状况、通讯线路、第三方网站或管理部门的要求等任何原因而导致您不能正常使用融合网,融合网不承担任何法律责任。

第三方企业注册用户在融合网发布的内容(包含但不限于融合网目前各产品功能里的内容)仅表明其第三方企业注册用户的立场和观点,并不代表融合网的立场或观点。相关各方及作者发布此信息的目的在于传播、分享更多信息,并不代表本网站的观点和立场,更与本站立场无关。相关各方及作者在我方平台上发表、发布的所有资料、言论等仅代表其作者个人观点,与本网站立场无关,不对您构成任何投资、交易等方面的建议。用户应基于自己的独立判断,自行决定并承担相应风险。

根据相关协议内容,第三方企业注册用户已知悉自身作为内容的发布者,需自行对所发表内容(如,字体、图片、文章内容等)负责,因所发表内容(如,字体、图片、文章内容等)等所引发的一切纠纷均由该内容的发布者(即,第三方企业注册用户)承担全部法律及连带责任。融合网不承担任何法律及连带责任。

第三方企业注册用户在融合网相关栏目上所发布的涉嫌侵犯他人知识产权或其他合法权益的内容(如,字体、图片、文章内容等),经相关版权方、权利方等提供初步证据,融合网有权先行予以删除,并保留移交司法机关查处的权利。参照相应司法机关的查处结果,融合网对于第三方企业用户所发布内容的处置具有最终决定权。

个人或单位如认为第三方企业注册用户在融合网上发布的内容(如,字体、图片、文章内容等)存在侵犯自身合法权益的,应准备好具有法律效应的证明材料,及时与融合网取得联系,以便融合网及时协调第三方企业注册用户并迅速做出相应处理工作。

融合网联系方式:(一)、电话:(010)57722280;(二)、电子邮箱:2029555353@qq.com dwrh@dwrh.net

对免责声明的解释、修改及更新权均属于融合网所有。

今日头条

更多>>
关于我们 - 融合文化 - 媒体报道 - 在线咨询 - 网站地图 - TAG标签 - 联系我们
Copyright © 2010-2020 融合网|DWRH.net 版权所有 联系邮箱:dwrh@dwrh.net 京公网安备 11011202002094号 京ICP备11014553号