您现在的位置:融合网首页 > 云计算 >

京东商城布局云计算 自主研发Hadoop解决方案

来源: IT商业新闻网 作者:佚名 责任编辑:admin 发表时间:2012-11-28 20:28 
核心提示:冷备方案中,只存在一个NameNode节点对外提供服务,如果此节点服务发生异常,那么整个Hadoop集群提供的服务就会中断,造成集群不可用,且只能是人工介入修复,如果Hadoop集群存储的文件数量很多,NameNode重新启动的时间会很长,这就会给所有线上集群任务造成

京东商城在Hadoop高可用方面的研究,取得了重大成果。在Hadoop集群运维方面,一直以来都有这样一个难题困扰着业界:线上集群,由于NameNode的异常,极有可能导致Hadoop集群服务中断;NameNode软硬件系统定期维护、升级也一直是让人头疼的问题——整个集群可用性会受到影响。集群可能随时都有任务在执行,有些业务是需要7*24小时不间断地提供服务,服务中断会造成比较大的影响,被影响的业务有可能又会间接影响到其它业务。

到底是什么让线上集群存在这样的忧患呢?我们知道,NameNode的备份可以分为冷备,温备,热备等方案。目前,绝大多数Hadoop线上集群使用的是冷备的方案。冷备方案中,只存在一个NameNode节点对外提供服务,如果此节点服务发生异常,那么整个Hadoop集群提供的服务就会中断,造成集群不可用,且只能是人工介入修复,如果Hadoop集群存储的文件数量很多,NameNode重新启动的时间会很长,这就会给所有线上集群任务造成较大的影响,其损失无法估量。这个问题不仅是京东商城的问题,更是业界普遍面临的一个问题。

京东Hadoop高可用解决方案,很好地解决了以上问题。热备方案是在冷备方案的基础上,引入了一个从节点作为热备节点。当主节点出现异常时,从节点切换为主节点,Hadoop继续对外提供服务。

京东Hadoop高可用解决方案是以Cloudera CDH3作为基础,并在其上进行了大量的改造工作,完全自主研发实现的。目前,已经支持主、从热备的部署方式,并且通过共享存储设备,实现主、从节点的元数据同步。在热备基础之上,我们也实现了NameNode的自动切换功能。客户端、主、从节点、数据节点均通过zookeeper判断主节点信息,通过心跳判断NameNode健康状态。

在业界,对于Hadoop NameNode热备机制也有一些实现方案,例如: facebook,cloudera等IT巨头均在不遗余力地对Hadoop进行高可用方案的改造,并且已经取得了较大成果。京东商城对Hadoop的持续升级改造一直在进行着:通过zookeeper、心跳等实现了主、从节点的自动切换功能,同时充分地考虑到了防止网络波动、服务假死等情况;其次,引入了共享存储异常的处理机制,解决了在共享存储设备出现异常的情况下,也不会造成元数据丢失或者主/从节点元数据一致性的问题。

京东商城在Hadoop方面的技术突破,标志着京东商城在云计算领域的研究已经进入了深入阶段。

(责任编辑:admin)
    • “扫一扫”关注融合网微信号

    免责声明:我方仅为合法的第三方企业注册用户所发布的内容提供存储空间,融合网不对其发布的内容提供任何形式的保证:不保证内容满足您的要求,不保证融合网的服务不会中断。因网络状况、通讯线路、第三方网站或管理部门的要求等任何原因而导致您不能正常使用融合网,融合网不承担任何法律责任。

    第三方企业注册用户在融合网发布的内容(包含但不限于融合网目前各产品功能里的内容)仅表明其第三方企业注册用户的立场和观点,并不代表融合网的立场或观点。相关各方及作者发布此信息的目的在于传播、分享更多信息,并不代表本网站的观点和立场,更与本站立场无关。相关各方及作者在我方平台上发表、发布的所有资料、言论等仅代表其作者个人观点,与本网站立场无关,不对您构成任何投资、交易等方面的建议。用户应基于自己的独立判断,自行决定并承担相应风险。

    根据相关协议内容,第三方企业注册用户已知悉自身作为内容的发布者,需自行对所发表内容(如,字体、图片、文章内容等)负责,因所发表内容(如,字体、图片、文章内容等)等所引发的一切纠纷均由该内容的发布者(即,第三方企业注册用户)承担全部法律及连带责任。融合网不承担任何法律及连带责任。

    第三方企业注册用户在融合网相关栏目上所发布的涉嫌侵犯他人知识产权或其他合法权益的内容(如,字体、图片、文章内容等),经相关版权方、权利方等提供初步证据,融合网有权先行予以删除,并保留移交司法机关查处的权利。参照相应司法机关的查处结果,融合网对于第三方企业用户所发布内容的处置具有最终决定权。

    个人或单位如认为第三方企业注册用户在融合网上发布的内容(如,字体、图片、文章内容等)存在侵犯自身合法权益的,应准备好具有法律效应的证明材料,及时与融合网取得联系,以便融合网及时协调第三方企业注册用户并迅速做出相应处理工作。

    融合网联系方式:(一)、电话:(010)57722280;(二)、电子邮箱:2029555353@qq.com dwrh@dwrh.net

    对免责声明的解释、修改及更新权均属于融合网所有。

    今日头条

    更多>>

    热门关键字

    关于我们 - 融合文化 - 媒体报道 - 在线咨询 - 网站地图 - TAG标签 - 联系我们
    Copyright © 2010-2020 融合网|DWRH.net 版权所有 联系邮箱:dwrh@dwrh.net 京公网安备 11011202002094号 京ICP备11014553号