华胜天成徐泽恩:华胜天成云计算处理新的解决方案(2)
大“疯”起兮云飞扬:目前大数据非常火,搜索条数超过了云计算,说明人们对它的关注程度很高了,为什么会讲这个标题呢?这其实是回答为什么大数据这样火的原因,Google是10个100次方的英文说法。Google的产生最初是解决大数据的问题,大数据其实跟云是同步产生的。我们看到Google的云计算用了几个关键技术,文件系统、Blgtaple、Map。
云计算在两、三年前开始推广,现在大家都很认可云计算这种服务模式,但是很多人都在困惑,云计算对我有什么用,我能用到它吗?其实把大数据这个概念一抛出来以后,你会知道大数据目前从传统技术来讲,真解决大数据的问题是没有办法的。在这演讲之前,上午在展厅的时候,其实也有人问到这个问题,他说还是用传统数据去解决好,也是应用管理方面的问题。我说当你的数据到几P级的时候有没有考虑呢?
我们目前在大数据的情况下,比如说刚才讲的社交网站的数据占的比例很高,对企业而言我们是不是有必要上网站上搜集这些内容,然后作为企业智慧呢?我觉得这个未来是可以的,但是现在解决的问题是企业里面有没有自身的,在业务过程中产生的非结构化数据有效地管理,我认为这是关键之处。作为企业内容管理有一个理论基础,这是高纳德关于企业运营管理成熟度模型,是从业务聚焦、信息治理、用户体验、流程组织、技术方面对企业在内容管理方面的评估,通常对于没有上企业内容管理平台的管理是处于一级,就是指关注我在我的业务系统中产生的附件怎么管理起来;二级是讲业务中怎么使用这个流程,比如说订单处理;三级是已经到达了全流程的内容管理,在A系统产生的内容在B系统怎么应
作为内容管理,我们对内容对象进行全生命周期的管理。从创建、存储、审核、发布、转换、迁移、版本、归档一直到销毁,整个生命周期都管理起来,管理的方向最初是内容,如何管理管理哪些属性,这个内容中跟业务上怎么结合,这是流程管理,还有在内容的访问上有什么权限控制。内容管理上还有怎么归类,还有就是跟应用系统的集成涉及到哪些方面,还有就是信息有效地关联,还有信息消费模式有哪些。对于银行处理业务会产生一些票据,这些票据实际上是通过扫描产生的非结构化,原来的票据是怎么管理的,实际上不但要看到复印件还要看到原件,这个实物是怎么管理的。
这是一个标准的企业内容管理的功能框架(PPT),最下面其实是相关的标准模块,有统计、安全、交互,中间是内容管理的平台,上面是内容门户。内容管理上就是相关的这些模块,因为内容管理是有标准的模型,所以不会超出功能范围。
前面说我们是基于云计算的企业内容管理,我们用到了哪些技术呢?主要是两方面:一是关于存储;二是内容检索。其实云计算最初就是解决内容存储和速度的问题,因为我们知道计算机的关键就是算法+数据结构,这两个问题一个解决的是时间,一个解决的是空间,我们在空间上做了ECM的存储规划,规划的原则就是保证数据的可用性和安全性,按照使用频率分层存储,因为数据在业务过程中有不同的需求,有的要求时效性比较高,有的要求时效性不那么高,比如说过了三个月以后看的频次是几天看一次,这时候就要使用云技术进行存储。
这是一个云技术方案,这是一个数据节点,是进行数据进行索引,不进行数据存储。内容门户是通过主节点取相关的存储位置,直接跟数据节点通讯取得数据,这是可以横向水平扩展的。这个全文索引是对多种文档类型进行相关的文档抽取,比如说各种识别抽取以后建立相关的索引,然后存成索引文件供搜索查询使用。这是在内容检索的时候用到了服务池。
项目实例:首先做一个背景介绍,这是某个银行的情况,背景是有各省的分支机构,每个分支机构有分行,分行下有部门,系统比较多,每次都是一个独立系统,比如说信用卡系统、会计集合系统等,每个系统都是独立的。产生的介质种类也比较多,各种各样。他们有一个系统需求,把各个系统之间的关联关系建立起来,解决内容误导的问题。目标是将结构化数据和非结构化数据通过一种方式能够建立某种联系。通过ECM,将结构化数据和非结构化数据打通企业内各业务平台之间的关系。
逻辑部署:简单介绍一下,我们中间用到了服务器,有应用服务其,还有一些ECM服务器,还有流程管理的服务器,将各个系统之间的相互关系通过流程串接起来。还有相关的存储,最前面是使用层。因为银行的实际情况,除了总行在各省都要建立一个省中心,目的是缓解,从带宽来讲,如果所有的网点都跟总行的服务器通信的话,总行的带宽可能会有问题,所以建立分支的缓存服务器,使各个节点办业务的时候通过缓存处理,缓存跟总行之间有一个同步。
这是一个实测的实际情况,每天有1600万的业务数据,每个数据大概有150K,每天的数据量达到20T,空间总规划是6P,平均2秒内可以进行查询。这是省中心的调悦速度,平均的调阅速度在1.5秒左右。混合处理,就是同时上传和调阅时的性能指标,有的时候一边做业务,同时还需要调用。
这个案例的特点就是一体化数据管理,云存储、智能化、高性能、架构先进,采用灵活的API。在企业运营管理中,不是简单的标准架构,涉及到很多外围的需求,比如说我的图象识别,这个图象识别有特殊图像的话,比如说CAD这种有一些专业技术,要通过标准的接口做集成。
(责任编辑:admin)- “扫一扫”关注融合网微信号
免责声明:我方仅为合法的第三方企业注册用户所发布的内容提供存储空间,融合网不对其发布的内容提供任何形式的保证:不保证内容满足您的要求,不保证融合网的服务不会中断。因网络状况、通讯线路、第三方网站或管理部门的要求等任何原因而导致您不能正常使用融合网,融合网不承担任何法律责任。
第三方企业注册用户在融合网发布的内容(包含但不限于融合网目前各产品功能里的内容)仅表明其第三方企业注册用户的立场和观点,并不代表融合网的立场或观点。相关各方及作者发布此信息的目的在于传播、分享更多信息,并不代表本网站的观点和立场,更与本站立场无关。相关各方及作者在我方平台上发表、发布的所有资料、言论等仅代表其作者个人观点,与本网站立场无关,不对您构成任何投资、交易等方面的建议。用户应基于自己的独立判断,自行决定并承担相应风险。
根据相关协议内容,第三方企业注册用户已知悉自身作为内容的发布者,需自行对所发表内容(如,字体、图片、文章内容等)负责,因所发表内容(如,字体、图片、文章内容等)等所引发的一切纠纷均由该内容的发布者(即,第三方企业注册用户)承担全部法律及连带责任。融合网不承担任何法律及连带责任。
第三方企业注册用户在融合网相关栏目上所发布的涉嫌侵犯他人知识产权或其他合法权益的内容(如,字体、图片、文章内容等),经相关版权方、权利方等提供初步证据,融合网有权先行予以删除,并保留移交司法机关查处的权利。参照相应司法机关的查处结果,融合网对于第三方企业用户所发布内容的处置具有最终决定权。
个人或单位如认为第三方企业注册用户在融合网上发布的内容(如,字体、图片、文章内容等)存在侵犯自身合法权益的,应准备好具有法律效应的证明材料,及时与融合网取得联系,以便融合网及时协调第三方企业注册用户并迅速做出相应处理工作。
融合网联系方式:(一)、电话:(010)57722280;(二)、电子邮箱:2029555353@qq.com dwrh@dwrh.net
对免责声明的解释、修改及更新权均属于融合网所有。