邬贺铨:数据挖掘是物联网领域被忽略的重点
10月25日消息,中国工程院原副院长、秘书长邬贺铨在无锡举行的第三届中国国际物联网大会上表示,数据挖掘是物联网和智慧城市重点,但之前我们更多的把关注点放在了数据感知和应用上,这是需要纠正的。
搜狐IT现场直播,以下是中国工程院原副院长、秘书长邬贺铨致辞全文:
尊敬的各位专家,下午好,我的报告题目是《智慧城市的数据管理》。先说一下智慧城市的基础设施。
什么是智慧城市?最初是无线城市,无线设施是数字城市设施的关键组成,但无线城市仅仅是数字城市的第一步,数字城市可能要求比电信网络有更多的有线宽带设施。
智慧城市是使用智能计算技术使得城市的关键基础设施的组成和服务更智能、互联和有效。对人力与社会资源和传统及现代设施的投资,促进可持续经济发展和高质量生活,同时通过提供参与治理的机会实现对自然资源丛明的管理,这时一个城市就被称为智慧城市。
智慧城市本身应该是可测量的,可监控的,可分析的。另外是能整合的,还是创新的,以及协作的。
那么智慧城市跟物联网以及跟未来网络有什么关系呢?物联网是智慧城市网络能力的基础。但智慧城市的网络能力内涵更为丰富,具有对未来网络所期待的特征。可以从图上看到,传感网仅仅是未来网络的一部分,除了英特尔以外,未来网络还应该包括,数据与内容、物品与传感器、用户与知识等等。未来感知包括服务感知、数据感知、环境感知和社会与经济感知。
物联网底层有很多感知对象和感知的单元,通过网络把它们汇集,然后通过应用领域将实现更智慧的决策。智慧城市的信息要有非常强大的基础设施,包括有线网络、无线网络、移动网络,有时候还需要利用卫星等等手段。除了传统手段以外,靠近用户端有物联网网端,有时候还需要云计算平台的支撑。
智慧城市的信息基础设施是下一代互联网和未来网络,我们希望这个网络更安全,能够具有移动性的普适计算,能够跨越物力与Cyber空间,而且还是自治连网。
那么智慧城市跟云计算是什么关系呢?这个图上可以看到,我们国家很多智慧城市都以建立云计算基地和提供云服务为主要目标。像北京有祥云工程,上海有“云海计划”,天津有六云产业和三云应用,重庆希望建立云端智能城市,广州有天云计划。
我举个例子,比如上海的智慧闵行,闵行有很多很多的数据库,然后建立闵行区私有云和民生云,希望通过数据挖掘,智能图像识别和网络检索的技术,来实现智慧政务、智慧医疗、智慧交通。
早年我们没有谈云计算,八十年代谈数据库,九十年代谈IDC,现在我们更多是谈云计算,实际上更多的是云服务。在云计算上面有Iaas系统,上面有Paa市系统,再上面有SaaS系统。但是我个人认为,仅仅做iaaS仅仅是数字房地产,房地产随着时间是增值的,那么Iaas随着时间会贬值,更多的应该做paas,提供很多的开发环境,利用这个环境开发企业需要的软件。对于更多的中小企业,即使有Paas自身也不会开发,因此需要提供Saas,这里面就需要提供非常多的软件。
通常,云计算一般企业来讲可以利用共有云,对于大企业来讲,往往自己建自己的云,但并不妨碍跟共有云发生关系。更多企业既想把一些装置放在公用平台上,但又担心安全,所以经常是使用私有云。
你看美国政府,政府IT预算25%要投到云计算平台上。
下面是我报告的重点,要讲一下智慧城市的数据管理。这个图上大家可以看到,互联网上的一分钟可以干一些什么?到2015年,大概1个人要花五年时间,才能看完在互联网上一秒钟所传的所有视频。
那么互联网上一天可以干什么呢?对Tvitter,一天新增2亿条微博,7个TB。50亿个单词,几乎是60年来纽约时报单词量的两倍。对于Facebook,一天可以上载2.5亿张照片,相当于300个TB。那么在中国淘宝网站一天又交易数千万笔,大概数据量是20个TB。全世界互联网上一天的信息量如果装在DVD光盘上,要装1.68亿张光盘,大概是80万个硬盘,约占800EB。
那么互联网流量的变化。1998年平均一个网民一个月的流量才一个MB,到2000年,达到10MB,到2008年平均一个网民是1000MB,到2014年是10000MB。
2011年4月美国国会图书馆收集了235TB无数据。全球新产生的数据年增40%,全球信息总量每两年就可以翻番。而对新增数据的处理能力以及其利用率的增长则不足5%。而且所有数据量的90%的数字内容属于非结构化内容。
最近两个月在YOUTube上上载的视频超过了ABC、NBC和CBS电视台自子948年以来247/365连续播出的内容。
那么什么是大数据呢?大数据是指没有办法在容许的时间内用常规的软件工具对它技术抓取、管理和处理的数据。也就是说,你在规定的时间里头用常规软件工具做不到的。大数据目前的标准是支单一数据集的大小在几十TB到数PB之间。
大数据本身有四个特征,超量、高速、变异、价值。大数据的应用领域很广泛,有医疗、交通、财务、物流、安全等等,应该说想得到的领域都可以发生很多应用。
比如企业,企业有管理部门、开发部门、销售部门、服务部门、这些部门是有交互的,如果通常的企业管理可能很难得到最优化,如果利用大数据管理,可以改善它的管理,性能上可以提高40%-60%。
美国有一个公司InFormatica为帮助美国一家零售公司把交易型的数据与社交媒体产生的数据能够关联分析,找到“最佳客户”并分析他们的购买行为。亚马逊公司从销售数据分析适搭配在一起买的商品。
硅谷有个气候公司,从美国气象局等数据库中获得几十年的天气数据,将各地的降雨、气温和土壤状况及历年农作物产量做成精密图表,从而预测任一农场的明年产量,向农户出售个性化保险,如果出现未能预测的恶劣天气损坏庄稼,气候公司将及时赔付。
我曾经在山东寿光的菜市场看到,当地有一个显示屏,北京黄瓜3块钱,当地黄瓜1块钱。我问农民说,你怎么不到北京去卖呢?他说,我要去北京卖,价格8毛钱都卖不出去。我说信息化对你没有用吗?他说,不是,信息化只有我知道的,别人不知道的信息对我才有用的,因此所有的市场信息都应该是个性化的。
美国纽约的警察分析交通拥堵跟犯罪发生地点的关系,能有效改进治安。美国纽约的交通部门从交通违规和事故的统计数据终发现规律。
我们的电信运营商也拥有大量的手机数据,通过对手机数据的挖掘,不针对个人而是着眼于群体行为,可以从中分析出:这个时候有多少人在这个地方。
前一段时间我去广东,广东省委领导提出来现在的经济下行了,究竟农民工走了多少?往往这个数据统计不准确。因为经济好的时候,人们不会多吃盐,经济不好的时候,也不会少吃盐,所以盐的销量相应反映出人的数量,那么为了核实这个数字,我问了一下广东的通信公司,我说你们能不能从用户活跃数量上判断结果。结果从这个上面判断出这个数字,也是20%左右。所以通过数据可以很好的反映人的来源。
比如说我们可以很好的掌握,现在在天安门广场有多少人,我可以知道多少人来自河南,多少人来自四川的,多少人来自江苏的。如果你是来旅游的,一两个小时就走了,如果上访的,可能三四个小时,这个时候上访部门就要注意了。(责任编辑:admin)
- “扫一扫”关注融合网微信号
免责声明:我方仅为合法的第三方企业注册用户所发布的内容提供存储空间,融合网不对其发布的内容提供任何形式的保证:不保证内容满足您的要求,不保证融合网的服务不会中断。因网络状况、通讯线路、第三方网站或管理部门的要求等任何原因而导致您不能正常使用融合网,融合网不承担任何法律责任。
第三方企业注册用户在融合网发布的内容(包含但不限于融合网目前各产品功能里的内容)仅表明其第三方企业注册用户的立场和观点,并不代表融合网的立场或观点。相关各方及作者发布此信息的目的在于传播、分享更多信息,并不代表本网站的观点和立场,更与本站立场无关。相关各方及作者在我方平台上发表、发布的所有资料、言论等仅代表其作者个人观点,与本网站立场无关,不对您构成任何投资、交易等方面的建议。用户应基于自己的独立判断,自行决定并承担相应风险。
根据相关协议内容,第三方企业注册用户已知悉自身作为内容的发布者,需自行对所发表内容(如,字体、图片、文章内容等)负责,因所发表内容(如,字体、图片、文章内容等)等所引发的一切纠纷均由该内容的发布者(即,第三方企业注册用户)承担全部法律及连带责任。融合网不承担任何法律及连带责任。
第三方企业注册用户在融合网相关栏目上所发布的涉嫌侵犯他人知识产权或其他合法权益的内容(如,字体、图片、文章内容等),经相关版权方、权利方等提供初步证据,融合网有权先行予以删除,并保留移交司法机关查处的权利。参照相应司法机关的查处结果,融合网对于第三方企业用户所发布内容的处置具有最终决定权。
个人或单位如认为第三方企业注册用户在融合网上发布的内容(如,字体、图片、文章内容等)存在侵犯自身合法权益的,应准备好具有法律效应的证明材料,及时与融合网取得联系,以便融合网及时协调第三方企业注册用户并迅速做出相应处理工作。
融合网联系方式:(一)、电话:(010)57722280;(二)、电子邮箱:2029555353@qq.com dwrh@dwrh.net
对免责声明的解释、修改及更新权均属于融合网所有。