2013(第四届)中国beplay体育注册登录 大会在北京国际会议中心隆重开幕。本次大会由中国电子学会主办,中国电子beplay体育注册登录 专家委员会承办。中国工程院院士邬贺铨出席大会并以《beplay体育注册登录 与大数据》为题作了主题报告。
以下是文字实录:
尊敬的各位院士专家来宾早上好,很高兴来参加今天大会,高兴看到这么多领导专家参加,说明大家非常关注beplay体育注册登录 ,今天以beplay体育注册登录 大数据跟大家分享,主要讲三个方面内容:一个是物联感知,beplay体育注册登录 通过感知帮助我们进行决策。ITU的beplay体育注册登录 定义是物理和虚拟的,我们过去理解beplay体育注册登录 都认为beplay体育注册登录 对象一定是物理的,实际上ITU认为虚拟也是beplay体育注册登录 对象,其中虚拟物件是指什么,是指存储处理结构内容,利用多媒体内容和应用软件,beplay体育注册登录 提供满足安全要求,beplay体育注册登录 中的实物和虚拟相联合的。
实物有类,一是身份识别,比如说条码,还有非身份识别类,需要识别,你可以ID进去,对这个物体我们不是靠ID识别,是需要物体的实体体征和属性。
beplay体育注册登录 所需要感受的物件对象范围非常之宽,beplay体育注册登录 收集数据,我们刚刚说虚拟东西也是beplay体育注册登录 对象,我们看很多东西收集,如浏览器、搜索引擎、智能终端、游戏终端、GPS等,他通过大家日常网络留下痕迹和脚印获取大量的数据。
beplay体育注册登录 产生大数据。美国人前几年医院一年产生500个数据,IMT1。4TB数据等各种的数据通过传感器产生,也有在网上直接产生的,我们现在处于大数据时代,beplay体育注册登录 一分钟可以产生非常多的东西,苹果下载2万余次,一分钟会上传10万条新微博,全世界beplay体育注册登录 上虚拟网络上,产生了大量的数据。
国外的这些公司数据量不一定有中国大,中国淘宝网在双十一一天创收10。5亿,新浪微博晚上有100万以上的响应请求,中国联通也进行大数据搜集,他们以前给用户每一个月发一个帐单,很多用户认为我没有上这么多,中国联通改制就详细记录客户的上网记录一秒钟83万条。
虚拟运行管理产生数据量更大,这个比较是美国,每天是80个,发动机引擎收据588,企业资源管理客户关系管理等现在是大数据,企业本身也是每时每刻产生大量数据。
2012年IDC公司指出在2005年由机器产生的数据占到数据总量的11%,2020增加到42%。比如说医疗,现在到医院看病都要CT,清晰度很高300多兆,一个病人CT影响往往多大两千幅,数据量已经到了几十个GB,如今中国大城市的医院每天门诊上完人,全国每年住院已经达到了两亿人次,按照医疗行业的相关规定,一个患者的数据通常需要保留50年以上。
beplay体育注册登录 数据类型这是澳大利亚一个大学,他计算机科室研究,量很大,从2010年到2015年涨五倍,以及产业还有实业、物流,这是公共设施以及我们汽车,智慧城市发展智慧医疗、家具等,都会带动beplay体育注册登录 发展。
beplay体育注册登录 产生的大数据与一般的大数据有不同的特点。beplay体育注册登录 的数据是异构的、多样性的、非结构和有噪声的,更大的不同是它的高增长率。beplay体育注册登录 的数据有明显的颗粒性,其数据通常带有时间、位置、环境和行为等信息。beplay体育注册登录 数据可以说也是社交数据,但不是人与人的交往信息,而是物与物,物与人的社会合作信息。
beplay体育注册登录 的混搭将使beplay体育注册登录 的数据变得更有用,将beplay体育注册登录 感知的数据与通过社会媒体获得的数据结合,也就是人跟机器的社会联网,将使决策更科学。
与隐私与法律有关的特殊性,谁是beplay体育注册登录 数据的拥有者,通过beplay体育注册登录 可以控制家用电器。
最后,大数据助力beplay体育注册登录 ,不仅仅是收集传感性的数据,实物跟虚拟物要结合起来。今天北京交通堵塞,但是并不知道堵塞原因,如果政府发布消息和市民微博发布消息结合起来就知道发生什么事,beplay体育注册登录 要过滤,过滤要有一定模式。
决策的时候还要考虑发布什么东西,会带来什么影响,最近有地震,他能预测60%地震,总有一天会说准。
beplay体育注册登录 数据挖掘涉及到数据存储,从实物虚拟物获取存储,然后进行一些虚拟化和找出数据摘要,是要加标签的。
数据挖掘模式,合并压缩、清洗过滤、格式转换,法阶段数据分析、知识发现、可视化、数据阶段,关联规则,分类、聚类、序列、路径。因此后面工作更大更重要而且更难。
我举例子泥石流,最近发生芦山和宝兴地震,很容易发生泥石流,把这些数据收集,收集完了根据已有的数据模式进行分析
最近大家关注PM2。5,另外云南西北边、西川西南边干旱容易发生火灾,利用雷达、飞机可以搜集数据,也需要进行分析,然后产生判断。
在水面取样,通过卫星发出去,利用云计算、中心数据挖掘,河流的环境污染,数字化的模式,我们可以发现有的地方有环境污染,所污染本身需要异源数据,除了传感器、beplay体育注册登录 数据有噪声的不干净的,所以需要多种数据的结合,历史数据的挖掘,然后进行分析预感、预警,所以数据后面的处理,食品现在也是大家所关注的,手机拍下来食品到后台去查,是哪个公司的食品,在什么地方生产,食品生产日期等等,包括食品安全不安全,营养成分怎么样,食品监控,运用后台数据等等。最近禽流感流行,怎么去监测,凡是产生流感病人在网上寻找,吃什么药好,哪个地方看病好,或者微博交流。
智能交通虚拟化和可视化。交通管理中心再大,也装不上所有的视频,因此10秒钟,这样看上去每时每刻只有能够监控很小一部分内容,通过软件把整条路上变成一个视频,再进一步我把所有马路都通过大数据软件后台分析组成图象,这图象像上海市领导人坐飞机俯视地面一样。所以这些都是后台数据分析。
大数据在社会管理上有很好的作用。