东北大学在海量异构数据集成管理与分析领域取得新突破
央广网沈阳3月14日消息(记者徐志强)目前,大数据技术广泛应用于各个领域,高效的集成管理与分析技术成为充分挖掘大数据价值的关键。海量数据的规模已远远超出了人们掌握和理解数据的能力,给数据的正确使用带来了巨大挑战。尤其是异构数据,由于缺乏统一的格式与规范,在各部门和各软件系统中的流动与共享困难重重。
近日,由东北大学王国仁教授牵头研发的项目“海量异构数据集成管理与分析技术及应用”针对数据集成质量、数据管理效率和数据分析可伸缩性等关键难题开展攻关,从模式匹配、数据清洗、数据管理和数据分析等关键技术切入,实现了以质量为中心的数据集成、以效率为中心的数据管理和以伸缩性为中心的数据分析,在我国“数字水资源”“数字医疗”和“数字国土资源”等领域的海量异构数据集成管理与分析方面发挥了不可替代的作用。该项目获得2016年度教育部高等学校科技进步一等奖。
以NoSQL和NewSQL为代表的大数据管理系统,在海量异构数据的集成管理与分析功能和性能上存在许多不足,具有巨大的提升潜力。海量异构数据的集成管理与分析有效手段的欠缺,导致了数据管理与分析处理低效和知识发现困难。针对这些技术瓶颈,“海量异构数据集成管理与分析技术及应用”项目提出了一套基于人机交互的数据集成体系,与当前国际上最先进的数据清洗系统相比,数据集成质量提升至少10%,集成方法的可用性居世界领先水平;开发了基于消息传递机制的改进框架及建立于其上的高效查询处理技术,与国际通用的Hadoop生态系统相比,数据管理效率提升50%以上;在国际上率先提出了面向大数据的分布式极限学习机(ELM)数据分析技术,实现了整合有监督、半监督和无监督的分布式极限学习机,与主流的分布式学习系统Mahout相比,系统的平台可伸缩性、数据可伸缩性、隐层节点可伸缩性、数据标注可伸缩性最高提升近20倍。
本项目技术成果和系统已经成功应用于5家企事业单位的7类产品和业务化运行系统中,支撑了系统集成商、政府部门、企事业单位等100余家大型单位的关键业务系统。项目研发了具有自主知识产权的海量异构数据集成管理与分析平台,2013年到2015年,累计新增销售额144802.1万元,新增利润21666.35万元,新增税收6439.79万元,取得了突出的社会和经济效益。
最近更新行业动态
- 全国211大学排名榜单公布,划分2个行政级别!
- 小学语文阅读专项十五——说明文阅读的简单方法
- 线上学校为“数字化教师”赋能
- 广钢3所“大公办”幼儿园集中开园
- 安徽师范大学附属巢湖实验中学今秋正式招新生
- 反驳俞敏洪,中小学教师绝对有资格,也绝对能胜任教学岗位
- 高考275人上清华北大,衡水中学却被质疑,看到这张图大家沉默了
- 大学生入党和不入党有什么差别?看完这篇文章你就知道了
- 三年级数学期末考试,学生考了60分,全班第3名,妈妈听后却哭了
- “鬼才”历史老师:重大“标志性”事件绘成表,初中3年不再愁
- 如果学霸当中小学老师,会不会提升档次?网友:学霸不适合当老师
- 中学校服收2300元:家委会别没“存在感”
- 三年级语文修改病句练习题汇总,很全面(可打印),期中考试要考
- 江苏最憋屈的大学,曾是全国重点大学,如今却连211都没混上!
- 高中数学:函数和导数题型你会做吗?
- 2020部编版三年级语文下册,第二单元测试卷,附答案
- 幼儿园开学时间终于敲定了,家长态度不一,对此,你怎么看待?
- 重要提醒:国务院将体育纳入高中学业水平测试是否影响你?
- 重磅!四川公办民办高中取消自主招生考试,录取以中考成绩为依据!
- 西湖大学28位创始捐赠人中9位河南老乡 施一公:我很感谢他们
- 初中数学教学的几点思考
- 揭秘全美顶尖公立高中新泽西High Tech High
- 幼儿园小女生每天闯关1小时,妈妈解脱了,她却驶上“快车道”!
- 初中生“早恋”时,多半会偷偷做“3件事”,尤其第1件太真实!
- 网传贵阳一幼儿园20名幼儿食物中毒 教育部门辟谣