分享

大数据分析平台的三个发展重心

GYbigdata 发表于 2015-12-10 10:46:00 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 7352
大数据分析平台作为大数据应用最前沿的技术,一直受到人们的期待和关注。大数据分析平台能承载从数据提取到数据价值变现过程中所有功能。而在这个过程中,有三个方面值得关注和重点发展。


数据清洗功能
在大数据应用技术中,前端的数据清洗功能远比我们想象的更重要。没有好的清洗自然也不可能有后续的数据建模和数据挖掘。数据清洗功能不仅受技术发展的限制,也和数据类型以及数据量息息相关。


在大数据分析平台必须拥有兼容性强、查询速率快的数据清洗模块。面对海量的待处理数据和非结构化数据的增加,数据清洗功能的工作量和工作强度也必然会增加。正是认识到数据清洗功能的重要性,国云数据的研发工程师才会不遗余力地加强大数据魔镜前端数据清理和数据兼容性的建设。


数据分析功能
数据分析能力是大数据平台的建设重心,也是大数据分析工具的存在意义。大数据分析平台的数据分析功能受到多个方面的影响,除了软件设计技术和内建架构,搭载的数据分析模型也相当重要,直接决定了大数据分析平台所能承担的数据分析任务。


例如在大数据魔镜中,除了有聚类分析模型、数据预测模型、关联分析模型三大主流数据分析模型外,还有相关性分析、决策树等数据分析模型,甚至可以根据需求自己设定分析路径的代码模式,从而能满足不同用户的多种目的数据分析要求。


数据可视化功能
数据可视化是当下最热门的大数据应用技术,数据可视化就是将数据或者数据分析结果以图表的形式展示在各种平台上。这要求大数据分析平台有着强大的数据图表渲染功能,并且要内置丰富的可视化效果,以满足用户的不同展示需求。


除了末端展示的需要,数据可视化也是数据分析时不可或缺的一部分,即返回数据时的二次分析。而数据可视化也利于大数据分析平台的学习功能建设,让没有技术背景和初学者也能很快掌握大数据分析平台的操作。


大数据分析工具之所以注重这三个方向的功能建设,不是因为技术或是概念建设的需求,而是为了适应信息时代背景下人们对于大数据分析平台的性能要求。除了以上的三点,大数据分析平台还应该包含许多附属和拓展的功能模块模块,如大数据魔镜就有数据市场和魔镜知识社区用来加强数据流通和用户交流。


大数据分析平台的功能并不是一成不变的,社会实际需求引导技术的发展与革新。在技术设定上,越贴近实际需要的功能其价值就越高,未来的大数据分析平台将会在社会需求和技术革新中不断的变化,蜿蜒前进!

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条