分享

大数据算法、数据模型设计及实施思路

redhat1986 发表于 2014-12-23 17:59:18 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 5 15671
现在我们准备做大数据平台分析,目前已经搭建了平台,主要装了Hadoop2.6.0,zookeeper,hive,hbase,如果有需要还会用storm或spark。

平台搭建好了,但是下一步该怎么做就不知道了,请大家给点意见或建议。我现在的问题:
1,数据模型的概念?怎么使用数据模型?
2,算法模型或分析模型的概念?怎么使用算法模型?
3,网上看到很多平台的架构,但是具体里面怎么落地的,就不知道了,能否根据自己的实际经验提点宝贵的建议,谢谢!
4,一般的从数据收集数据分析出结果再到数据的存储,再到数据的展现都采用什么样的软件或工具?
忘各位不吝赐教!

已有(5)人评论

跳转到指定楼层
desehawk 发表于 2014-12-23 18:47:48
说一下你们的场景是什么?决定使用大数据的原因是什么?你们遇到了什么问题?
回复

使用道具 举报

redhat1986 发表于 2014-12-23 23:58:05
本帖最后由 redhat1986 于 2014-12-23 23:59 编辑
desehawk 发表于 2014-12-23 18:47
说一下你们的场景是什么?决定使用大数据的原因是什么?你们遇到了什么问题?


获取手机上app的点击行为日志、购物网站的交易数据、日志等信息,通过数据分析做精准营销。现在只搭了一个Hadoop集群,对数据模型、分析模型及算法,整套东西都不懂,无从下手。
回复

使用道具 举报

hahaxixi 发表于 2014-12-24 10:05:29
没人带很痛苦啊,我现在也是不知道下一步该干什么了?
回复

使用道具 举报

pt1688 发表于 2014-12-27 23:59:55
推荐了解下计算广告的知识,提取出重要特征,利用机器学习算法(一般是逻辑回顾)训练出模型,从点击量、pv、ctr等维度不断优化模型。。。
回复

使用道具 举报

redhat1986 发表于 2014-12-28 14:15:28
pt1688 发表于 2014-12-27 23:59
推荐了解下计算广告的知识,提取出重要特征,利用机器学习算法(一般是逻辑回顾)训练出模型,从点击量、pv ...

非常感谢!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条