分享

Storm技术内幕与大数据实践

 
xuanxufeng 2016-11-1 17:07:22 发表于 书籍 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 124 46143



描述:
pdf

203页

内容:

本书意在介绍实时大数据的各个方面,分享我们在设计实时应用过程中遇到的一些问题,让
一些从零开始构建实时计算平台的公司少走弯路。我们力图使不同背景的读者都能从其中获益。
如果你从事基础架构方面的工作,可以着重阅读以下几章:在第1 章中,我们整理了国内
主要互联网公司在Storm 应用方面的一些情况;在第2 章中,我们介绍了实时平台的总体架构,
随后引入了大众点评和丨号店目前实时平台的一些基本情况;在第4 章中,我们给出了源码剖
析,为了让不懂Clojure 语言的读者也能容易地理解Storm 的内部原理,我们配了很多顺序图来
描述调用逻辑;在第5 章中,我们分享了一些在实践中总结出来的监控Storm 应用的常用方法:
在第6 章中,我们介绍了在Storm 上如何做一些扩展,方便更好地维护和管理集群;在第10
章中,我们主要分享了Storm 的一些小技巧和性能优化的经验。
如果你是大数据产品的开发和架构人员,可以着重阅读后面的几章,其中分享了我们一年
来遇到的一些瓶颈。
如果你是算法工程师,可以着重了解第8 章和第9 章,里面的用户生命周期模型、实时推
荐系统的算法和架构、千人千面架构等不少内容来自于我们的生产实践。设计严谨的模型在实
时系统上往往会遇到比较大的性能问题,数据量、实时和算法的精准性是相互制约的,提高某
一方面,往往不得不牺牲另外两个指标。在实际推荐系统的生产环境中,关联规则和协同过滤
的推荐效果往往比较好,被广泛采用,而利用用户画像,结合地域、天气等上下文信息,可以
进行一些更加精准的推荐。目前基于用户画像和上下文内容做个性化推荐和搜索、精准化运营
和广告营销等提高交易额等转换率,也是很多公司尝试的方向。
对于网上有的或者其他书中介绍过的内容,为适应不同读者的需求,我们会简单提及以做
一点点过渡。
尽管我们投入了大量的精力来写这本书,但因为水平所限,书中的内容存在不足和疏漏也在所
难免,恳请读者批评指正。


链接:http://pan.baidu.com/s/1sldBQod 密码:
游客,如果您要查看本帖隐藏内容请回复


游客,如果您要查看本帖隐藏内容请回复


已有(124)人评论

跳转到指定楼层
Minimumy 发表于 2016-11-2 08:12:11
多谢楼主分享!
回复

使用道具 举报

sun1 发表于 2016-11-2 08:41:08
感谢楼主分享
回复

使用道具 举报

地球仪 发表于 2016-11-2 08:57:07

多谢楼主分享!
回复

使用道具 举报

小孩真笨 发表于 2016-11-2 09:02:18
正好需要学习
回复

使用道具 举报

wf52114 发表于 2016-11-2 09:03:53
支持楼主 顶顶顶
回复

使用道具 举报

、一毛 发表于 2016-11-2 09:04:58
fasdfasf asfcxvxcvxv

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条