0 0 0

Storm技术内幕与大数据实践.epub

来到我心
9天前 150
我用夸克网盘分享了「Storm技术内幕与大数据实践.epub」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
Storm技术内幕与大数据实践 作者: 陈敏敏/王新春/黄奉线 出版社: 人民邮电出版社 出版年: 2015-5 页数: 192 定价: 49 装帧: 平装 ISBN: 9787115388537

内容简介

汇集作者在大众点评和1号店实时平台的大数据实践 讲解基于Storm的流数据处理的整体解决方案 《Storm技术内幕与大数据实践》内容主要围绕实时大数据系统的各个方面展开,从实时平台总体介绍到集群源码、运维监控、实时系统扩展、以用户画像为主的数据平台,最后到推荐、广告、搜索等具体的大数据应用。书中提到的不少问题是实际生产环境中因为数据量增长而遇到的一些真实问题,对即将或正在运用实时系统处理大数据问题的团队会有所帮助。

作者简介

陈敏敏 1号店个性精准化部门资深架构师,在此之前曾服务于微软和三星电子等公司,长期从事大数据、搜索和推荐平台相关工作。目前主要关注于NoSQL、实时计算框架、推荐、广告投放等相关技术。 王新春 大众点评网数据平台资深工程师,负责点评实时计算平台相关工作,推动流式计算和实时计算在点评的应用和推广,一直致力于大数据和分布式系统的研究和应用。目前主要从事NoSQL、实时分布式系统的研究与开发。 黄奉线 1号店基础架构部分布式存储团队负责人,推动流式计算在1号店的应用,获得CTO特别奖,长期从事基础架构相关工作。目前主要关注于NoSQL、开源、流式计算、分布式存储等相关技术。

网友热评

darcy27149: 略逊色于看的另一半Storm的书,完整的例子没有,有点零散。不过Storm的书真的不多,开卷有益系列。 一溪云: 对学习storm还是很有帮助,比一些其它storm类的书讲解得更好

图书目录

第1章 绪论1 1.1 Storm的基本组件2 1.1.1 集群组成2 1.1.2 核心概念3 1.1.3 Storm的可靠性5 1.1.4 Storm的特性6 1.2 其他流式处理框架6 1.2.1 ApacheS46 1.2.2 SparkStreaming6 1.2.3 流计算和Storm的应用7 第2章 实时平台介绍11 2.1 实时平台架构介绍11 2.2 Kafka架构13 2.2.1 Kafka的基本术语和概念13 2.2.2 Kafka在实时平台中的应用14 2.2.3 消息的持久化和顺序读写15 2.2.4 sendfile系统调用和零复制15 2.2.5 Kafka的客户端17 2.2.6 Kafka的扩展17 2.3 大众点评实时平台17 2.3.1 相关数据18 2.3.2 实时平台简介18 2.3.3 Blackhole19 2.4 1号店实时平台20 第3章 Storm集群部署和配置23 3.1 Storm的依赖组件23 3.2 Storm的部署环境24 3.3 部署Storm服务24 3.3.1 部署ZooKeeper24 3.3.2 部署Storm25 3.3.3 配置Storm25 3.4 启动Storm28 3.5 Storm的守护进程28 3.6 部署Storm的其他节点30 3.7 提交Topology30 第4章 Storm内部剖析33 4.1 Storm客户端33 4.2 Nimbus36 4.2.1 启动Nimbus服务36 4.2.2 Nimbus服务的执行过程38 4.2.3 分配Executor44 4.2.4 调度器46 4.2.5 默认调度器DefaultScheduler47 4.2.6 均衡调度器EvenScheduler50 4.3 Supervisor53 4.3.1 ISupervisor接口54 4.3.2 Supervisor的共享数据54 4.3.3 Supervisor的执行过程56 4.4 Worker61 4.4.1 Worker中的数据流61 4.4.2 创建Worker的过程62 4.5 Executor65 4.5.1 Executor的创建66 4.5.2 创建Spout的Executor69 4.5.3 创建Bolt的Executor74 4.6 Task76 4.6.1 Task的上下文对象77 4.6.2 Task的创建82 4.7 Storm中的统计84 4.7.1 stats框架85 4.7.2 metric框架90 4.8 Ack框架91 4.8.1 Ack的原理92 4.8.2 AckerBolt94 4.9 Storm总体架构95 第5章 Storm运维和监控97 5.1 主机信息监控97 5.1 日志和监控98 5.2 StormUI和NimbusClient99 5.3 StormMetric的使用100 5.4 StormZooKeeper的目录102 5.5 StormHook的使用104 第6章 Storm的扩展107 6.1 StormUI的扩展107 6.1.1 StormUI原生功能108 6.1.2 StormUI新功能需求108 6.1.3 Storm的Thrift接口109 6.2 资源隔离110 6.2.1 CGroup测试111 6.2.2 基于CGroup的资源隔离的实现119 第7章 Storm开发121 7.1 简单示例121 7.2 调试和日志122 7.3 StormTrident124 7.4 StromDRPC128 第8章 基于Storm的实时数据平台129 8.1 Hadoop到Storm的代码迁移经验129 8.2 实时用户画像130 8.2.1 简单实时画像130 8.2.2 实时画像优化131 8.2.3 实时画像的毫秒级更新133 8.3 其他场景画像135 8.4 画像的兴趣度模型构建136 8.5 外部画像融合经验分享138 8.6 交互式查询和分析用户画像142 8.7 实时产品和店铺信息更新143 第9章 大数据应用案例145 9.1 实时DAU计算145 9.2 实时个性化推荐150 9.2.1 推荐系统介绍150 9.2.2 实时推荐系统的方法153 9.2.3 基于Storm的实时推荐系统156 9.3 广告投放的精准化158 9.3.1 点击率预测158 9.3.2 搜索引擎营销161 9.3.3 精准化营销与千人千面161 9.4 实时意图和搜索164 9.4.1 用户意图预测165 9.4.2 搜索比价167 9.4.3 搜索排序168 第10章 Storm使用经验和性能优化171 10.1 使用经验171 10.1.1 使用rebalance命令动态调整并发度171 10.1.2 使用tick消息做定时器172 10.1.3 使用组件的并行度代替线程池174 10.1.4 不要用DRPC批量处理大数据174 10.1.5 不要在Spout中处理耗时的操作174 10.1.6 log4j的使用技巧175 10.1.7 注意fieldsGrouping的数据均衡性176 10.1.8 优先使用localOrShuffleGrouping176 10.1.9 设置合理的MaxSpoutPending值177 10.1.10 设置合理的Worker数177 10.1.11 平衡吞吐量和时效性178 10.2 性能优化179 10.2.1 找到Topology的性能瓶颈179 10.2.2 GC参数优化181 10.3 性能优化原则181 附录A Kafka原理183 附录B 将Storm源码导入Eclipse191

Storm技术内幕与大数据实践.epub"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件76556431@qq.com投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 雨巷少年振田
  • 对称唱戏
  • 婚事大魔王
  • 狂笑成癫
  • 若有所思
  • Loser失败者
  • 不懂你心
  • 深情共余生
  • 我的深爱给错了人
  • 街头Punk
  • Diamonds钻石
  • 你走太远
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!