用户组:游客
问题导读 1.本文认为R的应用场景是什么?你是如何认为的? 2.作者认为R+Hadoop看起来很美,实则困难重重,你是怎么认为的 ...
问题导读 1.快的打车LBS应用场景是什么? 2.Mongo如何应用LBS的? 3.Mongo有哪些不足? ...
问题导读: 1.如何将交通领域产生的海量车辆位置信息和道路关联而进行统计操作? 2.如何判断一个点是否包含于一个多边形内部 ...
导读 大数据是什么?我们可以有多种说法,不同角度也有不同的解释。大数据典型技术hadoop,还有包括后面的storm、spark等这些 ...
问题导读 1.Camera360为什么对云服务需求如此之大? 2.他们对云服务有哪些期望? 3.每一个要使用云计算的客户最担心什么问 ...
问题导读 1.Moneyball for Music集群规模是怎么样的? 2.在Hadoop基础设施方面面临哪些问题? 3.Moneyball for Music都是用了 ...
问题导读 1.用户画像的技术架构图,本文分为了哪5层? 2.百分点的画像标签体系包括什么? 3.本文如何分析大数据用户画像 ...
问题导读 1、数据在项目中的作用有哪些? 2、数据挖掘中,谁才是最重要的? 3、如何利用数据做日常监控? 1、做设 ...
问题导读 1、展望2015,数据中心行业会有哪些预测? 2、你如何看待2015相关技术的发展? 3、2015年,你准备好了吗? ...
问题导读1.你如何理解大数据这个概念?2.坐姿数据有何开发意义? 美国人最喜欢的派是什么?苹果派,超市的销售记录显 ...
导读 本文属于个人观点,只供参考和交流 1. 实时计算的概念互联网领域的实时计算一般都是针对海量数据进行的, ...
问题导读 1.本文是如何解释分布式系统的本质? 2.实现分布式系统的策略是什么? 每月爬取一亿网页,Bit ...
问题导读:1.什么是dst?2.dst的构成是什么?3.分布式测试体系构建存在什么问题?该如何解决? 自谷歌提出云计算概念 ...
问题导读1.“非诚勿扰”与淘宝算法效果测试有什么相似之处?2.什么是A/B TEST?3.淘宝对算法是如何测试的? 大家应该 ...
问题导读: 1.hive中表分区的目的是什么? 2.Apache Oozie是什么?能否控制工作流每小时执行? 3.Flume能否过滤数据? ...
Facebook放弃Cassandra之后,对HBase 0.89版本进行了大量稳定性优化,使它真正成为一个工业级可靠的结构化数据存储检索系统。Fac ...
本帖最后由 pig2 于 2014-3-31 23:25 编辑 1.电子港湾的Hadoop环境使用了hadoop那种调度算法? 扩展: 1.各个调度算法有什么 ...
Spark Streaming实时计算框架 Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式 ...
作为我之前博客的延续,在这篇博客中,我将探讨如何使用 Mahout 和 Hadoop 实现一个 推荐引擎 [*]第一部分 介绍 MapReduce 和 ...
Facebook一直是大数据技术最积极的应用者,因为它拥有的数据量极其巨大,一份资料显示2011年它拥有的压缩数据已经有25PB,未压缩 ...
一、前提和设计目标1、硬件错误是常态,而非异常情况,HDFS可能是有成百上千的server组成,任何一个组件都有可能一直失效,因此 ...
本版积分规则 发表帖子
查看 »