用户组:游客
问题导读 1.阅读源码不同的情况该如何阅读源码? 2.如果为了面试,该如何快速懂得源码? 3.阅读源码的难点在什么地方? ...
问题导读 1.血缘系统评价标准是什么? 2.如何构建数据血缘系统? 3.数据血缘落地有哪些方式? 一、数据血缘是什么 ...
问题导读: 1、如何优化Kafka使用? 2、PostgreSQL 中如何使用 Debezium? 3、如何创建一个独立的 Debezium 连接器? 4、默 ...
问题导读 1.什么是根因分析? 2.为什么需要根因分析? 3.产生数据问题的原因是什么? 数据质量管理最行之有效的方法 ...
收集整理了一下目前主流的常用的开源大数据工具,方便大家学习参考。 查询引擎 Phoenix: Salesforce公司出品,Apache H ...
大数据分析这个术语在科技界和商业界已经流行了至少十年。尽管存在了这么久,但大数据通常很难定义,甚至更难使用。然而,对 ...
数据是世界上最宝贵的资源,但其有用性取决于您如何使用它。尽管拥有高质量的信息,但许多分析项目由于集成不佳而达不到 ...
第一部分 缺失数据 数据缺失的原因有多种:答案不完整的调查,或数据经过审查。当您在 3 年时间段内测量组件的使用寿命 ...
在我们这个数字驱动的世界中,数据正在以前所未有的速度生成。从在线交易和社交媒体互动到传感器读数和科学实验,海量可 ...
随着网络攻击和数据泄露的兴起,保护敏感数据不落入坏人之手至关重要。有两种广泛使用的数据保护技术,即数据加密 ...
云迁移的讨论往往主要集中在如何重新设计应用程序以充分利用云服务,然后将应用程序迁移到云中。 一个不太受关注的话题是如 ...
由于许多消费电子产品正在积极经历物联网(IoT) 革命,汽车行业等其他主要行业在将智能技术融入其车辆方面进展缓慢。然而 ...
数据无处不在。环视四周; 都是数据。它几乎根植于我们生活的方方面面,并且对于各种规模的组织来说变得越来越重要。 ...
有同学问:领导总让我们挖掘用户需求,咋个挖掘法?特别是手头还没什么数据,最多只有一个用户购货记录,感觉挖不出有深度的 ...
一、前提和设计目标1、硬件错误是常态,而非异常情况,HDFS可能是有成百上千的server组成,任何一个组件都有可能一直失效,因此 ...
Facebook一直是大数据技术最积极的应用者,因为它拥有的数据量极其巨大,一份资料显示2011年它拥有的压缩数据已经有25PB,未压缩 ...
作为我之前博客的延续,在这篇博客中,我将探讨如何使用 Mahout 和 Hadoop 实现一个 推荐引擎 [*]第一部分 介绍 MapReduce 和 ...
本帖最后由 pig2 于 2014-3-31 23:25 编辑 1.电子港湾的Hadoop环境使用了hadoop那种调度算法? 扩展: 1.各个调度算法有什么 ...
问题导读:1.什么是dst?2.dst的构成是什么?3.分布式测试体系构建存在什么问题?该如何解决? 自谷歌提出云计算概念 ...
问题导读 1.用户画像的技术架构图,本文分为了哪5层? 2.百分点的画像标签体系包括什么? 3.本文如何分析大数据用户画像 ...
问题导读 1.Moneyball for Music集群规模是怎么样的? 2.在Hadoop基础设施方面面临哪些问题? 3.Moneyball for Music都是用了 ...
问题导读 1.本文认为R的应用场景是什么?你是如何认为的? 2.作者认为R+Hadoop看起来很美,实则困难重重,你是怎么认为的 ...
问题导读 1.何为大数据? 2.大数据的安全分析是什么? 3.有哪些基于大数据安全分析的管理平台? ...
问题导读 1.在同一个集群中运行不同类型的成熟的服务(dev,test,production)这样是否可以实现? 2.Mesos是否可以提升资源 ...
本帖最后由 poppowerlb2 于 2015-6-22 15:13 编辑 问题导读 1、单机场景下是否存在时序问题? 2、多机场景下如何满足Lineari ...
本帖最后由 pig2 于 2015-6-28 00:28 编辑 问题导读1.产品数据管理是什么?2.互联网的产品数据管理包括哪四大方面?3.衡量一个 ...
问题导读1.医学大数据颠覆传统医疗本文列举哪几个场景?2.你认为大数据在医学中,可以发挥哪些作用? 大数据及大数据技 ...
问题导读: 1.企业级技术与大数据有什么关系? 2.大数据目前生态系统怎么样? 3.大数据目前应用状态? 技术型的高科技创 ...
本帖最后由 pig2 于 2019-7-6 09:40 编辑 问题导读: 1、传统数仓和现代数仓的模块架构有什么区别? 2、现代数仓有哪些 ...
本版积分规则 发表帖子
查看 »