分享

about云2014年12月16日每日一读

pig2 发表于 2014-12-16 00:52:21 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 1 14458



技术走向管理一些深度思考
http://www.aboutyun.com/thread-10630-1-1.html


云计算、物联网的意义在于收集和处理数据,软件行业需集中发展IaaS和建设高速宽带
http://www.aboutyun.com/thread-10632-1-1.html

[Python]网络爬虫(一)、(二)
http://www.aboutyun.com/thread-10626-1-1.html
问题1:URL由哪几部分组成?
问题2:如何区分URL和URI?

[Python]网络爬虫(三)、(四)
http://www.aboutyun.com/thread-10628-1-1.html
问题1:HTTP状态码通常分为哪几种类型?
问题2:如何实现用特定处理器获取URLs?

[Python]网络爬虫(五)、(六)
http://www.aboutyun.com/thread-10627-1-1.html
问题1:哪些header 要特别留意,因为服务器会针对这些 header 做检查?
问题2:使用 urllib2 时如何看到传输的数据包内容?




Spark SQL Catalyst源码分析之Analyzer(1)
http://www.aboutyun.com/thread-10622-1-1.html
1、Analyzer在Spark SQL里起到了什么作用?
2、如何理解流程是实例化一个SimpleAnalyzer?
3、Spark是怎样接受用户输入sql的?



Spark SQL Catalyst源码分析之TreeNode Library(2)
http://www.aboutyun.com/thread-10623-1-1.html
1、TreeNode有哪三种形态?
2、Spark SQL的Catalyst框架核心有哪些类库?
3、TreeNode的核心方法是什么?

Spark SQL Catalyst源码分析之Optimizer(3)
http://www.aboutyun.com/thread-10624-1-1.html
1、什么是Optimizer?
2、优化的主要策略总结起来是哪几大类?
3、如何理解Optimizer的工作方式?


Spark SQL Catalyst源码分析之Physical Plan(4)
http://www.aboutyun.com/thread-10625-1-1.html
1、什么是Physical Plan?
2、如何理解Optimizer工作流程?
3、 TakeOrdered的作用是什么?


资源:
openstack 实战指南
http://www.aboutyun.com/thread-10633-1-1.html


问答:

luna连接hadoop
http://www.aboutyun.com/thread-10631-1-1.html

每天有50G左右的数据文件,存入HBASE中做查询的方案
http://www.aboutyun.com/thread-10634-1-1.html

每天都要做动态分区插入的动作吗
http://www.aboutyun.com/thread-10636-1-1.html

已有(1)人评论

跳转到指定楼层
geek666 发表于 2014-12-25 16:05:03
pyhton爬虫,呵呵呵
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条