分享

2023年字节跳动商业化技术大数据开发实习一面50min




这轮比较关注底层

1.自我介绍

2.个人信息和实习时长进一步沟通

3.问项目,进一步阐明下项目细节

4.HDFS备份文件数量

5.HDFS读文件底层原理

6.HDFS写文件底层原理

7.追问是写完一个文件就返回还是所有备份写完才返回

8.问MapReduce原理

9.问Hive内部表和外部表的区别

10.问Hivesql咋转换到MapReduce的

11.问Hive可以用啥作为元数据库

12.Hive和HDFS的底层架构的关系,什么地方用到HDFS

13.问了对资源调度了解多少(提了yarn,没深入学习过)

14.问Mysql索引用啥,为啥用B+树

15.问各种连接方式的区别

16.问平时用到的集群是用现成的还是自己搭建(虚拟机里面搭建集群)

SQL出了两道题,最开始出了道一个city列中数据格式是(南京,北京,深圳)这样的,求内连接的结果。。想了一会说不会,city列改成了(南京)这样只有一个城市名称的数据格式,直接内连接就行。

算法,问一个排序数组有一个数重复了,求重复次数。时间紧先写了循环遍历,然后说了二分查找的思路。


福利:如果你正在为求职烦恼,加微信w3aboutyun,拉入求职交流群,朋友圈分享面试等方面的内容。



获取更多资源:
领取100本书+1T资源
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26480

大数据5个项目视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25235

名企资源、名企面试题、最新BAT面试题、专题面试题等资源汇总
https://www.aboutyun.com/forum.php?mod=viewthread&tid=27732


加微信w3aboutyun,可拉入技术爱好者群

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条