源码基地

 找回密码
 马上注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

查看: 102|回复: 0

大数据类工程师面试题集锦附指南:互联网公司篇!

[复制链接]

新浪微博达人勋

该用户从未签到

发表于 2018-5-17 20:49 | 显示全部楼层 |阅读模式
大数据工程师是近几年异常火爆的职位,市场需求旺盛,众多互联网公司都打出了高薪招聘的广告,本文整理了网络上部分技术人员分享的各大互联网公司大数据类(Hadoop、Spark等)面试题以及面试时需要注意的一些问题,希望对各位技术人员有所帮助。% O+ W/ g# H/ }% W9 O

* n' c# {: ?  ]/ }# ` 大数据类工程师面试题集锦附指南:互联网公司篇!-1.jpg
. \: \( e9 w7 |6 \
% |, g( x+ T$ S$ f阿里巴巴6 D$ C2 U. j3 w8 ^- t' R

% |; x& \* Z% n- I$ j6 ]8 U阿里巴巴的面试轮次基本是三次,技术方面分为简单的项目经验了解和个人技术水平考察。部分网友将面试官分成了两类:一类是技术型,不断加深问题难度以测量你对技术的掌握深度;另一类是综合素质型,通过简单的技术问题引导求职者自我表达,侧重考察求职者的个人思想、表达能力等综合素质。
7 K; X2 Q9 z# J# h9 B6 o/ L. F2 B. P4 e
二叉树、排序、SQL等基本概念问题几乎所有求职者都被问到过,接下来的手写代码或者技术深度类的问题都与面试的职位息息相关。有技术人员贴出了自己对阿里巴巴大数据类面试题的一些总结:
2 j; G. R# L; t, Q& f) s" d. R! w  c2 M
如果参加过阿里巴巴的大数据竞赛或许对面试有很大帮助。面试中,可以抓住面试官的兴趣点,尽量拉到你擅长的话题或技术讨论中,这样对你的面试有很大帮助。' w2 ^% w$ Q/ P- C! v( `

6 d, V4 E& P- w. t8 V: ^/ X7 s7 P 大数据类工程师面试题集锦附指南:互联网公司篇!-2.jpg
8 i  _, X* u4 b$ ^- p. y: C' Y+ p1 l' |/ J
大数据类工程师面试题集锦附指南:互联网公司篇!-3.jpg ' d. }! F" p/ O+ N* `' j( q

% {$ {' H; e# t4 F$ t" k" P 大数据类工程师面试题集锦附指南:互联网公司篇!-4.jpg
3 ^2 w: k9 C$ V  d) ]4 u
4 T6 Y) ?8 X) K  U京东* f) s4 G' o5 P3 C
3 F/ a7 `0 K0 ^6 l
京东的大数据类面试基本是两轮,再加一轮人力面。人力是简单了解一些工作情况、期望薪资之类的问题。前两轮面试一轮是基础面,一轮是项目面。第一轮主要是围绕基础概念展开,基础知识扎实肯定没问题。第二轮会根据项目经验进行询问,技术难度加大。% d) u0 V, ^( E* E% J6 H! D+ O

8 N" W' v6 o" ?! Y4 Z问题主要围绕Hadoop、Spark、Hive、Storm和数据库的基础操作以及工作原理,Linux的常用指令等,详细询问你的项目经验,了解项目中用到的技术或方法,遇到的问题,必要时需要手写代码或一些大数据组件的搭建和详细参数配置。
* \) a$ U; e9 Q& V( i
+ k( ?7 @! f$ a+ v9 P腾讯
- r6 V! d5 c6 E: ?: t2 m1 G' O4 w* i9 X: }5 `& y& l9 |8 W+ [' r1 \
腾讯需要经过三轮面试,基本流程与京东相似。简历上的项目经验一定会被仔细询问,建议求职者对自己所写的项目经验认真评估,对项目的每一个细节都仔细查证。其次,部分技术人员表示自己被要求手写代码,比如用C++写深度优先搜索;与Java有关的面试题也不少,比如Java有几种设计模式,各有什么优缺点。适合哪些场景;最后是一些与Hadoop相关的问题,比如Hadoop的一些操作如何实现等。
# B3 p$ d7 k4 N5 U* D. c( S. w$ X/ y6 ]" v; d: |9 q! G
百度
4 t* \9 i1 c" z+ ^- k, q8 O. Y9 A$ c; z$ z2 P
一共三轮面试,技术方面主要考察各类排序算法、Linux命令、Hadoop、分布式、大数据处理方面的内容,对统计模型要求较高,对数据结构以及编程功底有要求。多位求职者反应,百度的面试更偏重对技术水平的考察,偏向一题多解,不但要给出方案,同时要不断优化得到最优解决方案。3 q: U8 e: `5 X# x/ W- E
8 ^- q( ?1 E9 m, T" v: k
大数据类工程师面试题集锦附指南:互联网公司篇!-5.jpg
5 y7 s# r. `( k$ n& E( W8 V7 x( L8 k; s% @, ~
美团
$ X3 A7 a- W; ]6 K
5 U3 h- J: W" n5 d" o美团的面试轮数同样在3到4轮之间,不同的面试官侧重点可能有所不同,比如侧重关系型数据库的可能会问你索引为何选B树。B+树,不选二叉树,事务的ACID是什么,传统关系型数据库和非关系型数据库HBase的区别,HBase删除数据怎么做(时间戳切入)等;侧重大数据,尤其是离线处理方向的可能会问你离线数据处理怎么做,基于磁盘的离线处理和基于内存处理海量数据的区别,MapReduce和Hive的区别,HBase和HDFS的区别等。
: M1 S# w/ |  e% H1 c, N
+ w8 G) J& w/ t: u- w0 K! W 大数据类工程师面试题集锦附指南:互联网公司篇!-6.jpg 8 S4 l: p8 S6 W' j# E' P) J" e

2 w! B3 w! ^& h5 m7 B各种排序算法几乎是各家公司面试都会被问到的问题,快速排序出现的频率尤其之高。
  u- u$ X8 J3 J( `3 _* d5 k3 F& F0 ?7 n/ l$ {7 u* _' ^- C
滴滴
# B3 o  k) |% ?1 a0 D- d
+ Y, p: p) Z  U& g6 g, g滴滴的大数据类面试题首先是常规的自我介绍,应聘互联网公司,自我介绍中可以适当突出自己的合作能力和对加班的看法(互联网公司加班现象比较普遍,这点需要做好心理准备)然后是简单的项目经验询问,涉及的原理、算法、公式推导、算法调优等。由于业务特性,滴滴对服务端高并发的问题比较看重,例如,有技术人员被问到在打车高峰期流量较高的情况下,如何让客户省钱。其他问题包括Hadoop提交作业的总体流程、HDFS的基本原理、Hadoop的shuffle过程、SQL语句自动规范化处理等。算法题目还是排序、递归、遍历等常见题目。
/ b8 `! [5 \  V) @2 p! U5 v  r
, L1 }+ q2 G& p) ^3 `今日头条
8 U& V( V9 t7 a5 x* X1 Z
8 ?* a3 I, z0 Y9 O# Z+ E& \5 M今日头条的面试安排比较人性化,基本会和求职者商量时间,如果时间不合适,也会考虑视频面试,比较灵活。面试问题因人而异,如果项目经历基本空白,面试官会着重考察基础概念的掌握,面试时间半小时到一小时不等。/ D+ [, l( T0 S9 e% |& Q7 C

" W! w6 ~6 ]1 V/ a) C  p 大数据类工程师面试题集锦附指南:互联网公司篇!-7.jpg
# t+ m9 M, H' [. X5 @: N; a; Q& `: J$ V
基础概念部分首先考察对编程语言的理解,Java或者C++/C任选其一,比如Java方面,会询问你虚拟机、类加载机制、垃圾回收机制等问题;其二是对网络基础的考察,三次握手四次挥手(几乎每家公司面试都会提到)、Http协议等;其三是对大数据框架的理解,比如常见的MapReduce理解、shuffle过程理解等;最后是对基础算法的现场编程,比如一个数1234,得到下一个比它大的即1243以此类推。
$ _. H8 M% C6 L) B$ _6 Z
/ I+ K7 d6 D, I( ]& U; A对于项目经验比较丰富的技术人员,面试时对项目经验的盘问会多一些,代码题的难度会高一些,但据前线面试人员反馈,今日头条在代码和算法考察方面,都是一些基础算法,难度不大,但就怕一时之间技术人员反应不出最优解,很多问题都有多种方法可以解答,如果知道可以都写出来。' Q/ l5 R6 R1 ~

1 V4 U* }* @: E+ e, K小米、华为
; k0 C: j0 f; r4 e) @+ B0 b0 {# @3 c3 \8 @, P: S- d/ G, k0 Z
小米和华为的面试过程比较简洁,更多的是业务能力和项目经验的考察。面试题与其他几家公司的大致雷同,面试过程相应较短,同样需要手写代码。
7 d3 s& G6 [% D# t6 ~* Z& q# \5 Y- A' J2 n9 D
总结! H& W# l! p4 b/ a  K
0 K' ~# Z; w; a- C* @" x# h
1、项目经验是所有互联网公司面试时都会认真询问的,因此简单参与或相关度极低的项目不建议写在简历上。同时,对项目中用到的相关算法、遇到的技术难点一定要心里有数。4 O# I; f- u# @7 F
4 M: G3 r: I$ V& X  f, l/ n7 t7 B4 O
2、算法能力依然重要,排序算法、深度、广度遍历搜索是出现频率最高的算法。数据结构方面,堆、哈希表、二叉树是最重要被考到的概念。网络基础部分,三次握手四次挥手和Http协议几乎必问。
4 T; t% G. w7 \' w3 g( c0 O9 M8 I5 q3 r
3、大数据框架部分,不同公司的业务不同关注点不同。但是基本的框架或生态组件的理解,比如MapReduce、Hive和HDFS是被问频率最高的问题,也包括一些组件之间的对比。- q* B2 _7 Z2 c
8 N( e7 T4 K1 `
4、综合素质方面,合作能力是重要考察方面,可以在项目经验中适当增加对合作方面的说明。其次,自己对加班的态度也很重要,互联网公司的加班是常态,求职时需要做好心理准备。


回复 天涯海角搜一下: 百度 谷歌 360 搜狗 搜搜 有道 奇虎 雅虎 必应 即刻

使用道具 举报

您需要登录后才可以回帖 登录 | 马上注册 新浪微博登陆

本版积分规则

关闭

站长推荐上一条 /5 下一条

Archiver|VIP商业源码|企业网站源码|建站之星模板|DEDE模板|新闻中心|源码基地 ( 黔ICP备11002644号 )|网站地图

GMT+8, 2019-1-18 05:01 , Processed in 0.156250 second(s), 18 queries , Gzip On, File On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表