Sharber 发表于 2018-9-14 08:32:13

百度 提前批 大数据岗位 面经

一次难忘的百度提前批大数据岗面试:
说什么好呢?可能无缘吧。哈哈。
开始,介绍自己,熟悉机器学习吗?
一面,说一下mapreduce框架。
k个n长的有序数组进行merge,并分析时间和空间复杂度。
A同学的支持者有a人,B的有b人,这些人一起投票,并开始唱票,输出P(a>b)的概率。这是一个动态规划问题。
java的各种GC算法,并画图解释。
复制算法,标记清理,标记整理
哪些可以作为GC roots?
怎么找到并回收那些没有标记的对象?
hashmap的底层结构,红黑树有什么限制条件?hashmap怎么处理冲突?
还有什么处理冲突的方法?哪个好?
gpu编程有什么限制条件或者说是前提条件?
gpu是个处理什么问题?
mapreduce适合处理什么问题?
字符串匹配。怎么匹配的?
kmp解释一下,我说不会这个。
我说有另一个方法,后缀树的方法。讲完后问我为什么会想到这个?
最后他给我说了一个BM算法,我说不懂。其实我听过,但是当时没有看懂。
二面,
上来就问机器学习,我说我不会。
全程尴了个尬啊。
会用C
吗?我说只是会用。
直接问STLvector.clean会不会删除内存空间,我说不知道。
智能指针听过吧?没有。
又问了一个多线程编程,网络编程会吗?socket编程会吗?用C
实现过什么项目?那你有什么拿的出手的项目?等等一系列,直接双击暴毙我。
当时彻底蒙逼。问一个不会问一个不会。
进程通信方式,线程通信方式。
线程怎么同步?加锁啊,或者CAS。
接着就是一写多读怎么实现?我说各种并发容器,同步工具,闭锁和栅栏,他都说不对。没有效率。我直接无语了。当时感觉把知道的都说了。但是他还是不满意。心如死灰般说出了一个前几天才看到的同步工具,writeoncopy,读写分离可以吗?但是不能保证实时一致性。
面试官惊了,能详细说一下吗?然后就哔哩哔哩详细说了一遍,他说不错,能想到这个很不容易。线上就是用的这个。好险。没有令他特别失望。紧接着,面试官好像来了兴趣,我在问你几个问题吧。我说可以啊。
说一下背包问题。把思路和公式写出来。说完后面试官突然说有点事需要离开。
就这样,等啊等,等到了三面,一个凤巢部门经理,从头到尾,顺着简历往下问,一个点都不落下。


转载自:https://www.nowcoder.com/discuss/98561
页: [1]
查看完整版本: 百度 提前批 大数据岗位 面经