西安站百度一二三面面经
14号晚上接到百度一面通知,岗位是机器学习数据挖掘,从15号开始到20号经历了百度三面,受益匪浅,深刻地感受到百度的技术,把三轮面试的面经发一下和大家交流交流。攒攒人品,虽然进备胎池的可能性很大-.-!2017/9/15
百度一面
一面的话基础比较多,难度中等
1.
LR和SVM的应用(这一部分比较细,具体忘了);
2.
SVM核函数有哪些,核函数的作用;
3.
手撕计算日期差代码;
4.
一枚正反硬币,一枚两面都是正的硬币,一枚两面都是反的硬币,任意选一个,抛出,正面朝上的概率;
5.
ABCDE排列,AB必须在一起,可以左右互换,C必须在D的右边,有多少种方法;
6.
如何判断链表中有环;
7.
项目;
2017/9/18
百度二面
二面的话,面试官是个大佬级别的人物,总是装不懂,说我不清楚这个那个,你给我讲讲,然后我说完给我继续补充,机器学习模型中的细节很多很多。。
8.
C++中哪些强制转换,每个强制转换的应用;
9.
解释虚函数,虚函数表是什么,虚函数指针如何快速查找到虚函数表中的函数;
10. 虚函数前面可以加static吗,为什么?
11. 写一个字典树,数据结构自己定义,实现插入功能;
12. N个有序的链表,将这些链表合并成一个有序的链表;
13. TopK,那如果查找第k个元素呢;
14. 算法题:实现字符串分割,分割后每个word都在一个字典中,返回true,否则返回false;
15. 红黑树
16. 问项目
17. 交叉熵,LR的交叉熵损失函数,如何优化
18. SGD,GD
19. Xgboost原理,如何获得每个特征的重要度,xgboost里面个get_score的原理是什么;
20. Bagging是什么,RF的原理,如何解决过拟合,假如有m个特征,一般选多少特征拟合一棵树,为什么只选一部分的特征;
21. 线性回归将特征如何转为高维度
22. 为什么SVM中核函数做内积就可以,核函数的含义是什么
23. 正则化,L1为什么能使参数变稀疏
24. 高斯核函数的物理意义
2017/9/20
百度三面
问题很深入,很尖锐。大大佬,先收下小弟的膝盖。。。
1.项目,总之就是为什么这样,这样为什么好?
2.Adaboost和GBDT的区别;
3.Adaboost推导;
4.聚类算法有哪些,高斯混合模型聚类方法,高斯混合模型中的隐变量是什么,对应EM中Q函数的哪部分,说明Q函数的意义,深入探讨了EM算法,发现自己只是浮于表面。。。;
5.场景问题:给百度用户的搜索日志,海量字符串,已知少量的化妆品品牌,如何根据这些化妆品品牌和海量的搜索日志,获得大量的化妆品品牌。
6.国内哪些书籍,国外哪些机器学习方面的书籍,国内哪些学校的NLP做的好,等等。
7.聊如何学习,百度部门等等。受益匪浅。。。。
转载自:https://www.nowcoder.com/discuss/45583
页:
[1]