今日头条-算法岗-三面面经(8月18日)
今日头条算法工程师三面面经一面:
(9:00~10:00)
1、自我介绍
2、编程题(链表反转,二叉树中序遍历递归+非递归)
3、3种颜色砖块,单位长宽,铺满单位宽,长m的地板有多少种铺法?
4、数据挖掘竞赛介绍
1)充当角色
2)数据预处理方法
3)缺失值处理方法
4)特征工程怎么做的,为什么选这些特征。
5)选用的什么模型,各个模型的效果,以及为什么?
6)xgb、lgbm调参方法
7)模型融合方法
5、论文和专利介绍
6、深度学习与机器学习的异同及联系。
7、梯度消失/爆炸问题 原因,解决措施。
8、SVM原理,与感知机的区别
9、Hadoop与Spark的区别
10、shuffle阶段的过程详细介绍一下
11、Spark基于图计算的优势
二面:
(10:00~11:30)
1、编程题
二叉树最大深度
地图中找出大陆的个数(一道BFS题)
2、无人机竞赛介绍
1)天气指标如何预测的,特征有哪些
2)采用的模型是什么?各个模型对比效果如何?
3)融合的技巧有哪些?比赛中采用了哪种手段,效果为何有提升?
4)路径规划模型的思路是什么?这种方法与其他队伍的方法相比优势在哪里?
3、论文介绍
4、boosting与bagging的原理以及异同点。
5、xgboost与lgbm的原理。
6、用过哪些可视化组件,如何对数据进行可视化分析。
7、Spark作业运行机制以及Spark各组件运行机制。
8、MapReduce中map和reduce各自负责什么内容,两个阶段如何衔接。
9、命名实体识别与关系抽取的任务是在干什么?目前常用的模型是哪些?自己项目中怎么用的。
10、阐述CRF原理
11、阐述BiLSTM的BP过程,为何BiLSTM后接一层CRF会有提升?CRF层自己是怎么实现的。
12、JVM GC机制的原理
13、变量、对象等在内存中的存储差异。
14、打开https网页,请简述整个流程会发生什么事情。
三面:
(1:30 ~ 2:50)
应该是老大之类的人物,看起来很有派头。
1、自我介绍
2、编程题:
二叉树输出给定节点到目标节点的路径
寻找两个字符串中只有首尾字符相同的所有子串,例如 ABCDE 和 ADCAE中包含(ABC--ADC)以及(CDE--CAE)
3、编程马拉松比赛介绍
1)docker是什么,比赛中哪些地方有使用到
2)k8s是做什么的,机制是什么
3)书写dockerfile编译镜像时使用过哪些关键字,有什么注意点
4)日志存储模块是如何设计的
5)如何管理HDFS中的日志数据
4、自己实现过哪些机器学习算法?
1)单机实现还是多线程实现的
2)多线程如何更新对大量参数多梯度更新
3)实现随机梯度算法的流程是怎样的,样本随机是如何体现的。
5、scala中的各种算子有使用过吗?说一下map函数、reduceByKey函数的机制
6、有些过海量数据处理的MapReduce脚本吗?(答:没写过,然后让我想想如何使用MR对大量文本数据进行清洗)
7、专利介绍
8、介绍spark-checkpoint的机制,与持久化算子的联系与区别
9、无人机竞赛建模思路介绍
10、知识图谱构建需要注意什么地方,难点在哪里。
11、介绍一下freebase的schema
12、目前自己项目的图谱有什么进展,为何这样构建
13、NER、RE相关问题:
1)基于字的话数据是否稀疏,如何解决?
2)标注系统规范有哪些
3)构建词典匹配的方式进行标注会有什么问题?如何解决?
4)现阶段比较成熟的NER模型有哪些?相关paper是否读过?有没有自己复现模型?可以改进的地方在哪里
5)进行RE时的难点在哪里?通识领域与特定领域进行RE时的差别在哪里?
14、xgboost的原理介绍一下。
面试总结:
头条的面试官总的来说都挺好的,编程题检查时也会指错并引导,问的问题除了两三道关于java开发方面的,其他的都是围绕简历发问,三面的大佬比较偏业务,一面二面的面试官比较偏理论基础。想不到的是头条问的分布式的相关东西多于其他公司,可能头条的容器技术是真的牛批。三次面试的一个共性就是自我介绍完啥也不说基本都先来一道编程题,然后发问,问到最后,再以一个编程题收尾(上面我是把编程题放一起记录啦)。最后,HR说两周内若无部门加面就可以去官网查状态了。
转载自:https://www.nowcoder.com/discuss/95654
页:
[1]