上午面了一点资讯
一面:
1、问简历
2、防止过拟合的方法
3、DeepFm模型介绍一下
4、判断是否是回文链表
5、链表反转
6、spark任务运行中,发生了数据倾斜,这种情况下你一般如何处理
二面:
1、问简历
2、Dueling DQN和DQN有什么区别
3、快速排序
三面:
1、介绍下DeepFM
2、信息流采样,有n份数据,但是n的长度并不知道,设计一个采样算法,使得每份被选择的概率是相同的。
考虑这样是不是可以,总是以1/i的概率去选择每一次遍历的对象,比如从1,2,3,....,N, 每一次遍历到x时,总是以1/x的概率去选择它。
一开始选择第一个数据,并以概率1/2选择第二个数据,以1/3选择第三个数据,也就是说设结果为result,遍历第一个时result = 1,第二个以1/2的概率替让result = 2,这样一直遍历概率性的替换下去,最终的result就是你的结果。被选择的概率就是1/n。
第x个数被选择的概率 = x被选择的概率 * (x+1没被选择的概率) * (x+2没有被选择的概率) ......(N没有被选择的概率)
被选择的概率 = 1/2 * 2/3 * 3/4 * 4/5 .....* (n-1/n) 我想你知道答案了吧? 对! 是1/n.这样就可以在不知道N的大小的情况下等概率的去选择任意一个对象了!
3、判断两个链表中是否有相同节点
https://blog.csdn.net/Audience_/article/details/77648916
4、模型在线下评估和线上使用时,往往出现线上实际效果不如线下效果的情况,请分析可能的原因。