信也科技面经

2020.9.15投递
2020.9.18笔试 七道主观题 3or4概率统计题目、1道编程填空题目、1道风控模型分析题目、1道机器学习题目

2020.9.25 一面有些记不太清除了
自我介绍

挖实习经历:风控相关:解释一些WOE值是怎么计算的,IV值是怎么计算的

还有就是一些风控建模细节

大数定律

线性回归的拟合优度R^2是怎么计算的

解释一下P值的概念

对信也了解吗?以前的拍拍贷

如果客户一直对你的模型不满意怎么办

解释一下过拟合(有好多家笔试都考到了的)

撸了一道sql题 两表连接+筛选条件 比较简单

整体体验蛮好的

反问:平时的主要业务和工作是什么?

2020.9.30 二面

没有自我介绍,面试官上来就吐槽我的简历太简洁(要不是一面的面试官问了很多问题都不知道我做了这么多工作),尴尬。。。 投递的有些匆忙,用的是最开始的简历

挖实习经历

中心极限定理(我忘记了,说我对大数定律比较了解,然后讲了大数定律)
大数定律、中心极限定理真的很重要,研究生复试问到了,找工作也还是逃不掉啊

树模型、gbdt的实现过程 不要原理,要实现过程 我讲了一堆boosting的原理,还有gbdt和adaboost的区别于联系 但是面试官还是说我说的是原理 引导问:决策树是怎么生成的,我就简单讲了下基于信息熵、信息增益、基尼指数、平方损失等,选择分裂节点,然后对于子树进行递归操作

xgboost是怎么分裂的? 没答上来

boosting和bagging的差异? 信手拈来

lightgbm和xgb的区别?xgboost是预排序 lightgbm是基于直方图,无论存储还是计算都要快很多

xgb,lightgbm的调参? 贪心算法,优先调重要的,然后调次要的

怎么降低过拟合 调整顺序 优先调什么?

建模时xgboost的损失函数是什么样的?(没答上来,忘记了。。。应该是回答auc吧) 追问了解mae和mse吗? 解释一下两者的差异?


面试官看我用过catboost,让我讲一下(我只是用过,没有太深入的进行了解,就讲了一下处理类别变量的优势)

评分卡模型了解吗?讲一下步骤

评分卡模型得到的分数在某一个分数段上比较集中该怎么处理?

有多少家公司正在面?

你有想去的地方吗?你的计划是留在一线城市嘛?

反问:数据挖掘岗平时的主要工作是干什么呢?(好像问了和一面一模一样的反问,不过两个面试官给出的角度还是不太一样的,不过确实是我想做的风控建模的工作)

国庆后给通知么?(是的) 本来复试想推倒国庆后,国庆好好准备一下的,不过hr说,复试的流程要在国庆前结束。

二面的整体感觉也是很棒的,感觉面试官问的很技术,问到了各种算法的细节。我也还有学习学习中的细节还是需要补充的

————————————————————————————————————

继续多看看风控的文章啦,继续努力&许愿offer

————————————————————————————————————

中心极限定理&大数定律:
参考:
大数定理的通俗理解(辛钦、伯努利、切比雪夫大数定理)
https://www.zhihu.com/question/22913867/answer/1064701533
https://github.com/sijichun/MathStatsCode/blob/master/notebook_python/LLN_CLT.ipynb
https://www.zhihu.com/question/22913867

简单而言,大数定律讲的是样本均值收敛到总体均值(就是期望),像这个图一样:


而中心极限定理告诉我们,当样本量足够大时,样本均值的分布慢慢变成正态分布,就像这个图:


这个答案太强了


总而言之:

  • 大数定律解释了为什么我们可以用均值来作为总体期望的估计;
  • 中心极限定理给出的是大数定律的误差:标准差乘以标准正态分布,也可以理解为样本的均值服从标准正态分布。

————————————————————————————————————————
R^2是怎么计算的?

也叫决定系数、判定系数、拟合优度。
R方的含义是,预测值解释了y_i变量的方差的多大比例,衡量的是预测值对于真值的拟合好坏程度。通俗理解,假定y_i的方差为1个单位,则R方表示"使用该模型之后,y_i的残差的方差减少了多少"。比如R方等于0.8,则使用该模型之后残差的方差为原始 y_i值方差的20%。

对于分式:

  • 分子为预测结果的残差平方和
  • 分母为y的方差
  • 两者相比,若为0,则说明模型100%解释了y的方差,若为1则说明该模型与拿直接拿均值预测的效果是一样的。

—————————————————————————————————————————
P值,虽能讲出一二,但感觉讲的不够清楚明白。

参考:https://www.zhihu.com/question/35891708/answer/517878215
https://zhuanlan.zhihu.com/p/105028919

P值是什么,P值是当原假设为真时,比所得到的的样本观察结果更极端的结果出现的概率
这个极端的概率和越高或越低,结果就越不可能偶然发生,结果就越有可能有意义。

通俗讲,有一个原假设是H0,然后做实验检验这个假设,实验结果显示居然不太符合原假设(如果实验显示符合原假设的话那我们当然就更应该相信原假设),具体例子:假设硬币均匀(原假设H0),我们抛100次,实验结果显示90正10反(所得样本观察结果),或者你也可以用另一个例子:假设硬币不均匀(原假设H0),抛100次得到52正48反(所得样本观察结果),P值在上面两个例子中表示分别是1:硬币均匀时抛100次得到90,91,92,93,94。。。100次正(或者反,没关系,理解一下就行)的概率累加(更极端结果出现的概率累加),2:硬币不均匀时候抛100次得到52,51,50次正的概率的累加(更极端结果出现的概率累加),在上面例子中,在各自原假设下得到其观察结果的概率很小很小,p值也很小很小,但是这么小概率的事情居然发生了,发生了!!!以至于我们不能再去相信原假设了,所以拒绝了原假设,所以p值越小越不能相信原假设。

p值就是“拒绝原假设最小的显著性水平。若我们想要拒绝原假设,你设置的显著性水平不能比p值再小了。即若设置的显著性水平比p值还小,那你只能乖乖的接受原假设;若设置的显著性水平比p值大,那就狠狠地拒绝原假设。

————————————————————————————————————————

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,214评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,307评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,543评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,221评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,224评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,007评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,313评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,956评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,441评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,925评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,018评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,685评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,234评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,240评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,464评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,467评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,762评论 2 345