关于算法工程师的一些准备

前段时间朋友说阿里的内推开始了。他可以给我推蚂蚁金服

蚂蚁金服在成都和杭州两个地方,而且作为一个学生,工作能进阿里巴巴是一种信仰。所以抛开学历,能力。不管是出于何种原因,我都要去试一试。

我想面的岗是算法工程师(机器学习)。因为读研本来就是学的这个方向,再加上既然选择了读研究生,就要读的有价值,有意义。把自己学到的东西应用到实际生活当中,这难道不是一件很有意义的事情吗?

下面是准备篇:

之前发现了一个很有意思的网站叫传送门,上面有很多很有意思的公众号。有一个我关注的要特别推荐机器学习算法与Python学习。上面有很多对于这个领域真正的思考。下面的基本是都转自他的公众号和博客http://chuansong.me/n/1763421851215

一般机器学习的岗位主要考察应聘者三方面的能力:1.算法和理论基础(机器学习实战+统计学习方法);2. 工程实现能力和编码水平(牛客网+剑指offer+leecode)3.应用场景(搜索,广告,垃圾过滤,安全,推荐系统)

下面是一些面经:

1.百度大数据

一面

-->手写代码:字符串反转+快排

-->如何提高python的运行效率?写一个简单的正则表达式,将文本中的(123.4)匹配出来

-->机器学习:

knn(分类与回归)

CART(回归树用平方误差最小化准则,分类树用基尼指数最小化准则)

Logistics(推导)

GBDT(利用损失函数的负梯度在当前模型的值作为回归问题提升树算法中的残差的近似值,拟合一个回归树)

随机森林(Bagging+CART)

SVM与随机森林比较

改变随机森林的训练样本数据量,是否会影响到随机森林学习到的模型的复杂度

Logistics与随机森林比较

GBDT与随机森林比较

自己实现过什么机器学习算法

推荐算法(基于用户的协同过滤,基于内容的协同过滤)

如何做一个新闻推荐

其他:Map-reduce,Hadoop ||  一个袋子里有很多种颜色的球,其中抽红球的概率为1/4,现在有放回地抽10个球,其中7个球为红球的概率是多少?(伯努利试验)

二面:

-->项目:项目哪个地方印象深?可以迁移到哪一块?

-->数据结构:介绍大项堆和小项堆 || 二叉树的前中后序遍历 || 手写前序遍历算法(一定不要忘记异常处理) || 介绍前序非递归算法

-->编程语言: [py] list有哪几种添加元素的方法,能否从表头插入元素?(append, extend和insert, insert能从表头插入元素, 但是时间复杂度为O(n).)

如何获取list中最后一个元素arr[-1]

a = [1, 2, 3, 4], b = a, b[0] = 100, 请问print(a)结果是什么 [100,2,3,4]

2. 阿里巴巴电话面试

-->项目

-->机器学习

线性分类器与非线性分类器的区别和优劣

特征比数据量还大时,应该选择什么分类器

对于维度很高的特征,选择线性分类器还是非线性分类器

对于维度很低的特征,选择线性分类器还是非线性分类器

如何解决过拟合问题

L1和L2正则的区别,如何选择L1和L2正则?

随机森林的学习过程

随机森林中的每一棵树是如何学习的?

随机森林算法中cart树的基尼指数是什么


-->算法:如何找到第k大的数

机器学习不光要考虑算法本身,更多的还要去思考应用


百度NLP

统计知识

给定一个分类器p,它有0.5的概率输出1,0.5的概率输出0。

Q1:如何生成一个分类器使该分类器输出1的概率为0.25,输出0的概率为0.75?Ans:连续进行两次分类,两次结果均为1则输出1,其余情况(10,01,00)均输出0。

Q2:如何生成一个分类器使该分类器输出1的概率为0.3,输出0的概率为0.7?Tip:小明正在做一道选择题,问题只有A、B和C三个选项,通过抛一个硬币来使选择3个选项的概率相同。小明只需抛连续抛两次硬币,结果正正为A,正负为B,负正为C,负负则重新抛硬币。Ans:连续进行4次分类(2^4=16 > 10),结果前3种情况则输出1,结果接下来7种情况则输出0,其余情况重新进行分类。

1. 代码算法:基本算法(如快排等,需要熟练掌握) + 剑指Offer(面试经常出相似的题) + LeetCode(剑指Offer的补充,增强动手能力)

2. 机器学习:李航《统计学习方法》(读3遍都不为过啊!) + Coursera Stanford《Machine Learning》(讲得很基础,但是没有告诉你所以然) + Coursera 台湾大学《机器学习高级技法》(里面详解了SVM,Ensemble等模型的推导,优劣)

3. 请详细地回忆自己做过的项目,项目用了什么算法,为什么用它,有什么优缺点等。如果没项目经验可以参加天猫大数据比赛和Kaggle比赛。

4. 教你如何迅速秒杀掉:99%的海量数据处理面试题。[http://blog.csdn.net/v_july_v/article/details/7382693](基本每次都有一道海量数据处理的面试题)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345

推荐阅读更多精彩内容