一、前言
首先,我拿到的是cvte的自然语言处理实习生的offer,待遇还不错吧。包吃包住,朝九晚九,一周上五天半的班。下面开始吹水……
二、学习过程
1. 理论基础
课本:《机器学习》、《概率论与数理统计》
视频:吴恩达机器学习、吴恩达深度学习、李宏毅机器学习、机器学习-白板推导
2. 代码能力
课本:《机器学习实战》、《利用Python进行数据分析》、《Python自然语言处理》、《TensorFlow实战》、廖雪峰Python
视频:周莫烦Python、B站的Tensorflow教程、动手学习深度学习-李沐
3. 小结
我的学习过程大概是这样:
机器学习:
- 先看一下机器学习的理论基础,包括上面提到的书和视频。
- 接着学一下python基础。
- 再利用《机器学习实战》去把每个模型理解透彻
- 接着根据 Kaggle 项目实战 把每个模型融会贯通。
深度学习:
- 同样是先看深度学习的理论基础。
- 这一步我很纠结于编程语言,tensorflow、pytroch、mxnet、keras,基本上我都试了个遍,跑了基本的cnn、rnn等。
- 刷深度学习相关的论文,跑了个 textCNN。
4. 学习建议(结合各位面试官)
如果你的实验室没项目,你的学习全靠自己的话
1. 论文:
论文分为两部分(只你研究的方向的论文即可)。
一部分是行业里面现在比较常用的模型,这一部分必须熟练掌握。
另一部分是最新的论文,最好follow一下。能发论文最好了,锻炼一下思维以及创新能力。
2. 比赛:
这一部分建立在理解各个模型的基础之上。
首先多参加一些有答案的比赛(可能是已经结束的),比如看看kaggle每个比赛里面的kernal。
掌握一点比赛技巧之后,就可以去争取一定的名次(最好是研究方向相关)。
这也是我目前正在进行做的事。
三、面试经历
1. 深声科技(3k-6k)
1.1. 最大熵
1.2. 支持向量机
1.3. 聊聊人生。。
小结
感觉他们是要招立马能工作的人,研一的人去实习在面试官眼里就是个笑话。
这是我的第一个面试,太老实了,有什么说什么,而且极度不自信。挂了。
2. 数据故事(3k-4k)
笔试题目:
2.1. 请用以下任一语言(C/C++/Java/Pyhton)实现稀疏矩阵乘法运算。要求:定义稀疏矩阵的表示;定义计算稀疏矩阵乘法方法,输入两个稀疏矩阵返回两矩阵相乘的结果矩阵。
2.2. 请简要说明朴素贝叶斯及其计算过程。
2.3. bagging、boosting的区别。
2.4. 请写出sigmoid函数的公式定义,并说明其在逻辑回归中的作用。
2.5. 请写出tf(词频率)计算公式、idf(逆向文档频率)的公式和作用。
2.6. 简述 L1&L2 正则的区别。
2.7. 描述 Word2Vec 的原理和训练方法。
2.8. 一维数据的拟合,给定数据集{xi,yi}(i=1,...,n),xi是训练数据,yi是对应的预期值。拟使用线性、二次、高效等函数进行拟合。
(1)请给出三次拟合的误差函数表达式。
(2)按照梯度下降法进行拟合,请给出具体的推导过程。
一面
2.9. 聊项目
2.10. tf-idf
2.11. 词嵌入,Word2Vec
2.12. 排序算法及其时间复杂度
二面
2.13. 聊项目
2.14. 开放性问题:海量某行业数据,如何对该数据进行分析。比如,美的空调很好。(词性标注、句法分析、句子依赖等……)
HR面
我们这里只有正式工编制和应届生编制,没有实习生编制。
小结
笔试:多亏了帆哥,才能把答案写满。
面试:面试官对我的评价是,掌握得还不错。
其实只是刚好问到我会的。那个开放性问题我没有回答得上来。我事前知道他们招的是应届生,本来是想着去混面试经验的,就没有骗他们我是19届毕业了。
3.CVTE
一面
3.1. 如何用HMM进行分词
3.2. 解释一下贝叶斯,它的公式是怎样的,哪个是先验,哪个是后验
3.3. 什么是最大团,跟势函数有什么关系?
3.4. 计算机网络的五层模型
3.5. 知道哪些设计模型?解释一下?有哪些应用场景?
二面
3.6. HMM、CRF的区别
3.7. 解释一下fastText文本分类
3.8. 解释一下textCNN
终面
- 给自己前面面试打分
- 从哪里知道CVTE的
- 家庭情况、个人介绍
- 本科期间,你做过最有成就的事
- 本科期间,你努力了也未能达到的事。
- 本科期间,最有挑战性的事。
- 未来工作、生活的规划
- 人生目标
- 考研的原因(这个可能是因为我说我最有成就感的事是考研)。
- 如果给你offer,你会因为什么而不来
总结
能拿到这个offer,5分靠运气,4分靠实力,1分靠助攻。
运气:1. 我的简历居然过了筛选,里面其实没多少东西。2. 一面居然过了,其实有很多题目没有全部答对,并且很紧张。3. 面试官问的东西,刚好是我会的。
助攻:在准备HR面试的时候,舍友帮了我不少。
感觉技术面还是相对简单一点的吧,而且我只跟面试官聊了20分钟不到。别的实习生,真正有项目的,都差不多聊了一个小时。
HR面的话,就尽量表现地真诚一点、很想来这家公司;表现得很符合这家公司的企业文化。
四、感谢
1. 感谢我的舍友,帆哥,在准备HR面试的时候,帮我仔细修改每个问题的答案。
2. 感谢我的导师,给了我全部的自由和绝对的支持。
- 感谢一下自己吧(臭不要脸2333)。想过放弃搞人工智能很多次,最终还是坚持下来了。
-
注重成长,期待毕业前能实现第三个小目标吧。