https://juejin.im/post/5cf7ea91e51d4576bc1a0dc2
头条技术面共三面,之后是HR面,面试形式是 视频。时间均控制在1个小时。
1.1 第一面:
第一面主要考察基础,先简单自我介绍,以及介绍一下项目,然后开始考察基础。
1.1.1 TCP相关基础知识
问题1: 请详细描述三次握手和四次挥手的过程
要求熟悉三次握手和四次挥手的机制,要求画出状态图。
为什么建立连接是三次握手,而关闭连接却是四次挥手呢?
这是因为服务端在LISTEN状态下,收到建立连接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。而关闭连接时,当收到对方的FIN报文时,仅仅表示对方不再发送数据了但是还能接收数据,己方是否现在关闭发送数据通道,需要上层应用来决定,因此,己方ACK和FIN一般都会分开发送。
问题2: 四次挥手中TIME_WAIT状态存在的目的是什么?
这个问题是画出四次挥手状态图,会引申问你。不排除还会问为什么四次挥手是四次不是二次等问题。最好是把相关问题均掌握。
问题3: TCP是通过什么机制保障可靠性的?
从四个方面进行回答,ACK确认机制、超时重传、滑动窗口以及流量控制,深入的话要求详细讲出流量控制的机制。
1.1.2 语言的相关基础知识
字节跳动的技术栈是Go和Python,会问一下相关语言的基础。
问题1: 描述线程、进程以及协程的区别?
描述线程、进程以及协程的定义和区别,顺便描述Python语言中三者的使用。
进程之间互相隔离,负责重量级的任务。
线程共享进程的环境,负责较为轻量级的任务,是操作系统能够进行运算调度的最小单位。
协程比线程更加轻盈,协程不是被操作系统内核所管理,而完全是由程序所控制(也就是在用户态执行)。这样带来的好处就是性能得到了很大的提升,不会像线程切换那样消耗资源。
问题2: GO语言中的协程与Python中的协程的区别?
python可以通过 yield/send 的方式实现协程。在python 3.5以后,async/await 成为了更好的替代方案。
线程是内核进行抢占式的调度的,这样就确保了每个线程都有执行的机会。
而 coroutine 运行在同一个线程中,由语言的运行时中的 EventLoop(事件循环)来进行调度。
和大多数语言一样,在 Python 中,协程的调度是非抢占式的,也就是说一个协程必须主动让出执行机会,其他协程才有机会运行。
让出执行的关键字就是 await。也就是说一个协程如果阻塞了,持续不让出 CPU,那么整个线程就卡住了,没有任何并发。
Go 直接通过 go function() 来运行协程。
go协程之间的通信,Go采用了 channel 关键字。
Go实现了两种并发形式:多线程共享内存。如Java或者C++等在多线程中共享数据(例如数组、Map、或者某个结构体或对象)的时候,通过锁来访问;Go语言特有的,也是Go语言推荐的:CSP(communicating sequential processes)并发模型,通过通信实现信息共享。
主要讲解Go中MPG机制。
M指的是“Machine”,一个M直接关联了一个内核线程。
P指的是”processor”,代表了M所需的上下文环境,也是处理用户级代码逻辑的处理器。
G指的是“Goroutine”,其实本质上也是一种轻量级的线程。
上下文 P 会定期的检查全局的goroutine 队列中的goroutine,以便自己在消费掉自身Goroutine队列的时候有事可做。假如全局goroutine队列中的goroutine也没了呢?就从其他运行的中的 P 的runqueue里偷(默认是拿一半)。
当一个协程阻塞的时候,调度器就会自动把其他协程安排到另外的线程中去执行,从而实现了程序无等待并行化运行。
协程有四种状态:Pending、Running、Done、Cancelled
1.1.3 网络编程相关基础
问题1: 网络IO模型有哪些?
5种网络I/O模型,阻塞、非阻塞、I/O多路复用、信号驱动IO、异步I/O。从数据从I/O设备到内核态,内核态到进程用户态分别描述这5种的区别。
问题2: I/O多路复用中select/poll/epoll的区别?
从select的机制,以及select的三个缺点,讲解epoll机制,以及epoll是如何解决select的三个缺点的。还会讲到epoll中水平触发和边沿触发的区别。
1.1.4 HTTP相关基础
问题1: 客户端访问url到服务器,整个过程会经历哪些?
从七层网络模型,HTTP->TCP->IP->链路整个过程讲解报文的产生以及传递的过程
问题2: 描述HTTPS和HTTP的区别
从端口的区别,以及HTTPS是在SSL的基础上以及加密等方面说明
问题3: HTTP协议的请求报文和响应报文格式
要非常清楚请求报文和响应报文的组成部分,要求在写具体案例。
问题4: HTTP的状态码有哪些?
从2xx,3xx,4xx,5xx分别举例出常见的code,面试官会问301和302的区别,以及500/503/504分别在哪些场景出现。
1.1.5 缓存和数据库的基础知识
问题1: 描述一下redis有哪些数据结构。
基础的数据结构有5种,String/List/Hash/Set/Zset,还答了高级数据结构HyperLogLog/BitMap/BloomFilter/GeoHash。面试官还问了BloomFilter的原理以及Zset的实现原理,主要讲解跳跃表。
问题2: MySQL场景题目
面试官提供场景,要求写出查询SQL,考察联合语句,如何分页以及复杂语句的优化。
1.1.6 裸写算法
树的非递归先序遍历。
1.2. 第二面
1.2.1 项目经验
第二面跟个人项目经验很大,面试官会要求先详细介绍最近的项目,介绍项目的同时会打断你,延伸项目的难度和架构,要求提出更优的解决方案。
之前项目经验里写了一个分布式的项目,面试官着重讨论了这个项目的实现方案,引申出分布式事务以及分布式一致性等问题,同时会要求在当前项目的基础上附加条件,要求你提供解决方案,这部分比较难,要求对项目的深度理解很透彻,面试前一定要对项目了解非常清楚,如果是多人合作的项目,最好也要了解别人编写的功能部分。
还问了一些API业务的架构问题,负载均衡、CDN、DNS等问题。以及也问到了HTTP相关问题,要求描述HTTP的版本之间的区别,主要是1.0/1.1/2.0三个版本的区别。详细说了1.0与1.1之间是连接模型的区别(短连接、长连接、管线化),1.1与2.0之间的区别是I/O多路复用的单一长连接、服务器推送、二进制分桢、首部压缩等。
1.2.2 裸写算法
回行矩阵遍历
1.3. 第三面:
1.3.1 项目经验
第三面也是考察项目经验,但是着重系统设计,会抽一段之前的项目经验(跟第二面的经验肯定不同),要求你描述目前的方案,以及缺点。温馨提示,一定要简历上的项目经验非常熟悉,会抽上一段工作经验的项目。
要求说出缺点,这个一个坑,说出来后要求提出改进方案,所以回答要谨慎,最好面试前对目前的项目假设附加条件,提出2-3种备选方案。
要求模块化,会要求对目前系统如果做微服务架构,如何进行服务的拆分,拆分的规则是什么,考察微服务架构相关知识,服务治理(限流、降级、熔断)。
举例: 之前项目中由涉及到社交场景中热度池的设计,要求讲出现有方案和缺点,然后说出优化方案,还会将目前的量级扩大很多倍,要求重新架构出方案。还有讲到粉丝关系,推拉组合,也就是读扩散和写扩散二者的区别,以及二者如何结合。
1.3.2 裸写算法
二叉树多个节点的最近公共祖先
1.4. 总结
三面技术面之后,就是HR,这个就不多说了。整体字节跳动的面试感受,面试官很专业,要求基础知识很熟悉,面试之前一定要准备后再去面试。LeetCode题目也要刷。手写算法留的时间不多,3-10分钟,如果3分钟还没写,就要求讲出解题思路。
切记面试前一定要刷题和准备,简历上的项目不熟悉的千万不要写上去,写上去的项目备好2-3个技术方案。