缘起
一个线上 Crash
Crash
最终定位到 MBWebManager
一个方法中:
其中 MBWebView_dispatch_main_sync_safe
宏的定义为:
这段代码是为了兼容外部在非主线程调用,其本质目的是想确保自己在 主线程 中执行,由于该方法需要同步返回一个 web
实例,因此使用了 dispatch_sync
。
分析
怎么崩溃的?
通过查看几个 Crash
的堆栈,发现这个 Crash
的堆栈都是一致的业务流程(是从一个 小贷 的业务流程调用过去的),看到了「必现」的曙光~
最终重现了Crash
:
Crash 原因
在一个「串行」队列的「同步」任务中,提交另一个「同步」任务,导致两个任务相互等待,死锁!
翻车过程
1、调用方所处一个「自定义串行队列」,但这个队列中的任务被“绑定”到主队列同步执行:
2、由于当前队列「不是主队列」,所以逻辑最终走到了 else 里面:
3、虽然当前队列「不是主队列」,但是当前任务被“绑定”到主队列同步执行,因此,在这个同步执行任务中 提交另一个同步任务到主队列,就造成了死锁。
问题1:为什么通过 dispatch_set_target_queue()
“绑定”到 主队列 的任务是「同步执行」?
按照网上的示例,做了一个实验:
只是通过实验证实了,但其内部原理,有同学了解的话,望不吝指教,万分感谢🙏
问题2:为什么要判断当前是否是主队列?
这是本文的重点!!!
分析当时编写 MBWebManager 的初心,我只是想确保任务在「主线程」中执行,那么,为什么,最后条件判断写的是「判断当前是否是主队列」呢?
真是一个灵魂拷问~
是的,我随大流了……
因为大家都这么写,这么写是「公认的更安全的判断方法」
但是,它为什么更安全呢?
为何 NSThread.isMainThread 被认为不够安全?
Goolge了很多,大致得到了以下原因:
1、在主线程中执行的任务,不一定就是在主队列中
我找到两种写法可以实现这个结论:
(1)使用 dispatch_sync()
(2)使用 dispatch_set_target_queue()
2、在主队列中执行的任务,也不一定在主线程中
问题示例:
[NSThread isMainThread] is probably not what you want!
这篇文章里的示例可能有悖常识:主队列中的任务竟然不是在主线程中执行!!!
不要激动,导致这种原因最关键的是这行代码dispatch_main()
,就是这货让主队列的任务在非主线程运行。
这个方法苹果官方文档这样解释的:
/*!
* @function dispatch_main
*
* @abstract
* Execute blocks submitted to the main queue.
* 执行提交给主队列的任务blocks
*
* @discussion
* This function "parks" the main thread and waits for blocks to be submitted
*
* to the main queue. This function never returns.
* 这个函数会阻塞主线程并且等待提交给主队列的任务blocks完成,这个函数永远不会返回
*
* Applications that call NSApplicationMain() or CFRunLoopRun() on the
* main thread do not need to call dispatch_main().
*
*/
API_AVAILABLE(macos(10.6), ios(4.0))
DISPATCH_EXPORT DISPATCH_NOTHROW DISPATCH_NORETURN
void
dispatch_main(void);
意思是这个方法会阻塞主线程,然后在其它线程中执行主队列中的任务,这个方法永远不会返回(意思会卡住主线程)
如果去掉dispatch_main()
这行代码,就会正常在主线程里执行任务
3、“据说”某些组件的某些方法,必须在 主队列 中执行
问题示例:
这个文章里面说的好像靠谱一些,但是我做了相同的实验,结果仍然与之不吻合:
网络上说「不在主队列中执行就会 crash 」的,除了上面的 MapKit 中的 addOverlay,还有一些,例如:VektorKit(原谅我的孤陋寡闻,没用过,所有就没有再继续实验),但我发现,这些文章大多都是 15年 或者 16年 发表的,所以,我猜测,这些组件后来修复了这个「BUG」了吧(是的,我更愿意把它理解成一个 BUG,因为如果组件功能设计某个 API 只能在 主队列 中执行,就应该以明确的文档告知外部使用者,如果没有文档说明,但在 非主队列 中执行就 crash,我想,更多的过错应该是这个组件的开发者吧,即使这个开发者是苹果内部人士,哈哈哈哈哈哈)~
真相
所以,通过上面的实验,和分析,其实并不是 NSThread.isMainThread 不安全,而是掉进了某些组件的 BUG 里面~
这篇文章说得还是比较详细:GCD’s Main Queue vs. Main Thread
心法
1、网络上的文章,不可尽信,还是要时刻保有一颗敢于质疑和求证的心态;
2、明确自己的初心,就像我这个例子里,就需要明确:到底是需要 主线程 还是 主队列?
知识点
1、多个 队列,通过 dispatch_set_target_queue()
"绑定"到 一个 target queue 后,其中的任务是「同步执行」的;
2、通过 dispatch_sync()
执行的任务,会在「当前线程」中执行(如果当前线程是主线程,即便 当前队列 不是 主队列,任务也会在 主线程中执行);
3、使用 dispatch_sync
时,要非常小心,很容易掉进死锁问题中(这个只能具体问题,具体分析了)。
补充
回到这个 crash 问题,其解决方案就是:
将:
if (strcmp(dispatch_queue_get_label(DISPATCH_CURRENT_QUEUE_LABEL), dispatch_queue_get_label(dispatch_get_main_queue())) == 0) {
block();
} else {
dispatch_sync(dispatch_get_main_queue(), ^{
block();
});
}
改成:
if ([NSThread isMainThread]) {
block();
} else {
dispatch_sync(dispatch_get_main_queue(), ^{
block();
});
}
有同学说,可以改成下面这样,但前面第一个条件是冗余的,因为「主队列中的任务,一般情况下都是在 主线程 中执行」
if (strcmp(dispatch_queue_get_label(DISPATCH_CURRENT_QUEUE_LABEL), dispatch_queue_get_label(dispatch_get_main_queue())) == 0
|| [NSThread isMainThread]) {
block();
} else {
dispatch_sync(dispatch_get_main_queue(), ^{
block();
});
}
谢谢阅读,如有纰漏,望不吝指教🙏