在现实生活中,没有任何AI是完美的、不出错的,即便AI本身有足够大的知识量,由于外在环境的不断变化,AI会因为环境的变化而做出错误的判断。因此,当AI做出错误的判断时,AI需要能够自我诊断,找到究竟是AI内部储存的哪些知识内容或者知识结构导致了这次错误的发生,并且将这一部分错误纠正过来。下面介绍一种排查错误的算法:Error Detection算法。
一般来说,AI会有一系列的判断正确和判断错误的经验,我们将AI判断为正确但实际上错误的示例计为‘假正例’,将AI判断为正确且实际上也正确的示例计为‘真正例’,将‘假正例’具有且‘真正例’不具有的特征称之为‘可疑假正例特征’;将‘真正例’所具有而假正例不具有的特征称之为‘可疑真正例特征’,如图1所示,我们的目标是找到可疑假正例特征,更新AI的内部知识,这样在下次分类中可以更好地识别出这些假正例,从而提高判断的准确率
如何找到可疑假正例特征
- 首先我们列举出所有的假正例的特征的交集,记为∩F,该集合中的每个特征对于任意一个假正例都是成立的
- 列举出所有真正例的特征,取并集,记为∪T
- 从∩F中减去∪T,得到的则是仅存在于假正例中的特征列表,即我们想要寻找的可疑假正例特征。
同样的,如果我们想要找到可疑真正例特征,只需要:
- 取所有真正例的特征的交集,记为∩T
- 取所有假正例的特征,取并集,记为∪F
- 从∩T中减去∪F,得到的则是仅存在于真正例中的特征列表。