图神经网络自监督学习工具箱 - JOAO

文章名称

【ICML-2021】【Texas A&M University/The University of Texas at Austin】Graph Contrastive Learning Automated

核心要点

文章旨在解决现有GraphCL方法需要依赖领域知识和大量的试验来挑选图增广方法，才能从无标签的图数据上学习可迁移的，鲁棒知识的问题，提出了JOAO学习框架，把图自监督学习形式化为bi-level min-max优化问题，同时学习自动选取图增广任务与图表示模型，不同于已有的自动图增广搜索方法，JOAO可以更充分的探索各种任务的组合，提升模型性能。

研究背景

图自监督学习可以从无标签的数据中学习图数据中固有的，可迁移的，鲁棒的知识（是指不会因为数据分布偏差被干扰的），但是不同于图像数据，图数据是对不同关系的抽象，例如，医疗保健系统网络，引文网络、社交网络和生物医学网络等等。通常需要针对特定的图数据，利用领域知识，并进行大量的尝试来选取和是的图数据增广方法。并且，自监督学习期望利用无标签数据进行有效的表示学习，这进一步增大了挑战。因此，作者期望在现有GraphCL方法的基础上，自动的选取合适的图增广方法。

方法细节

Graph contrastive learning

首先简单形式化一下GraphCL，其整体框架如下图所示。给定从特定分布（某一个数据集）中得到的图数据 ${G}^{}_{} \sim \mathbb{P}_{G\prime}$ （这里作者针对的是多图场景），随机从数据增广方法池 $\mathcal{A} = \{ NodeDrop, Subgraph,EdgePert, AttrMask,Identical \}$ 中[You et al., 2020a]选取两种增广方法 ${A}^{}_{1}, {A}^{}_{2}$ 。

graph contrastive learning framework

GaphCL objective

JOAO

如前所述，原有的GraphCL方法只能利用预先针对下游任务准备好的graph augmentation组合，相当于只探索了联合分布 ${\mathbb{P}}^{}_{({A}^{}_{1}, {A}^{}_{2})}$ 的某几个点（作者称之为 Dirac distribution），而没有探索所有分布点。

因此作者采用，如下图所示的bi-level（双层优化目标）目标进行对比学习。其中，

外层目标 $\mathcal{ L }$ 是GraphCL或其他图对比学习的目标。

内层目标 $\mathcal{ D }$ ，也就是约束中的最优化任务，是寻找最优的自监督任务组合。

JOAO objective

值得注意的是，这里没有利用下游任务的标签，而是利用对抗训练的方法[Wang et al., 2019; Xie et al., 2020]，无监督的方式进行min-max optimization。其中max的部分是寻找当前最具挑战性的数据增广组合。

具体的min-max game目标函数如下图所示，其中，

$\gamma$ 是非负实数，调节增广组合被选择的概率与任务难度之间的平衡。

$dist = \sum_{i=1}^{|\mathcal{ A }|}{\sum_{j=1}^{|\mathcal{ A }|}{}{}}{{}({p}^{}_{ij} - \frac{1}{|\mathcal{ A }|^2})^2}$ 表示度量分布的距离函数，作者采用的是这种squared Euclidean distance。 $p_ij$ 表示采用 $i, j$ 这两种增广方法组合的概率。

$\mathbb{ P }_{prior}$ 是某种给定的增广组合先验分布（比如，要求变删除和节点mask组合被选择的概率更大，方便控制）作者依据提升多样性的目标和最大熵原理，采用均匀分布。

min-max objective function

这个max可以被理解为，尽可能的要求增广策略组合与给定的先验分布接近，又能够使 $\mathcal{ L }$ 的损失最大（任务更具有挑战）。

作者采用AGD(Wang et al., 2019)的方式优化上述，算法伪代码参见代码实现部分。

代码实现

作者采用AGD优化方法学习模型参数的伪代码。在一次优化的过程中交替的对内外层优化进行求解，是等步长的优化。

pseudo code

心得体会

假设独立

作者假设属性的生成是按顺序独立的，也就是说确定了某种生成顺序之后，在步骤 $i$ 之后生成的节点的属性行与步骤 $i$ 的节点无关。这种假设建立在顺序无关的基础是，并且需要通过对各种顺序的覆盖来保证，因为实际上上述假设不一定成立。

另外，作者假设边生成式互相独立的，也就是说的边 ${j}^{+}_{1}$ 和 ${j}^{+}_{2}$ 的生成是独立的。个人感觉，这个也假设不一定，不过联系可能相对较少，并且通过不同顺序的覆盖，保证没有特别大的影响，却得到很好地并行性能。

文章引用

[1] Joan Bruna, Wojciech Zaremba, Arthur Szlam, and Yann LeCun. 2013. Spectral networks and locally connected networks on graphs. arXiv:1312.6203 (2013).

[45] Difan Zou, Ziniu Hu, Yewen Wang, Song Jiang, Yizhou Sun, and Quanquan Gu. 2019. Layer-Dependent Importance Sampling for Training Deep and Large Graph Convolutional Networks. In NeurIPS 2019.

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,732评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,496评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,264评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,807评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,806评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,675评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,029评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,683评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,704评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,666评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,773评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,413评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,016评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,204评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,083评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,503评论 2赞 343