这是蔡老师发的论文。主要内容是讲述如何将药物和目标这两个不同领域的东西通过manifold learning来预测他们之间的关系。
他是通过核矩阵优化来作为解决方案的,通过训练集和测试集的点一起生成一个能表示互相距离的核矩阵。然后增加各种约束,包括在新空间中保持旧空间中的局部结构(manifold)
、进行mapping学习
,保持优化的均衡性
、限定核矩阵的能量
,和最终的优化目标
。通过优化后的核矩阵就可以预测出所有pair的关系了。
总结来说新的测试pair是通过manifold来预测的。mapping的学习只是在训练集已知是否关联的那些pair中学,而测试集中的pair是通过局部结构保持来进行预测的,所以优化的时候的核矩阵K就已经包含测试集的pair了。
有无核矩阵的规模,优化变得很耗资源。所以文中提出了两个方法。
第一个是spilt and merge,基本思想是得出原来的结点的子集,然后通过这些子集来算出一个子集的优化后的核矩阵,然后通过Von-Neumann Entropy来使得原数据集的K根据子集的K慢慢地优化,因此最后还是要求原数据集的K的。
第二种方法是Pairwise Querying,基本思想就是通过事先给出要预测的pair,然后根据这个pair生成出一个最短路径子图,然后求出这个子图的优化K,然后就可以预测这个pair的关系了,因此这种方法并不用求出原数据集的优化K,因此效率超高。