写作动机
想写这篇文章的动机是源自于小凌4月初在前往北京看望MALAB同学们(我程师兄调侃凌指导去北京调研指导工作)的火车上,
偶然刷到了湖南大学(HNU)的博士研究生答辩公告,瞬间对HNU数院儿的博士研究生所做的工作来了兴趣。
论文背景
凸优化
凸(Convex)优化是一种强大的数学工具,它被广泛应用于各种领域,包括机器学习、统计、金融和工程。凸优化问题的关键在于它的目标函数和约束都是凸的(不是秃头的秃,虽然学数学确实让人头秃,笔者的头顶已经明显开始稀疏了),这意味着你可以想象成在一个碗形的表面上找最低点。这个特性使得凸优化问题有一个很好的特性,那就是如果你找到了一个局部最小值,那么你就可以确信这也是全局最小值。这使得凸优化问题相对于其他类型的优化问题来说更容易解决,因为你不需要担心陷入局部最小值。
锥约束
特征值互补问题又称为锥约束(锥约束问题是一类优化问题,这类问题的目标函数和约束条件都是锥的形式。锥约束优化问题在凸优化中是一个重要的研究领域,主要特点是有一个线性目标函数,约束条件则都被限制在一个特定的锥形区域内,这种问题的优化目标通常是在这个锥形区域内找到一个最优解)上的特征值问题。其实这部分内容,高中生来理解的话就是线性规划(见下图经典实例)。
特征值互补问题
特征值互补问题(Eigenvalue Complementarity Problem,EiCP)是一种特殊的数学优化问题,涉及到矩阵的特征值与互补条件的结合。在这类问题中,我们需要找到一个矩阵,使得其特征值满足某种特定的互补条件 [1]。这类问题在很多领域都有应用,如运筹学、控制理论和工程优化等。Seeger于1999年在研究平衡系统的非恒定轨迹的存在问题时,提出了特征值互补问题以来, 它就受到了众多学者的关注。
朱琳博士的工作主要研究对称的Pareto 特征值互补问题,利用对称Pareto 特征值互补问题等价于优化问题的性质, 提出了几种求解对称Pareto 特征值互补问题的算法。
序列二次规划
序列二次规划算法(Sequential Quadratic Programming,SQP)是一种用于求解非线性优化问题的迭代方法。该方法主要是通过在每一步中解决一个二次规划(QP)子问题,以逼近原非线性优化问题的解。SQP方法在处理约束优化问题时特别有效,包括线性约束和非线性约束。 而二次规划同样是一种优化问题,其中目标是最小化(或最大化)一个二次函数,同时满足一组线性约束。二次规划问题的关键在于它的目标函数是二次的,这意味着它包含了变量的平方项和交叉项,这使得问题比纯线性规划更复杂。
积极集方法
积极集方法(Active Set Method)是一种解决约束优化问题的算法,特别是用于解决二次规划问题。它的基本思想是在每一步迭代中,都维护一个所谓的"积极集",即在当前解下等式约束和处于边界上的不等式约束的集合。然后,在这个积极集的约束下,对目标函数进行无约束优化,得到一个新的解。如果这个新解满足所有约束,那么就接受这个解,并更新积极集;否则,就修改积极集,并重复这个过程。用大白话来说就是,经典的爬山案例,想象一下,作为读者的你正在爬山,但是又必须遵循一些规则,例如你不能超过某些边界或者你必须走在某些路径上。积极集方法就是在这样的情况下帮助你找到山顶的方法。它首先确定哪些规则是“积极的”,也就是说,哪些规则在你当前的位置是有效的。然后,它尝试找到在这些积极规则下可以使你爬得更高的方向。如果找到了这样的方向,那么你就按照这个方向前进。如果没有找到,那么它会重新考虑哪些规则应该是积极的,然后再尝试找到新的方向。这个过程会一直重复,直到找到山顶。
关键结果
1、利用对称Pareto 特征值互补问题等价于一个目标函数为二次函数的约束优化问题这一性质,朱博提出了一个求解对称Pareto 特征值互补问题的序列二次规划算法框架。值得注意的是,朱博所提出的序列二次规划算法在子问题的构造和步长的选取上都与经典的序列二次规划算法存在不同。算法在每次迭代时求解一个凸的二次规划子问题, 并利用这个二次规划子问题的解来确定下一步的搜索方向, 同时在保证惩罚函数的值减少的情况下给出精确的步长, 继而提高算法的效率。
2、在序列二次规划算法框架的求解过程中, 主要计算工作量花费于求解二次规划子问题。为此, 本文通过构造一个更为简单的二次规划子问题以提高算法的计算效率。 数值实验结果验证了这类简单的序列二次规划算法对求解规模较大的对称Pareto 特征值互补问题是有效的。另外, 通过设计一种特殊的积极集指标选取策略, 本文提出了一个有效求解二次规划子问题的积极集方法。这种积极集方法使得目标函数值具有非增特征, 而且可以保证算法的收敛性。
3、朱博构造的另一类约束优化问题的目标函数为DC 函数, 即其可以表述为两个凸函数的差。在此基础上, 朱博提出了求解对称Pareto 特征值互补问题的DC 算法, 该算法可以通过一系列含DC 函数的子问题来逼近原问题。另外, 朱博基于著名的下降定理提出了一个简单的下降算法, 并引入二分法快速有效地求解相应的子问题。 文章中证明了这两种算法的全局收敛性, 即由相应子问题产生的迭代序列收敛于对称Pareto 特征值互补问题的一个Pareto 特征向量。数值实验表明, 这两种基于DC 函数的算法相比于现有算法在计算效率方面存在一定优势。最后, 朱博简要讨论了矩阵对(A,B) 的最小对称Pareto 特征值的性质, 并估计出最小对称Pareto 特征值所在的区间,为计算最小对称Pareto 特征值提供一定的理论支撑。
其他
行文至此,虽然本人的主要研究兴趣在于概率论与数理统计,但是作为统计遗传学家的凌某,在此刻灵魂和朱博呼应上了,笔者能够真切的感受到朱琳博士在完成这一项博士论文的艰辛与不容易,虽然我和朱琳博士素未谋面,但是真切地祝贺朱博,这世上又多了一位伟大的女性数学家!!!!!
参考文献
- 雷渊,朱琳,李斌.求解实对称互补特征值问题的积极集方法[J].同济大学学报(自然科学版),2021,49(11):1526~1532
- 对称Pareto特征值互补问题的数值方法研究 [源自于答辩公告]