问题起源
求解多元一次方程的解似乎看起来不是一件很难的事情,可以通过方程组的合并求解,从技术可行性上是完全没有问题的,但是能否有一个通用的模型帮助我们去求解多元一次方式呢?例如给定下列方程:
5x+ 2y = 10
x + 4y = 11
通过方程组的合并消元求解,则很容易得 x=1,y=0.25。如果写一个求解的该二元一次方程的求解函数,似乎也不是什么难事,但是如果变量不只是两个,对方程组合并消元的复杂度则会加大,甚至造成程序的可读性也变差。
机器学习的核心思想源自于数学,方程组合并消元的方法只是数学中人们总结的技巧,但并不是方程组求解的原始思路,此时此刻,我们需要借助最原始的数学思维帮助我们建立一个数学模型,辅助求解多元一次方程组。
问题抽象
我们将公式进一步抽象,变成程序可理解的数组,如下:
5x+ 2y = 10 转变为数组[5,2,10]
x + 4y = 11 转变为数组[1,4,11]
我们希望有一个数学模型的输入是两个数组:[5,2,10],[1,4,11],输出是方程求解的数组[1,0.25]。即希望有下所示的功能,将数学问题转变了计算机的工程问题。
// 定义线性方程组求解模型,2表示变量的个数
LinearEquation linearEquation = LinearEquation(2);
// 将第一个方程加入到模型中[5,2,10]
linearEquation.addEquation(new Double[]{5.0, 2.0}, 10.0);
// 将第二个方程加入到模型中[1,4,11]
linearEquation.addEquation(new Double[]{1.0, 4.0}, 11.0);
// 模型进行训练
linearEquation.practice();
// 输出训练后的x和y的值
System.out.println(Arrays.toString(linearEquation.getVariables()));
模型引入
对机器学习而言,永远逃不过两类计算,一个是距离计算,一个是概率计算。而方程式中的x和y我们可以理解为权重,即当x和y为某值时(5x+2y-10) 的距离尽可能短,使得几乎等于0,同理(x+4y-11)的距离也尽可能短,使得几乎也等于0,权重或为概率或为距离。类似这样的计算,很容易想到人工神经网络。
人工神经网络可以处理线性与非线性的问题,由于本问题是求解多元一次方程,因此是线性问题,可以采用人工神经网络中最基本的模型感知器进行求解,感知器是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。感知器使用特征向量来表示的前馈神经网络,把矩阵上的输入x(实数值向量)映射到输出值 f(x)上(一个二元的值)。感知器模型如下图所示:
通过上图可以看出,感知器模型由一下几个部分组成:
1. 输入。输入主要是包括n个输入项pi,以及每一个输入项下对应的权重wi
2. 激活函数。感知器可以灵活选择激活函数。激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。
3. 输出。感知器的输出则比较容易理解如下公式所示,其中b是偏执项:
一个较为实际的理解感知器即为:输入的x是对结果y的影响参数,但是每一个输入的x对y的影响都有相应的权重w,最终对y的影响结果则等于每一个输入与权重之和的累积。
模型应用与求解多元一次方程
感知器的训练过程是使得对应的wi处于某值的时候,输入的xi能够得到相应的y,实际也是在求wi的过程。而在对多元一次方程求解的时候,可以将未知数xi的系数视为wi,则多元一次方程是已知wi,y,求xi的过程。因此,我们可以将方程中的xi视为感知器中wi,方程中的wi视为xi,这样求方程的解,则完全转变为感知器的训练过程。而方程式的系数即可为感知器的训练集。如果方程式有三个未知数,则至少有三个方程(即三个训练集)才可能获得解,应用代码如下所示:
// 方程式一: 10.0*x1+2.0*x2 = 12.0
// 方程式二:1.0*x1+1.0*x2 = 2.0
// 根据上述方程可知: x1 = 1.0, x2 = 1.0
com.iveely.ml.application.LinearEquation linearEquation =
new com.iveely.ml.application.LinearEquation(2);
linearEquation.addEquation(new Double[]{10.0, 2.0}, 12.0);
linearEquation.addEquation(new Double[]{1.0, 1.0}, 2.0);
linearEquation.practice();
Double[] ret = linearEquation.getVariables();
// 计算结果误差需小于0.1,可以根据学习速率和迭代次数调整精确度
assertEquals(1.0, ret[0], 0.1);
assertEquals(1.0, ret[1], 0.1);
归纳总结
这是机器学习中神经网络最基本的实际应用,感知器能够解决多元一次方程问题的根本原因也是在于线性可分,理论上其它的机器学习模型也是可以做到。如果方程无解,则可以通过最小二乘法,找到一条最佳的直线,尽可能满足点的覆盖。
您的朋友:刘凡平(liufanping@iveely.com),LinearEquation源码请参见这里,iveely.ml源码参见这里。