非线性最小二乘法

非线性最小二乘法非线性形式的最小二乘法,用包含n个未知参数的非线性模型拟合m个观测值(),可用于某些形式的非线性回归。该方法的基础是使用线性模型近似并通过连续迭代来优化参数。它与线性最小二乘法既有相同之处、也有一些显著差异。

理论 编辑

考虑一组  个数据点以及曲线(模型函数) 。该曲线同时取决于x n个参数(满足 )。目标是找到在最小二乘意义上与数据点拟合最好的曲线所对应的参数 ,即最小化平方和

 

其中残差ri的定义为

 

S最小值时的梯度为零。由于模型包含n个参数,因此可得到n个梯度方程:

 

在非线性系统中,偏导数 同时是自变量x和参数 的函数,因此这些梯度方程通常没有封闭解。因而必须为参数选择初始值用以迭代求解。迭代表达式为

 

其中,k是迭代次数, 则是偏移向量。每次迭代时,使用关于 的一阶泰勒级数展开以线性化模型:

 

雅可比矩阵J是常数、自变量与参数的函数,因此每次迭代时的J并不固定。对线性化模型而言,

 

残差的表达式则为

 
 

将上述表达式代入梯度方程,可以得到

 

以上方程可化简为n个联立的线性方程,称为正规方程(normal equations):

 

正规方程可用矩阵表示法写成

 

上述方程是使用高斯-牛顿算法英语Gauss–Newton algorithm求解非线性最小二乘问题的的基础。

需要注意的是雅可比矩阵定义中导数的符号约定。某些文献中的J可能与此处的定义相差一个负号。

权重扩展 编辑

不同数据点(观测结果)的可靠性并不一定相同,此时可使用加权平方和

 

权重矩阵W是一个对角矩阵,理想情况下每个权重系数应等于观测误差方差的倒数。[1]此时,正规方程可扩展为

 

参见 编辑

注释 编辑

  1. ^ 此处假定所有观测点是相互独立的。如果观测点之间相关时,加权平方和可表示为
     
    此时权重矩阵的理想值应为观测误差协方差矩阵的逆。

参考文献 编辑