首页 理论教育 优化约束问题的惩罚函数法详解

优化约束问题的惩罚函数法详解

时间:2023-06-24 理论教育 版权反馈
【摘要】:通常约束问题间接求优法有消元法、拉格朗日乘子法和惩罚函数法。其中以惩罚函数法最为常用,本节主要介绍此法。惩罚函数法是优化问题间接解法的代表方法,其基本思想是用某种方法将约束优化问题转为无约束优化问题,然后用无约束优化方法来求优。这就是所谓惩罚项对新目标函数的“惩罚作用”。惩罚函数G[gu]因具体方法不同而异。惩罚函数的具体方法有内点法、外点法和混合法。如此便可以保证惩罚函数收敛到原函数的同一最优解上去。

优化约束问题的惩罚函数法详解

通常约束问题间接求优法有消元法、拉格朗日乘子法和惩罚函数法。其中以惩罚函数法最为常用,本节主要介绍此法。

惩罚函数法是优化问题间接解法的代表方法,其基本思想是用某种方法将约束优化问题转为无约束优化问题,然后用无约束优化方法来求优。

约束问题间接求优有两个前提条件:

1)这种转化不能破坏原问题的约束条件。

2)必须是把求优归结到无约束问题的同一最优解上去。

惩罚可以用以下经济问题来进行通俗的解释:

原目标函数看成“价格”,而约束条件是一种“规定”,违反“规定”,即XD时要受罚款,不违反“规定”时,罚款为零。付出的总代价是价格与罚款的总和,于是“采买”时,要以总代价最小作为最终目标加以考虑。要想少罚款就不要违反规定。

根据这种解释,我们将这种优化问题的数学模型定义为如下形式:

原目标函数看成“价格”,而约束条件是一种“规定”,违反“规定”,即XD时要受罚款,不违反“规定”时,罚款为零。付出的总代价是价格与罚款的总和,于是“采买”时,要以总代价最小作为最终目标加以考虑。要想少罚款就不要违反规定。

根据这种解释,我们将这种优化问题的数学模型定义为如下形式:

其中ΦXγK)是一个人为构造的参数型目标函数,叫做惩罚函数。其一般形式为

其中ΦXγK)是一个人为构造的参数型目标函数,叫做惩罚函数。其一般形式为

式中,G[guX)]是针对原数学模型的一组约束条件,以某种方式构成的关于guX)的惩罚函数。G[guX)]在全域内定义为非负。

γK为第K个等式约束的待定乘子,是在优化过程中随K的增大不断进行调整的变值参数,根据不同情况,它可以为一个递降或递增的数列。(www.xing528.com)

式中,G[guX)]是针对原数学模型的一组约束条件,以某种方式构成的关于guX)的惩罚函数。G[guX)]在全域内定义为非负。

γK为第K个等式约束的待定乘子,是在优化过程中随K的增大不断进行调整的变值参数,根据不同情况,它可以为一个递降或递增的数列。

978-7-111-39133-3-Part02-242.jpg称为惩罚项,由上面定义可以判断,惩罚项的值恒为非负。由此可见,惩罚函数ΦXγK)的值在一般情况下总是大于原目标函数的值。这就是所谓惩罚项对新目标函数的“惩罚作用”。

但是,为了新目标函数最后总能收敛到原目标函数的同一最优解上去,惩罚项必须具有以下性质:

978-7-111-39133-3-Part02-242.jpg称为惩罚项,由上面定义可以判断,惩罚项的值恒为非负。由此可见,惩罚函数ΦXγK)的值在一般情况下总是大于原目标函数的值。这就是所谓惩罚项对新目标函数的“惩罚作用”。

但是,为了新目标函数最后总能收敛到原目标函数的同一最优解上去,惩罚项必须具有以下性质:

即选择了惩罚函数G[guX)]之后,随着惩罚因子数值的不断调整,惩罚项对整个惩罚函数ΦXγK)的惩罚作用将在取极限的过程中消失,即有下面的从属极限关系:

即选择了惩罚函数G[guX)]之后,随着惩罚因子数值的不断调整,惩罚项对整个惩罚函数ΦXγK)的惩罚作用将在取极限的过程中消失,即有下面的从属极限关系:

如此便可以保证惩罚函数收敛到原函数的同一最优解上去。惩罚函数G[guX)]因具体方法不同而异。

惩罚函数的具体方法有内点法、外点法和混合法(参数型惩罚函数法)。

如此便可以保证惩罚函数收敛到原函数的同一最优解上去。惩罚函数G[guX)]因具体方法不同而异。

惩罚函数的具体方法有内点法、外点法和混合法(参数型惩罚函数法)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈