资源描述:
《多元凸函数的性质及其应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、多元凸函数的性质及其应用 收稿日期:2008-06-30第16卷 第4期2008年12月北京石油化工学院学报JournalofBeijingInstituteofPetro-chemicalTechnologyVol.16 No.4Dec.2008多元凸函数的性质及其应用游 煦(北京石油化工学院数理系,北京102617)摘要 从多元凸函数的定义及文献中已有的性质出发,利用方向导数和极限等数学工具,给出了一个判别多元函数凸性的充分必要条件,进一步利用函数f(x)的Hesse矩阵Hf(x)的半正定性来
2、判定函数的凸性。特别地,对于二次函数f(x)=12xTAx+bTx直接利用矩阵A的正定性可以判别它的凸性。这在实际应用中有一定的意义。关键词 多元凸函数;梯度向量;Hesse矩阵;半正定阵;二次函数中图法分类号 O174 凸分析是近几十年形成和发展起来的一个新数学分支。它在数学规划、控制论、多元统计等领域都有广泛的应用。文献[1-3]给出了一些判别多元函数凸性的充分必要条件,但是这些定理在实际使用过程中比较复杂。为了改进判别方法,笔者利用极限和方向导数等数学工具得到定理1[4],给出了利用多元函数的Hesse矩阵
3、来判别函数的凸性,改进了文献[1,3]中的判别方法,在实际计算中很方便。1 预备知识多元凸函数和严格凸函数的定义:定义1 设f(x),x∈DRn,其中D为非空凸集,若对于任意的x1,x2∈D及t∈(0,1)有ftx1+(1-t)x2≤tf(x1)+(1-t)f(x2),则称f(x)为D上的凸函数;若对于任意的x1,x2∈D且x1≠x2及t∈(0,1)有ftx1+(1-t)x24、x2为这两点连线上的一点,则f(x)在tx1+(1-t)x2处的函数值ftx1+(1-t)x2不超过f(x1)与f(x2)的加权平均值f(x1)+(1-t)f(x2)。例1 二元函数f(x,y)=x2-2xy+y2+x+y为R2上的凸函数。因为f(x,y)=12xy2-2-22xy+11xy,令f(x,y)=f(x)=12xTAx+bTx,其中x=xy,A=2-2-22,b=11。任意取x1=a1b1,x2=a2b2∈R2,t∈(0,1),则ftx1+(1-t)x2=fta1+(1-t)a2,tb1+(1-t)b2
5、=t(a1-b1)+(1-t)(a2-b2)2+t(a1+b1)+(1-t)(a2+b2),tf(x1)+(1-t)f(x2)=t(a1-b1)2+(1-t)(a2-b2)2+t(a1+b1)+(1-t)(a2+b2), 利用一元函数g(x)=x2为x∈R上的凸函数可知t(a1-b1)+(1-t)(a2-b2)2≤t(a1-b1)2+(1-t)(a2-b2)2,因此,f(x,y)=x2-2xy+y2+x+y是R2上的凸函数。利用凸函数的定义可以得到如下的性质[1]:设f(x)是定义在Rn上的凸函数,则对于任意的x
6、1,x2…xk∈Rn和t1,t2…tk≥0且t1+t2+…+tk=1,有ft1x1+t2x2+…+tkxk≤t1f(x1)+t2f(x2)+…+tkf(xk);(1) 如果f(x)是定义在Rn上的严格凸函数,当x1,x2…xk不全相等时,有ft1x1+t2x2+…+tkxk7、λ2f(x2)+…+λkf(xk)λ1+λ2+…+λk;(3)这里f(x)是定义在Rn上的凸函数;如果f(x)是定义在Rn上的严格凸函数,有fλ1x1+λ2x2+…+λkxkλ1+λ2+…+λk<λ1f(x1)+λ2f(x2)+…+λkf(xk)λ1+λ2+…+λk。(4) 式(3)、式(4)则是推广的多元函数Jensen不等式。2 主要结论及其证明利用凸函数的定义及其性质可以判别函数的凸性,但是从例1中可以看到在实际应用的过程中计算比较复杂,很不实用。下面进一步研究凸函数的判别方法。定理1 设f(x)是定义在非
8、空开凸集DRn上的可微函数,则f(x)是凸函数的充分必要条件是对于任意两点x1,x2∈D,都有f(x2)≥f(x1)+gradf(x1)·x2-x1x2-x1; f(x)是严格凸函数的充分必要条件是对于任意两点x1,x2∈D且x1≠x2,都有f(x2)>f(x1)+gradf(x1)·x2-x1x2-x1,其中gradf(x1)表示f(x)在点x1处的梯度