本文主要參考了高木貞治的《高等微積分》.為了内容的連續性,我們把第四篇小結裡推廣的隐函數存在定理重叙如下:
<b>Theorem1(隐函數存在定理的推廣)</b>設$f:\mathbf{R}^{n+m}\rightarrow\mathbf{R}^m$為連續可微函數,$\mathbf{R}^{n+m}$中的元素寫成$(x_1,\cdots,x_{n+m})$的形式.當$f(a_1,\cdots,a_{n+m})=\mathbf{0}$時,我們把$f$在點$(a_1,\cdots,a_{n+m})$處的雅可比矩陣的第$i_1,\cdots,i_m$列挑選出來$(i_1<i_2<\cdots<i_m)$,按原來的順序重新排成一個矩陣,這樣就形成了$f$在點$(a_1,\cdots,a_{n+m})$處的雅可比矩陣的一個$m\times m$的子方陣,如果該子方陣可逆,那麼我們可以在點$(a_1,\cdots,a_{n+m})$附近定義一個$(x_{i_1},x_{i_2},\cdots,x_{i_m})$關于點$(x_{j_1},x_{j_2}\cdots,x_{j_n})$的函數$g$,其中$j_1<j_2<\cdots<j_n$,且$\{j_1,\cdots,j_n\}\bigcup\{i_1,\cdots,i_m\}=\{1,\cdots,m+n\}$,使得隻要$f(x_1,\cdots,x_{m+n})=0$,我們就有$g(x_{j_1},\cdots,x_{j_n})=(x_{i_1},\cdots,x_{i_m})$.嚴格地說,就是存在$(a_{j_1},\cdots,a_{j_n})$和$(a_{i_1},\cdots,a_{i_m})$的鄰域$U$和$V$,使得$g$是從$U$到$V$的函數,并且$g$的函數圖像滿足\begin{align*}&\{((x_{j_1},\cdots,x_{j_n}),g(x_{j_1},\cdots,x_{j_n}))\}=\{((x_{j_1},\cdots,x_{j_n}),(x_{i_1},\cdots,x_{j_m}))|f(x_1,\cdots,x_{n+m})=0\}\cap(U\times V).\end{align*}
<b>Remark1</b>注意,當我們建立$(x_{i_1},x_{i_2},\cdots,x_{i_m})$關于$(x_{j_1},x_{j_{2}}\cdots,x_{j_n})$的函數$g$時,變量$x_{j_1},x_{j_2},\cdots,x_{j_n}$已經處于函數無關的狀态.
設$D$是$\mathbf{R}^n$的開子集,$f:D\rightarrow\mathbf{R}$和$g:D\rightarrow\mathbf{R}^m$都是連續可微函數.且對于$D$中的每一點$\mathbf{x}$,都存在相應的$1\leq i_1<\cdots<i_m\leq m$,使得當我們把$g$在$\mathbf{x}$處的雅可比矩陣中的第$i_1,\cdots,i_m$列挑選出來,按原來的順序重新排成一個矩陣的時候,可以形成$g$在點$\mathbf{x}$處的雅可比矩陣的一個$m\times m$的可逆子方陣.
我們有限制條件$g(\mathbf{x})=\mathbf{0}$,其中$x\in\mathbf{R}^n$,這樣的限制條件确定了一個區域$D'$.在$D'$内的所有點都滿足該限制條件,而在$D\backslash D'$中的所有點都不滿足該限制條件.我們試圖找出 $f|D'$ 在區域$D'$上的極值,其中$f|D'$表示函數$f$在區域$D'$上的限制.設$\mathbf{x}=(p_1,\cdots,p_n)$.且設$\mathbf{x_0}$是$f|D'$在$D'$上的極值點.由于$g$在$\mathbf{x_0}$處滿足定理1的條件,是以我們可以在點$\mathbf{x_{0}}$附近定義一個$(p_{i_1},p_{i_2},\cdots,p_{i_m})$關于點$(p_{j_1},p_{j_2},\cdots,p_{j_{n-m}})$的函數$h$,其中$j_1<j_2<\cdots<j_{n-m}$,且
${\displaystyle \{j_1,\cdots,j_{n-m}\}\bigcup\{i_1,\cdots,i_m\}=\{1,\cdots,n\},}$
使得隻要$g(\mathbf{x_{0}})=0$,我們就有$h(p_{j_1},\cdots,p_{j_{n-m}})=(p_{i_1},\cdots,p_{i_m})$.為了簡化論述,不失一般性地,我們不妨設$j_1<\cdots<j_{n-m}<i_1<\cdots<i_m$.于是我們就可以把上述的在限制條件$g(\mathbf{x})=\mathbf{0}$下求$f$的極值問題轉化為求
${\displaystyle z=f(p_{j_1},\cdots,p_{j_{n-m}},h(p_{j_1},\cdots,p_{j_{n-m}}))\\\\\ (1)}$
的極值問題,根據注1,我們知道$p_{j_1},\cdots,p_{j_{n-m}}$函數無關.為了求1的極值,我們有兩種其實是完全一樣的方案.但是,我願意不勞辛辭地把它們通通寫出來.我們先來介紹第一種.為了求1的極值,隻需要令
${\displaystyle \frac{\partial z}{\partial p_{j_1}}=0,\cdots,\frac{\partial z}{\partial p_{j_{n-m}}}=0.\\\\\ (2)}$
根據複合函數的求導法則,可得$\forall r\in\{1,\cdots,n-m\}$,我們有\begin{align*}\frac{\partial z}{\partial p_{j_r}}&=\begin{pmatrix}\frac{\partial f}{\partial p_{j_1}}&\cdots&\frac{\partial f}{\partial p_{j_{n-m}}}&\frac{\partial f}{\partial p_{i_1}}&\cdots&\frac{\partial f}{\partial p_{i_{m}}}\end{pmatrix}\begin{pmatrix}
0\\
\vdots\\
1\\
\frac{\partial p_{i_1}}{\partial p_{j_1}}\\
\frac{\partial p_{i_m}}{\partial p_{j_1}}\\
\end{pmatrix}(n-m-1\mbox{個}0,1\mbox{位于第}r\mbox{行.})\\&=\frac{\partial f}{\partial p_{j_{r}}}+\sum_{k=1}^{m}\frac{\partial f}{\partial p_{i_k}}\frac{\partial p_{i_k}}{\partial p_{j_{r}}}.
\end{align*}
于是條件2化為如下:$\forall r\in\{1,\cdots,n-m\}$,
${\displaystyle \frac{\partial f}{\partial p_{j_r}}+\sum_{k=1}^{m}\frac{\partial f}{\partial p_{i_k}}\frac{\partial p_{i_k}}{\partial p_{j_{r}}}=0.\\\\\ (3)}$
第二種方案隻不過是對第一種方案的符号簡化:為了求1的極值,我們先令$\mathbf{t}=(p_{j_1},\cdots,p_{j_{n-m}})$.則式1化為
${\displaystyle z=f(\mathbf{t},h(\mathbf{t})).\\\\\ (4)}$
為了求式1的極值,隻用讓
${\displaystyle \frac{\partial z}{\partial \mathbf{t}}=0.\\\\\ (5)}$
根據複合函數的求導法則,式5即
${\displaystyle \frac{\partial f}{\partial \mathbf{t}}+\frac{\partial f}{\partial h(\mathbf{t})}\frac{\partial h(\mathbf{t})}{\partial \mathbf{t}}=0.\\\\\ (6)}$
式6和方程組3是一樣的.于是與其看繁瑣的方程組3,我們不如來看式5.事情做到這一步,其實還沒完,因為$\frac{\partial h(\mathbf{t})}{\partial \mathbf{t}}$是很難知道的,因為我們很難确定$h$.幸運的是,根據隐函數定理,我們能繼續求出$\frac{\partial h(\mathbf{t})}{\partial \mathbf{t}}$.下面具體地來做.我們知道,
${\displaystyle g(\mathbf{x})=\mathbf{0},}$
即
${\displaystyle g(\mathbf{t},h(\mathbf{t}))=\mathbf{0},}$
是以對兩邊對$\mathbf{t}$求導,我們有
${\displaystyle \frac{\partial g}{\partial \mathbf{t}}+\frac{\partial g}{\partial h(\mathbf{t})}\frac{\partial h(\mathbf{t})}{\partial \mathbf{t}}=0.\\\\\ (7)}$
把式7代入式6,我們得到
${\displaystyle \frac{\partial f}{\partial \mathbf{t}}=\frac{\partial f}{\partial h(\mathbf{t})}(\frac{\partial g}{\partial h(\mathbf{t})})^{-1}\frac{\partial g}{\partial \mathbf{t}}.\\\\\ (8)}$