\documentclass[8pt,a4paper]{scrartcl} \input{definitions} \input{packages} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \geometry{left=8mm,right=8mm, top=10mm, bottom=10mm, paperwidth=210mm, paperheight=297mm} \fancyhf{} %Kopf-/Fu?zeilenfelder leeren \pagestyle{fancy} %Seitenstil auf fancy setzen \fancyhead[L]{SR} %im Kopf links den Titel schreiben \fancyhead[R]{\copyright \hspace{1mm}Lst ?konometrie, Uni Regensburg, Nov 2012} \renewcommand{\headrulewidth}{0pt} %Im Kopf rechts die Seitenzahl setzen \fancypagestyle{plain}{} % damit auch "plain" Seiten fancy werden \setlength{\headheight}{14.5pt} \renewcommand{\baselinestretch}{1.25} \begin{document} \section*{Ableitungen von vektorwertigen Funktionen bzw. Matrizen} Im Folgenden sei $\vf:\R^n \to \R^m$ mit $\vx \mapsto \bmat f_1(\vx) & \cdots & f_m(\vx) \emat^T$ eine vektorwertige Abbildung (Vektorfeld), definiere die Ableitung $D$ von $\vf$ (in beliebigem Punkt $\vx$) als die Jacobimatrix: \beqs \left(D\vf(\vx)\right):=\left(\frac{\partial f_i(\vx)}{\partial x_j}\right)_{i=1,..., m; j=1,...,n} \in \R^{m \times n} \eeqs \textbf{?bliche Ableitungsregeln sollen erhalten bleiben:}\\ Der ?bersicht halber schreiben wir jetzt $f:=\vf, g:=\vg$ und $x:=\vx$. Sei $f:\R^n \to \R^m$ und $\alpha, \beta \in \R$, betrachte folgende Anforderungen an die Ableitung: \bit \item[1.] \textbf{Linearit?t:} \beqs D\left[\alpha \vf(\vx) + \beta \vg(\vx)\right] = \alpha D\vf(\vx) + \beta D\vg(\vx) \eeqs (nur falls $\vf, \vg: \R^{n}\to \R^m$, da man dann zwei $m\times n$-Matrizen addiert). \item[2.] \textbf{Kettenregel:} \beqs D\left[\vf(\vg(\vx))\right] = D\vf(\vg(\vx)) \cdot D\vg(\vx)\eeqs(nur falls $\vf: \R^{n}\to \R^m$ und $\vg:\R^{k}\to \R^n$, da man dann $D\vf(\vg(\vx)) \in \R^{m\times n}$ mit $D\vg(\vx) \in \R^{n\times p}$ multipliziert; man kann beide Faktoren nicht vertauschen!). \item[3.] \textbf{Produktregel:} (im Vektorfall) \beqs D\left[\vf(\vx)^T \vg(\vx)\right] = \vf(\vx)^T D\vg(\vx) + \vg(\vx)^T D\vf(\vx) \eeqs (nur falls $\vg:\R^n\to \R^m$, da damit $\vf(\vx)^T \vg(\vx) \in \R$ und $D(\vf(\vx)^T \vg(\vx)) \in \R^{1\times n}$ und $\vf(\vx)^T D\vg(\vx) \in \R^{1\times n}$) \item[4.] \textbf{Produktregel:} (im Matrixfall)\\ W?hrend die Ableitung von vektorwertigen Funktion nach einem Vektor intuitiv war, ist die Ableitung einer Matrixfunktion $\mA(\mX)$ nach einer Matrix $\mX$ etwas abstrakter. Um die Konsistenz zu wahren, liegt es nun nahe, dass man die Matrix $\mA(\mX)$ mittels $\vec$ vektorisiert und dann nach $\vec(\mX)$ ableitet: \beqs D\left[\mA(\mX)\right]:=D\left[\vec(\mA(\mX)\right]:=\frac{d\vec(\mA(\mX))}{d\vec(\mX)} \eeqs Seien also $\mA(\mX) \in \R^{m\times p}, \mB(\mX) \in \R^{p\times q}$ Matrizen abh?ngig von der Matrix $\mX$, dann gilt: $\mA(\mX) \cdot \mB(\mX) \in \R^{m\times q}$. Seit weiter $I_n \in \R^{n\times n}$ die Einheitsmatrix dann gilt mit den Rechenregeln von $\vec$ und $\otimes$: \beqs \vec(\mI_m \cdot \mA(\mX) \cdot \mB(\mX) \cdot \mI_q) = (\mB(\mX)^T \otimes \mI_m) \cdot \vec(\mA(\mX)) =( \mI_q \otimes \mA(\mX)) \cdot \vec(\mB(\mX)) \eeqs Und somit w?re eine nat?rliche Produktregel: \beqs D\left[\mA(\mX)\cdot \mB(\mX)\right] =(\mB(\mX)^T \otimes \mI_m) \cdot D\mA(\mX)+( \mI_q \otimes \mA(\mX)) \cdot D\mB(\mX) \eeqs \eit \textbf{Anwendungen der Matrixableitungen:}\\ Sei wie oben wieder $\mA\in \R^{m\times n}, \mB\in \R^{p\times q}, \vx\in \R^n$ und $\mX$ variabel, aber passend, dann gilt: \bit \item $\frac{d\mA\vx}{d\vx}=\mA$ \item $\frac{d\vx^T \mA\vx}{d\vx}=\vx^T(\mA+\mA^T)$ \item $\frac{d\vec(\vx^T \mA \vx)}{d\vec(\mA)}=\vx^T\otimes \vx^T$ \item $\frac{d\mA^T \mA}{d\mA}=(\mI_{n^2}+\mT_{n,n})(\mI_n \otimes \mA^T)$ \item $\frac{d\mA \mA^T}{d\mA}=(\mI_{m^2}+\mT_{m,m})(\mA \otimes \mI_m)$ \item $\frac{d\vx^T\mA^T \mA \vx}{d\mA}=2\vx^T \otimes \vx^T \mA^T$ \item $\frac{d\vx^T \mA \mA^T \vx}{d\mA}=2\vx^T \mA \otimes \vx^T$ \item $\frac{d\mA\mX\mB}{d\mX}=\mB^T \otimes \mA$ \item $\frac{d\mA^{-1}}{d\mA}=-((\mA^{-1})^T \otimes \mA^{-1})$ \item $\frac{d \log(\det(\mA)}{d\mA}=\vec((\mA^{-1})^T)^T$ \item $\frac{d \tr(\mA\mX)}{d\mX}=\vec(\mA^T)^T$ \eit \end{document}