×

On the solution of linear equations with infinitely many variables. (Über die Auflösung linearer Gleichungen mit unendlich vielen Unbekannten.) (German) JFM 39.0401.01

Die vorliegende Arbeit geht in der Allgemeinheit der Problemstellung bei der Auflösung unendlich vieler Gleichungen \[ (1)\qquad \sum_{m=1}^\infty a_{nm} z_m = c_n\quad (n = 1, 2, \dots) \] mit unendlich vielen Unbekannten \(z_1, z_2, \dots\) um einen wesentlichen Schritt über die frühere Literatur hinaus. Während die älteren, besonders durch H. v. Koch geförderten Untersuchungen von der Existenz einer Determinante des unendlichen Systems der Koeffizienten \(a_{nm}\) ausgehen, lassen die neuen, in Hilberts vierter Mitteilung (JFM 37.0351.04 und JFM 37.0351.05) in Angriff genommenen Problemstellungen zwar diese Forderung und die durch sie bedingten Einschränkungen fallen, behalten aber – gemäßihrer Beziehung zu einer Theorie gewisser Klassen quadratischer und bilinearer Formen unendlich vieler Veränderlicher (“beschränkter” F) – umfassendere Konvergenzbedingungen bei, die die sämtlichen Koeffizienten \(a_{nm}\) gleichzeitig verknüpfen. Dementgegen stellt Schmidt nur noch je eine Konvergenzanforderung für die Koeffizienten jeder einzelnen der Gleichungen (1), und zwar die, die erst zusammen mit der für die Unbekannten von ihm beibehaltenen Hilbertschen Bedingung – daß nur Lösungen von konvergenter Quadratsumme \(\sum_{m=1}^\infty |z_m|^2\) in Betracht gezogen werden – die Konvergenz der linken Seiten von (1) garantiert: die Quadratsumme der Koeffizientenbeträge \(\sum_{m=1}^\infty |a_{nm}|^2\) soll für jedes \(n\) konvergieren. Weiterhin und im Zusammenhange damit sieht Verf. auch von jeder die rechten Seiten \(c_n\) der Gleichungen (1) verknüpfenden Konvergenzbedingung ab, und wendet die Frage vielmehr so: Welches sind die Bedingungen (Konvergenzbedingungen und Gleichungen), denen die \(c_n\) genügen müssen, damit die Gleichungen (1) Lösungen von konvergenter Quadratsumme haben? Die Methoden, mit denen Schmidt dieses Problem bis zur expliziten Angabe sämtlicher Lösungen durchführt, sind im wesentlichen die, die er in seiner Dissertation (JFM 36.0461.03) auf den Bereich stetiger Funktionen statt abzählbar unendlicher Zahlenreihen von konvergenter Quadratsumme angewandt hat; sie bestehen in der Übertragung eines an durchaus anschaulichen geometrischen Betrachtungen orientierten, determinantenfreien Verfahrens zur Auflösung von \(m\) linearen Gleichungen mit \(n\) Unbekannten auf das unendliche System (1), wobei es seinen elementaren Charakter vollkommen beibehält und nur ein einziges äußerst einfaches Konvergenztheorem nötig ist.
Im ersten Kapitel wird demgemäßdie Geometrie im Raume der Funktionen \(A(z) = A_x\) einer ganzzahligen Variable \(x\) behandelt, für die die Quadratsumme \(\sum_{x=1}^\infty A_x^2 = \| A\|^2\) konvergiert (vgl. die analogen Begriffsbildungen für den Raum der stetigen Funktionen bei E. Fischer, JFM 38.0422.02); am bequemsten wird die Deutung, wenn man die Zahlen \(A_x\) als Komponenten eines im unendlich vieldimensionalen Raume vom Anfangspunkt aus abgetragenen Vektors deutet. Bezeichnet man \(\| A \|\) als Länge des Vektors und nennt zwei Vektoren \(A(x), B(x)\) orthogonal, wenn \((A; B)= \sum_{x=1}^\infty A_x B_x= 0,\) so lassen sich die Analoga der elementaren geometrischen Sätze sofort aufstellen.
Der Häufungsstellenbegriff wird wie bei Hilbert übertragen: eine Folge unendlichvieler Vektoren \(D_n(x) = D_{nx}\) \((n = 1, 2, \dots)\) “konvergiert stark” gegen \(D(x),\) wenn \(\lim_{n=\infty} \| D - D_n\|^2 = \lim_{n=\infty} \sum_{x=1}\infty (D_x - D_{nx})^2 = 0,\) d. h. wenn die Entfernung der Endpunkte von \(D(x)\) und \(D_n(x)\) im Limes verschwindet. Die notwendige und hinreichende Bedingung für die Existenz einer starken Grenzfunktion in diesem Sinne ist nun – das ist das erwähnte grundlegende Konvergenztheorem – daß für hinreichend große \(m, n \| D_n - D_m\|\) beliebig klein wird.
Des weiteren wird eine “Theorie der linearen Funktionengebilde” (lineare Teilräume) entwickelt, d. i. in der vorliegenden Abhandlung die Menge der Funktionen, die aus einer endlichen Teilanzahl der gegebenen Funktionen \(A_\nu (x)(\nu = 1, 2, \dots) \) – der “Basis” des Gebildes – linear-homogen mit konstanten Koeffizienten komponiert werden können, zuzüglich ihrer Häufungsfunktionen (im Sinne starker Konvergenz). In jedem solchen Gebilde \(\mathfrak U\) kann man als Basis ein System zueinander orthogonaler Funktionen einführen, geometrisch gesprochen: ein rechtwinkliges Koordinatensystem; den Übergang von den \(A_\nu(x)\) zu dieser Basis liefert das bekannte sukzessive Orthogonalisierungsverfahren; das schon in Schmidts Dissertation eine so große Rolle spielt. Jede Funktion \(D(x)\) kann man nun auf eine und nur eine Weise in die Summe einer \(\mathfrak U\) angehörenden Funktion (Projektion des Vektors \(D\) in den Raum \(\mathfrak U)\) und einer zu \(\mathfrak U,\) d. h. zu allen Funktionen von \(\mathfrak U\) orthogonalen Funktion (“Perpendikelfunktion”) zerlegen; diese Perpendikelfunktion \(P(x)\) wird entweder durch den Rest einer nach Funktionen der Orthogonalbasis fortschreitenden, der Fourierschen Reihe analogen Reihe, oder bei Zugrundelegung einer beliebigen Basis als – stets stark konvergenter – Limes des Quotienten zweier Determinanten dargestellt, in die außer den Funktionen \(A_\nu(x)\) und \(D(x)\) nur die Werte \((A_\nu; A_\mu)\) und \((A_\nu; D)\) eingehen; einen ähnlich gebauten Ausdruck erhält man jeweils auch für den Betrag \(\| P\|^2\) der Perpendikelfunktion.
Mit diesen Hülfsmitteln wird nun im zweiten Kapitel zunächst das Problem der Auflösung der homogenen Gleichungen: \[ (2)\quad (A_n; Z) = \sum_{x=1}^\infty A_{nx} Z_x = 0\quad (n = 1, 2, \dots ) \] behandelt, d. h. die Bestimmung sämtlicher auf dem Gebilde \(\mathfrak U\) mit der Basis \(A_1(x), A_2(x), \dots \) orthogonalen Funktionen. Solche Funktionen erhält man z. B. als Perpendikelfunktionen \(\varPi_\nu(x)\) von den in der Richtung der Koordinatenachsen gelegenen Einheitsvektoren \(E_\nu(x)\) (wo \(E_\nu(x) = 1\) für \(x = \nu, E\nu (x) = 0\) für \(x \neq \nu)\) auf das Gebilde \(\mathfrak A,\) und man zeigt leicht, daß das zur Basis \(\varPi_\nu(x) \) gehörige lineare Gebilde \(\mathfrak R\) die Gesamtheit der Lösungen von (2) umfaßt; die früheren Formeln für die Perpendikelfunktionen liefern zugleich explizite Formeln für die Lösungen, bzw. in dem identischen Verschwinden sämtlicher \(\varPi_\nu(x)\) d. h. in dem Verschwinden der Beträge \(\|\varPi_\nu\|\) das Kriterium dafür, (2) keine nicht triviale Lösung von konvergenter Quadratsumme besitzt.
Danach genügt es nun, für die inhomogenen Gleichungen (1) eine einzige Lösung zu bestimmen; und zwar geht Schmidt auf die Bestimmung der – eindeutig bestimmten – Lösung von kleinster Quadratsumme \(\| Z\|^2\) aus. Eine erste Methode geht von der Bemerkung aus, daß man (1) auf (2) zurückführen kann, indem die durch \(G_n (1) = - c_n,\;Z (1) = 1, \;G_n(x) = a,_{n,x-1},\;Z(x) = z_{x-1}\) definierten Vektoren den homogenen Gleichungen \((G_n; Z)=0\) genügen; liegt nun \(E_1(x) (E_{11} = 1,\;E_{1x} = 0\) für \(x\geqq 2)\) in dem Gebilde der \(G_n(x)\), so gibt es keine \((E_1; Z) = Z(1)= 1\) genügende Lösung dieser homogenen Gleichungen und daher auch keine Lösung von (1) – andernfalls ist das durch seinen Betrag \(\| H\|^2\) dividierte Perpendikel \(H(x)\) von \(E_1(x)\) auf dieses Gebilde die gesuchte Lösung. Die früheren Formeln liefern sofort wieder explizite Darstellungen der Lösung und des Kriteriums für die Unlösbarkeit von (1), des Verschwindens von \(\| H\|\). – Eine andere (die dritte) Methode zur Lösung von (1) wird erhalten, indem man von der Bestimmung einer (normierten) Orthogonalbasis \(B_n(x) = \sum_{\nu=1}^n \gamma_{n\nu} A_\nu(x) \) des linearen Gebildes der \(A_\nu(x)\) ausgeht; die transformierten Gleichungen, deren Koeffizienten dem Orthogonalsystem \(B_n(x)\) angehören, lassen sich bekanntlich leicht behandeln, und man erhält, wenn man von linearen Dependenzen der \(A_n(x)\) absieht, in der Konvergenz von \(\sum_{n=1}^\infty (\sum_{\nu=1}^n \gamma_{n\nu} c_\nu)^2\) die notwendige und hinreichende Bedingung für die Lösbarkeit von (1), während dann \(Z(x) = \sum_{\nu=1}^\infty B_\nu (x) (\sum_{\nu=1}^n \gamma_{n\nu} c_\nu)\) wird.
Keine dieser beiden Methoden läßt jedoch unmittelbar auf eine innerhalb in eines gewissen Bereiches der \(c_n\) konvergente Darstellung \(z_m = \sum_{n=1}^\infty b_{mn} c_n\) der Lösung von (1) schließen, wie man sie nach der Analogie endlicher Gleichungssysteme sowie der Hilbertschen Resultate auch hier wird wünschen mögen. In dieser Richtung ergänzt eine letzte (die zweite) Methode die vorigen: Man konstruiere für jede der Funktionen \(A_n(x)\) das Perpendikel \(P_n(x)\) auf das von den übrigen \(A_1(x), A_2(x), \dots\) gebildete lineare Gebilde; sind dann sämtliche Längen \(\| P_n\|\neq 0,\) so ist (1) jedenfalls dann lösbar, wenn \(\sum_{n=1}^\infty \frac{| c_n|}{\| P_n\|}\) konnvergiert, und die kürzeste Lösung ist \(Z(x) =\sum_{n=1}^\infty \frac{|c_n|}{\| P_n\|^2}P_n(x);\) verschwindet aber ein \(\| P\|\), so ist weiterhin eine lineare Relation zwischen den \(c_n\) notwendig für die Lösbarkeit. Speziell folgt, daß \(\| P_n\|\neq 0 \) die notwendige und hinreichende Bedingung für die Existenz einer “reziproken Matrix” \(b_{mn}=\frac{P_n (m)}{\| P_n\|^2}\) von konvergenter Kolonnenquadratsumme zur gegebenen Koeffizientenmatrix \(a_{mn}\), ist.
Endlich wird noch die Verallgemeinerung des Toeplitzschen Kriteriums (F. d. M. 38, 157, 1907, JFM 38.0157.01) auf den vorliegenden Fall aus der dritten Methode abgeleitet. Bleibt die definite quadratische Form \(\sum_{x=1}^\infty ( \sum_{\nu=1}^n y_\nu a_\nu (x))^2\) für alle \(\sum_{\nu=1}^n y_\nu^2 = 1 \) genügenden Veränderlichen und für jedes \(n\) oberhalb, eines Wertes \(l \neq 0,\) so genügt bereits die Konvergenz von \(\sum_{n=1}^\infty c_n^2\) zur Lösbarkeit der Gleichungen (1), und es existiert stets eine in Hilbertschem Sinne beschränkte Reziproke \((b_{mn})\) zu \((a_{mn})\).
Zum Schlußsei noch darauf hingewiesen, daß bei Schmidt alle Entwicklungen sogleich für komplexe Werte der Koeffizienten und Unbekannten angestellt werden, wo es sich dann um Funktionen \(A(x)\) von konvergenter Quadratsumme der absoluten Beträge \(| A|^2 = \sum_{x=1}^\infty |A(x)|^2\) handelt; dann ändert sich nichts Wesentliches gegen vorstehendes Referat (JFM 39.0399.03), wenn nur die Orthogonalitätsbedingung \((A; \overline B) = \sum_{x=1}^\infty A_x\overline B_x = 0\) gefaßt wird, wo durch Überstreichen der Übergang zu konjugiert komplexen Werten angedeutet wird.

MSC:

46-02 Research exposition (monographs, survey articles) pertaining to functional analysis
PDFBibTeX XMLCite
Full Text: DOI

References:

[1] Vergl. meine Dissertation, § 3. undJ. P. Gram,Ueber die Entwickelung reeller Functionen in Reihen mittelst der Methode der kleinsten Quadrate [Journal für die reine und angewandte Mathematik, Bd. XCIV (1883), S. 41–73].
This reference list is based on information provided by the publisher or from digital mathematics libraries. Its items are heuristically matched to zbMATH identifiers and may contain data conversion errors. In some cases that data have been complemented/enhanced by data from zbMATH Open. This attempts to reflect the references listed in the original paper as accurately as possible without claiming completeness or a perfect matching.