Kapitel 5
Was ist Energie?

Auf dem Weg zum Energiebegriff
Erscheinungsformen der Energie
Die Energie in der Relativitätstheorie
Der Grund für die Energieerhaltung



Auf dem Weg zum Energiebegriff

Wir haben in den letzten Kapiteln mit Kraft, Masse, Geschwindigkeit und Impuls bereits vier wichtige Begriffe kennengelernt, die wir zur Beschreibung der Bewegung von Objekten in Raum und Zeit benötigen. Isaac Newton hat im Jahr 1687 die Zusammenhänge zwischen diesen Begriffen aufgedeckt und ihnen damit ihre physikalische Bedeutung verliehen – hier die Zusammenfassung in Kurzform:

Wenn man es so kompakt ausdrückt, kann man sich kaum noch vorstellen, wie mühsam es war, diese Zusammenhänge sauber herauszuarbeiten. Das Problem liegt darin, dass wir die kräftefreie Bewegung eines Körpers in unserer Umgebung praktisch nicht beobachten können, sodass man die undurchsichtige Wirkung von Reibungskräften und Gravitation erst erkennen muss!

Mit den obigen Gesetzen kann man im Prinzip alle mechanische Bewegungen berechnen, sobald die wirkenden Kräfte bekannt und die Geschwindigkeiten nicht zu hoch sind. So war es Isaac Newton möglich, die Bahn der Planeten um die Sonne auszurechnen und so eindrucksvoll die Richtigkeit seiner Prinzipien zu demonstrieren.

Bei Geschwindigkeiten, die im Bereich der Lichtgeschwindigkeit liegen, werden einige Korrekturen an Newtons Prinzipien notwendig, wie wir gesehen haben: Im Impuls tritt ein Korrekturfaktor \( \gamma \) (der Lorentzfaktor) auf, um die mit zunehmender Geschwindigkeit anwachsende Trägheit eines Körpers zu berücksichtigen, sodass dieser niemals die Lichtgeschwindigkeit überschreiten kann. Außerdem kann Impuls zwischenzeitlich im Kraftfeld zwischen zwei Körpern gleichsam verborgen sein, da sich auch eine Kraftwirkung nur mit Lichtgeschwindigkeit ausbreiten kann.

Und noch etwas haben wir im letzten Kapitel gesehen: Wenn die Impulssumme erhalten bleibt, egal aus welchem gleichmäßig bewegten Bezugssystem heraus wir den Prozess betrachten (Relativitätsprinzip), so muss eine weitere Größe in Summe dabei erhalten bleiben. Diese Größe ist allerdings kein Vektor wie der Impuls, sondern ein Skalar, also eine Größe mit Betrag, aber ohne Richtung. Im nichtrelativistischen Fall handelt es sich dabei einfach um die Masse der Körper: Masse kann also demnach in der nichtrelativistischen Sichtweise werder erzeugt noch vernichtet werden. Die genauere relativistische Analyse zeigt allerdings, dass das so nicht allgemeingültig ist. Was tatsächlich konstant bleibt, ist die Summe aller Teilchenträgheiten \( m \gamma \) mit mit der Masse \(m\) und dem geschwindigkeitsabhängigen Lorentzfaktor \begin{equation} \gamma = \sqrt { \frac {1} {1 - (v/c)^2} } \end{equation} mit der Geschwindigkeit \(v\) und der Lichtgeschwindigkeit \(c\). Diese Teilchenträgheit hatten wir (nach Multiplikation mit \(c^2\), also \( m \gamma c^2 \) ) im letzten Kapitel bereits als relativistische Gesamtenergie bezeichnet, sodass die Summe aller Teilchenenergien konstant bleibt. Nun ist es an der Zeit, zu begründen, warum wir an dieser Stelle den Energiebegriff ins Spiel gebracht haben.

Für Isaac Newton gab es seinerzeit nur wenig Motivation, den Energiebegriff überhaupt zu betrachten. Schließlich war er mit seinen Begriffen Impuls und Kraft in der Lage, alle mechanischen Bewegungen im Prinzip zu berechnen. Wozu also einen weiteren Begriff hinzufügen?

Anderen Naturforschern dämmerte allerdings, dass es neben dem vektoriellen Impuls eine weitere wichtige skalare Größe geben könnte, die in Summe erhalten bleibt. So hatte Christiaan Huygens bereits im Jahr 1669 – also 18 Jahre vor Newtons bahnbrechender Veröffentlichung seiner Bewegungsgesetze – die Stoßgesetze beim elastischen Stoß (man denke an Billiardkugeln) richtig beschrieben, indem er neben der Impulserhaltung auch die Erhaltung einer skalaren Größe forderte, die sich über \( m v^2 \) aus Masse \(m\) und Geschwindigkeit \(v\) berechnen ließ. Heute kennen wir diese Größe als kinetische Energie, doch der Begriff Energie wurde erst um das Jahr 1800 herum gebräuchlich, wobei bei heutigen Konventionen noch ein Faktor 1/2 hinzukommt, wie wir unten noch sehen werden.

Christiaan Huygens
Christiaan Huygens (1629-1695) auf einem Porträt von Bernard Vaillant.
Quelle: Wikimedia Commons File:Christiaan-huygens4.jpg, dort public domain.

Auch Gottfried Leibniz, Newtons Zeitgenosse und später sein erbitterter Widersacher, kannte diese skalare Größe und bezeichnete sie als lebendigen Kraft (siehe Wikipedia: vis viva). In seinen Vorstellungen, die er seit 1678 (also noch vor Newton) entwickelte, war eine Kraft aber kein äußerer Einfluss wie bei Newton, sondern eine innere Eigenschaft eines Körpers. Neben der lebendigen Kraft, die quadratisch mit wachsender Geschwindigkeit anstieg, gab es für ihn auch eine tote Kraft, die das Vermögen für Bewegung beinhaltete und die sich in lebendige Kraft umwandeln ließ – heute würden wir die tote Kraft als potentielle Energie bezeichnen. Ein Pendel, das wir auslenken und festhalten, beinhaltet gerade eine gewisse Menge an toter Kraft, die proportional mit der Höhe anwächst. Lassen wir das Pendel los, so kann sich dieses Vermögen für Bewegung in reale Bewegung und damit in lebendige Kraft umwandeln, um schließlich am Ende einer Schwingung wieder in toter Kraft zu enden. Mit dieser Idee ließen sich beispielsweise die Fallgesetze Galileis gut erklären, nach denen ein Fall aus vierfacher Höhe zu einer doppelten Fallgeschwindigkeit führt (die lebendige Kraft sollte ja mit dem Quadrat der Geschwindigkeit anwachsen: vierfache Höhe ergibt doppelte Geschwindigkeit, da 22 = 4).

Isaac Newton   Gottfried Leibniz
Links: Sir Isaac Newton (1642 - 1727), gemalt von Godfrey Kneller im Jahr 1689.
Rechts: Gottfried Leibniz (1646-1716), gemalt von Christoph Bernhard Francke um 1700.
Quellen: Wikimedia Commons File:GodfreyKneller-IsaacNewton-1689.jpg, Wikimedia Commons File:Gottfried Wilhelm von Leibniz.jpg, beide dort public domain.

Kinetische und potentielle Energie können sich also ineinander umwandeln, wobei ihre Summe im Idealfall konstant bleibt. Heute wissen wir, dass dieses Prinzip der Energieerhaltung in voller Übereinstimmung mit Newtons Bewegungsgesetzen ist und sich aus diesen unter bestimmten Voraussetzungen ableiten lässt. Hier sind die Details (wer sich für die Mathematik dahinter nicht erwärmen kann, kann diesen Teil gerne überspringen):

Schauen wir uns zunächst einen Körper im Schwerefeld der Erde am Erdboden an. Um diesen Körper gegen die auf ihn wirkende Schwerkraft \(F\) um eine Strecke \( \Delta s \) senkrecht hochzuheben, muss man anschaulich eine gewisse Menge Arbeit hineinstecken. Aber schon die Menschen der frühen Antike wussten, wie sich die aufzuwendende Kraft \(F\) verkleinern ließ: Man konnte beispielsweise eine schräge Rampe verwenden – die Kraft \(F\), gegen die man nun entlang der Rampe anschieben musste, war je nach Schräge der Rampe deutlich kleiner als die Kraft beim senkrechten Hochheben. Dafür war aber der Weg \( \Delta s \) der auf der Rampe zu überwinden war, deutlich länger als beim senkrechten Anheben. Wie man es auch anstellt: Das Produkt \(F \, \Delta s\) aus der in Wegrichtung wirkenden Kraft \( F \) und der zu überwindenden Weglänge \( \Delta s \) lässt sich anscheinend nicht verkleinern – es bleibt konstant, wenn man einen gewissen Höhenunterschied überwinden will (Reibungseffekte lassen wir außer Acht).

Wenn sich die Kraft \( \boldsymbol{F} \) (ab jetzt als Vektor fett geschrieben, um auch die Kraftrichtung darzustellen) nun allgemeiner von Ort zu Ort ändern kann, so muss man den Weg in sehr kleine (genauer: infinitesimale) Wegstücke der Länge \( \boldsymbol{ds} \) (ebenfalls ein Vektor) unterteilen, sodass man die Kraft entlang dieses Wegstücks als konstant ansehen kann. Dabei können wir uns analog zum Hochheben entlang einer Rampe vorstellen, das dabei eine bestimmte Arbeit \begin{equation} dW = \boldsymbol{F \, ds} \end{equation} geleistet wird. Der Ausdruck \( \boldsymbol{F \, ds} \) ist dabei das Skalarprodukt von Kraft- und Weg-Vektor, sodass nur der Kraftanteil in Wegrichtung in das Produkt eingeht – sehr wichtig für das Hochschieben entlang einer Rampe! Außerdem kommt durch das Skalarprodukt automatisch ein Vorzeichen ins Spiel: Bewegt sich der Gegenstand gegen die Kraft – beispielsweise beim Anheben – so sind F und ds entgegengesetzt zueinander orientiert, d.h. die Arbeit \(dW\) ist negativ. Lässt man dagegen den Gegenstand beispielsweise die Ebene hinabrollen, so ist \(dW\) positiv. Ein negatives \(dW\) bedeutet also, dass wir Arbeit in potentielle Energie investieren, ein postives \(dW\) bedeutet dagegen umgekehrt, dass wir Arbeit aus der potentiellen Energie entnehmen.

Schauen uns nun an, was geschieht, wenn sich ein Körper selbstständig und reibungsfrei unter dem Einfluss eines Kraft wie beispielsweise der Gravitation entlang einer Wegstrecke \( \boldsymbol{ds} \) bewegt. Wir können den Körper beispielsweise eine glitschige Rampe hinunterrutschen lassen oder die Bewegung eines Pendelkörpers an einem Faden betrachten. Wie verändert sich dann seine Geschwindigkeit im infinitesimalen Zeitintervall \(dt\), in dem er die Wegstrecke \( \boldsymbol{ds} \) zurücklegt, oder genauer: Wie hängt die Geschwindigkeitsänderung \( \boldsymbol{dv} \) mit der Arbeit \( dW \) zusammen, welche die Kraft entlang des Wegstücks an dem Körper ausübt und so seine Geschwindigkeit ändert? Eine kleine Rechnung zeigt: \begin{align} dW &= \boldsymbol{F \, ds} = \\ &= m \, \boldsymbol{a \, ds} = \\ &= m \frac{\boldsymbol{dv}}{dt} \boldsymbol{ds} = \\ &= m \, \boldsymbol{dv} \frac{\boldsymbol{ds}}{dt} = \\ &= m \, \boldsymbol{dv} \, \boldsymbol{v} = \\ &= m \, \boldsymbol{v} \, \boldsymbol{dv} \end{align} Dabei haben wir Newtons nichtrelativistisches Bewegungsgesetz \( \boldsymbol{F} = m \boldsymbol{a} \) im zweiten Schritt verwendet – es steckt also in unserer Überlegung unverzichtbar mit drin.

Wenn sich nun der Körper entlang eines längeren Weges \( \boldsymbol{x}(t) \) von einem Startpunkt \( \boldsymbol{x}_1 \) mit Startgeschwindigkeit \( \boldsymbol{v}_1 \) zu einem Endpunkt \( \boldsymbol{x}_2 \) mit Endgeschwindigkeit \( \boldsymbol{v}_2 \) bewegt, so müssen wir die obigen Ausdrücke entlang des Weges \( \boldsymbol{x}(t) \) aufsummieren oder genauer (wegen der infinitesimalen Änderungen) aufintegrieren, um die Arbeit \( \Delta W \) zu ermitteln. \begin{equation} \Delta W = \int_{\boldsymbol{x}_1}^{\boldsymbol{x}_2} \boldsymbol{F \, ds} = m \int_{\boldsymbol{v}_1}^{\boldsymbol{v}_2} \boldsymbol{v \, dv} = \frac{m}{2} \, (v_2^2 - v_1^2) \end{equation} Man sieht hier, wie durch das Integrieren das Quadrat der Geschwindigkeit entsteht, ganz wie Leibnitz es vermutet hatte.

Und nun kommt die entscheidende Voraussetzung dafür, dass sich der Begriff der potentiellen Energie einführen lässt: Wir machen die Einschränkung an das Kraftfeld \( \boldsymbol{F} \), dass das Integral auf der linken Seite – also die Arbeit, die das Kraftfeld entlang des Weges \( \boldsymbol{x}(t) \) am Körper leistet und so seine Geschwindigkeit ändert – niemals vom Weg \( \boldsymbol{x}(t) \) abhängt, sondern nur vom Start- und Zielpunkt \( \boldsymbol{x}_1 \) und \( \boldsymbol{x}_2 \). Solche Kräfte nennt man konservativ. Genau so kennen wir es vom Gravitationsfeld: Es ist egal, welchen Weg man zwischen zwei Orten wählt – die Hubarbeit ist immer dieselbe. Doch Vorsicht: Nicht alle Kräfte erfüllen diese Bedingung; Reibungskräfte oder die Kräfte in elektrischen Wirbelfeldern tun dies beispielsweise nicht.

Mit dieser Bedingung können wir uns nun irgendeinen Referenzpunkt im Raum suchen – nehmen wir den Ursprung \( \boldsymbol{0} \) – und wir können die Arbeit, die bei einer Bewegung von diesem Referenzpunkt zu einem Punkt \( \boldsymbol{x} \) vom Kraftfeld am Körper geleistet wird, als \( -V( \boldsymbol{x} ) \) bezeichnen (der Weg von \(\boldsymbol{0}\) nach \(\boldsymbol{x}\) spielt ja keine Rolle): \begin{equation} V(\boldsymbol{x}) = - \int_{\boldsymbol{0}}^{\boldsymbol{x}} \boldsymbol{F \, ds} \end{equation} Diesen Ausdruck nennen wir die potentielle Energie oder kurz das Potential des Körpers am Punkt \( \boldsymbol{x} \). Das Vorzeichen haben wir so gewählt, dass die potentielle Energie abnimmt, wenn die Kraft positive Arbeit am Körper leistet und ihn so beispielsweise beschleunigt. Umgekehrt bedeutet das, dass die Kraft immer in die Richtung zeigt, in der das Potential am stärksten abnimmt, was man mathematisch durch die Formel \begin{equation} \boldsymbol{F} = - \nabla V(\boldsymbol{x}) \end{equation} ausdrückt. Anders gesagt: die Kraft zeigt bergab, denn sie ist der negative Gradient des Potentials.

Gravitationspotential der Erde
Gravitationspotential eines kugelförmigen Objektes, beispielsweise der Erde oder der Sonne.
Quelle: Wikimedia Commons File:GravityPotential.jpg,
Autor: AllenMcC, Creative Commons Attribution-Share Alike 3.0 Unported

Damit können wir nun die geleistete Arbeit \( \Delta W \) zwischen den beiden Punkten \( \boldsymbol{x}_1 \) und \( \boldsymbol{x}_2 \) durch das Potential \( V(\boldsymbol{x}) \) ausdrücken, indem wir den Weg über den Referenzpunkt \( \boldsymbol{0} \) laufen lassen (der Weg ist ja egal) und die Wegrichtung des einen Teilweges umkehren, was zu einem Vorzeichenwechel führt: \begin{align} \Delta W &= \int_{\boldsymbol{x}_1}^{\boldsymbol{x}_2} \boldsymbol{F \, ds} \\ &= \int_{\boldsymbol{x}_1}^{\boldsymbol{0}} \boldsymbol{F \, ds} + \int_{\boldsymbol{0}}^{\boldsymbol{x}_2} \boldsymbol{F \, ds}\\ &= - \int_{\boldsymbol{0}}^{\boldsymbol{x}_1} \boldsymbol{F \, ds} + \int_{\boldsymbol{0}}^{\boldsymbol{x}_2} \boldsymbol{F \, ds} \\ & \\ & = V(\boldsymbol{x}_1) - V(\boldsymbol{x}_2) \end{align} Wenn also beispielsweise der Weg von \( \boldsymbol{x}_1 \) nach \( \boldsymbol{x}_2 \) bergab führt und der Körper durch die Kraft \( \boldsymbol{F} \) beschleunigt wird, dann wird durch die Kraft Arbeit am Körper geleistet, sodass \( \Delta W \) positiv ist. Dann muss \( V(\boldsymbol{x}_1) \) größer als \( V(\boldsymbol{x}_2) \) sein, d.h. die potentielle Energie wirkt wie ein Speicher, der abnimmt, wenn wir daraus die Arbeit \( \Delta W \) entnehmen.

Diese entnommene Arbeit macht sich in einer Geschwindigkeitsänderung bemerkbar, denn wir hatten oben bereits die Formel \begin{equation} \Delta W = \frac{m}{2} \, (v_2^2 - v_1^2) \end{equation} abgeleitet. Wenn wir nun analog zur potentiellen Energie die kinetische Energie \(T(v)\) als \begin{equation} T(v) = \frac{m}{2} v^2 \end{equation} definieren, so ergibt sich insgesamt: \begin{equation} \Delta W = V(\boldsymbol{x}_1) - V(\boldsymbol{x}_2) = T(v_2) - T(v_1) \end{equation} oder umgestellt: \begin{equation} V(\boldsymbol{x}_1) + T(v_1) = V(\boldsymbol{x}_2) + T(v_2) \end{equation} oder kurz (da man ja beliebige Anfangs- und Endpunkte nehmen kann): \begin{equation} V(\boldsymbol{x}) + T(v) = \mathrm{konstant} \end{equation} Da ist er also: der Energieerhaltungssatz für die Summe von kinetischer und potentieller Energie in einem konservativen Kraftfeld! Leibnitz wäre begeistert gewesen, und auch Newton wäre sicher beeindruckt, basiert doch die Herleitung entscheidend auf seinem Bewegungsgesetz!

Es gibt nur ein Problem: Die meist unvermeidliche Reibungskraft ist nicht konservativ und zerstört damit unser schönes Ergebnis. Zu Zeiten von Newton und Leibnitz sah das so aus, also ob lebendige Kraft bei den meisten Prozessen nach und nach verloren zu gehen scheint, sodass beispielsweise ein Pendel nicht ganz wieder auf seine alte Höhe zurückschwingt. Leibniz vermutete bereits damals richtig, dass die lebendige Kraft nicht etwa tatsächlich verloren geht, sondern sich in der Lage und Bewegung der kleinsten Teilchen wiederfindet. Viele Gelehrte mochten ihm bei diesem Gedanken damals noch nicht folgen, und es dauerte noch bis in die Mitte des 19. Jahrhunderts, als man herausfand, dass Leibniz mit seiner Idee richtig lag. Schauen wir uns also im nächsten Abschnitt an, in welchen Erscheinungsformen uns die Energie begegnen kann.



Erscheinungsformen der Energie

Die Frage nach der physikalischen Natur der Wärme beschäftigte intensiv die Zeitgenossen von Newton und Leibnitz sowie ihre Nachfolger. Was genau bedeutet es, wenn ein Gegenstand warm wird oder abkühlt? Gibt es vielleicht eine Art unzerstörbaren Wärmestoff (Calorium oder auch Phlogiston) genannt), der aus einem abkühlenden Gegenstand entweicht oder einem sich aufheizenden Gegenstand zufließt? Diese Vorstellung beherrschte das Denken vieler Forscher im 18-ten Jahrhundert.

Doch wie passt dazu die Tatsache, dass man durch Reibung Wärme erzeugen kann, wobei kinetische Energie scheinbar verloren geht? Wandelt diese sich womöglich in eine Art Wärmeenergie um? Und wie ist der Vorgang bei einer Dampfmaschine zu sehen, bei der ein Temperaturgefälle dazu genutzt wird, um mechanische Arbeit zu erzeugen? Wird dabei Wärmeenergie in mechanische Arbeit zurückverwandelt?

Diese Fragen rückten im Zuge der industriellen Revolution zu Beginn des 19-ten Jahrhunderts immer mehr in den Vordergrund. Um 1840 herum setzte sich schließlich aufgrund vieler Experimente und theoretischer Überlegungen die Erkenntnis durch, die Leibnitz bereits vermutet hatte: Wärme ist eng verbunden mit einer Energieform, die in der atomaren Struktur der Materie verborgen ist – wir nennen sie daher ab sofort innere Energie und bezeichnen sie mit dem Buchstaben \( U \). Die innere Energie umfasst also die makroskopisch unsichtbare kinetische und potentielle Energie der umherwimmelnden atomaren Teilchen in einem makroskopischen ruhenden Objekt.

Reibungskräfte sind also nur scheinbar nichtkonservative Kräfte, bei denen Energie verloren zu gehen scheint, weil wir die atomare Struktur der Materie außer Acht lassen. Wenn wir dagegen die kinetische und potentielle Energie aller Teilchen in einem makroskopischen Objekt im Detail berücksichtigen, so bleibt die Energie erhalten.

Wie kann sich die innere Energie \( U \) eines Körpers nun ändern? Es gibt im Wesentlichen zwei Möglichkeiten:

Insgesamt haben wir also: \begin{equation} dU = \delta Q + \delta W \end{equation} Das ist der erste Hauptsatz der Thermodynamik, also der Energieerhaltungssatz für die innere Energie \( U \) eines ruhenden makroskopischen Objektes, wobei sich die Arbeit \( \delta W \) und die Wärmemenge \( \delta Q \) lediglich durch den Prozess unterscheiden, der zur Energieänderung führt: entweder durch Änderung äußerer Parameter wie dem Volumen (→ Arbeit) oder durch mikroskopischen Energieaustausch zwischen den Teilchen (→ Wärmefluss), wobei das Vorzeichen positiv ist, wenn dem System dadurch Energie zugeführt wird.

Die obige Formel erklärt auch, wie eine Dampfmaschine schematisch ungefähr funktioniert: Man heizt ein konstantes Wasserdampfvolumen durch Zufuhr einer Wärmemenge \( \delta Q \) auf und erhöht so seine innere Energie \( U \), was sich in einem höheren Druck äußert. Dann darf der Dampf einen Kolben nach außen schieben und so Arbeit leisten, was zu einer Verminderung der inneren Energie \( U \) führt. Weitere Schritte (Abkühlung und Re-Kompression) stellen dann den Ausgangszustand wieder her. Insgesamt wird dabei ein gewisser Teil der zugeführten Wärmemenge in Arbeit umgewandelt. Wir effektiv diese Umwandlung sein kann, das ist ein anderes Thema und wird uns später im Kapitel über die Entropie beschäftigen.

Die Schreibweise \( \delta Q \) und \( \delta W \) statt \( dQ \) und \( dW \) soll andeuten, dass Arbeit und Wärme – anders als die innere Energie \(U\) keine Zustandsgrößen eines Objektes sind, die seinen makroskopischen Zustand beschreiben. Ein Körper besitzt also keine innere Wärme- oder Arbeitsmenge, sondern nur eine innere Energie \(U\), die die kinetische und potentielle Energie aller atomaren Teilchen zusammenfasst. Arbeit und Wärmemenge sind dagegen nur über den Prozess definiert, der zu einer Änderung der inneren Energie \(U\) führt, nämlich mit oder ohne eine Änderung der äußeren (d.h. makroskopischen) Parameter des Systems.

Bisher haben wir nur das Volumen als äußeren Parameter angesprochen, was für ein Gas in einem Behälter natürlich gut passt. Es sind aber noch viele weitere Parameter denkbar, die den makroskopischen Zustand eines physikalischen Systems thermodynamisch beschreiben: die Stoffmenge bzw. Teilchenanzahl, die chemische Zusammensetzung, äußere Magnetfelder und vieles mehr. Je nach Parameter, der sich verändert, kann man verschiedene Arten von Arbeit unterscheiden, die die innere Energie eines Systems verändern können. Beim Volumen ist es die übliche Arbeit, die den Kolben eines Motors oder einer Dampfmaschine in Bewegung versetzt. Bei der chemischen Zusammensetzung kann es aber auch beispielsweise ein elektrischer Strom sein, den eine Batterie erzeugt und der eine Glühbirne zum Leuchten bringt.

Man könnte daher meinen, dass es verschiedene Erscheinungsformen der Energie hier gibt, aber streng genommen handelt es sich nur um verschiedene makroskopische Prozesse (Parameter), über die sich die innere Energie eines Objektes ändern kann. Die innere Energie selbst umfasst dagegen einfach nur die kinetische und potentielle Gesamtenergie der Teilchen, aus denen das Objekt aufgebaut ist und die darin über Kräfte miteinander wechselwirken. Die dominierende Kraft ist dabei die elektrische Anziehung und Abstoßung zwischen den Teilchen. Diese Kraft ist konservativ, d.h. die Summe der kinetischen und potentiellen Energie ist erhalten (relativistische Effekte lassen wir zunächst außer Acht).

Aber auch andere Kräfte können ins Spiel kommen, beispielsweise die starke Kernkraft bei radioaktiven Stoffen. Damit verlassen wir aber langsam den Bereich der klassichen Physik, und Quantenmechanik sowie Relativitätstheorie kommen ins Spiel. Zudem muss die atomare Struktur eines Objektes letztlich sowieso quantenmechanisch beschrieben werden.

Dabei ist die Quantenmechanik aus Energiesicht zum Glück unproblematisch, denn auch in ihr gilt der Erhaltungssatz für die Energie. Man muss sich nur die klassischen Teilchen in einem Körper mit ihrer kinetischen und potentiellen Energie durch quantenmechanische Energiezustände (stehende Wellen) ersetzt vorstellen, die unterschiedlich stark mit Teilchen besetzt sein können. Ändern sich dabei äußere Parameter, so ändern sich diese Zustände und ihre Energien, während ein Wärmefluss die mittlere Teilchenbesetzung dieser Zustände ändert – wir hatten es oben bereits angesprochen.

Sobald aber die Relativitätstheorie ins Spiel kommt, wird es interessant, denn unerwartete Effekte kommen ins Spiel. Viele davon haben wir oben sowie im Kapitel über den Impuls bereits kurz angesprochen, und wir wollen uns das im Folgenden nun genauer ansehen:



Die Energie in der Relativitätstheorie

Schauen wir uns ein einfaches Beispiel an: Zwei Objekte (z.B. zwei Gummibälle oder Billiardkugeln) fliegen aufeinander zu, stoßen zusammen und prallen voneinander ab, sodass sie wieder auseinander fliegen. Aus dem letzten Kapitel wissen wir, dass die Summe ihrer Impulse vor und nach dem Zusammenstoß dieselbe ist. Die Summe ihrer kinetischen Energien muss aber nicht unverändert bleiben. Nur im Idealfall voll-elastischer Kugeln ist sie nach dem Zusammenstoß noch genauso groß wie vorher – man nennt das den elastischen Stoß.

Im allgemeinen Fall wird sich jedoch ein Teil der kinetischen Energie umgangssprachlich in Wärme der Kugeln verwandeln, oder genauer: Sie erhöht die innere Energie \(U\) der Kugeln, indem sie die kinetische und potentielle Energie der atomaren Teilchen in den Kugeln vergrößert. Man spricht hier vom inelastischen Stoß der Kugeln. Im Extremfall können die beiden Kugeln sogar beim Zusammenstoß komplett aneinander kleben bleiben, sodass sich ein Maximum der kinetischen Kugelenergie in innere Energie umwandelt.

Aus nichtrelativistischer Sicht sieht die Situation also folgendermaßen aus: Die Impulssumme und die Massensumme bleiben erhalten (das wissen wir aus dem letzten Kapitel), und die Gesamtenergie bleibt ebenfalls erhalten, wenn wir die innere Energie U der Kugeln mit berücksichtigen (Abgabe von Energie nach außen, z.B. durch die Abgabe von Wärme, lassen wir hier zur Vereinfachung außer Acht).

Dabei lassen aber weder Impuls noch Trägheit der Kugeln auf die geheimnisvolle innere Energie schließen, die sich im mikroskopischen Gewimmel der Atome in den Kugeln verbirgt. Erst die Messung weiterer Parameter – beispielsweise die Temperatur der Kugeln – würde die Erhöhung der inneren Energie enthüllen. Die innere Energie ist gleichsam in den Kugeln versteckt.

Die nichtrelativistische Sichtweise ist jedoch nur für Geschwindigkeiten weit unterhalb der Lichtgeschwindigkeit anwendbar. Die allgemein korrekte Beschreibung liefert dagegen die spezielle Relativitätstheorie, und die sagt (siehe oben sowie das letzte Kapitel): Nicht die Massensumme ist erhalten, sondern die Summe aller Trägheiten, wobei die Trägheit eines Objekts mit Masse \(m\) gleich \( m \gamma \) mit dem geschwindigkeitsabhängigen Lorentzfaktor \begin{equation} \gamma = \sqrt { \frac {1} {1 - (v/c)^2} } \end{equation} ist. Hier ist \(v\) die Geschwindigkeit und \(c\) die Lichtgeschwindigkeit.

Was bedeutet das nun genau, und was hat das mit der Energie zu tun? Dazu schauen wir uns wieder unsere beiden kollidierenden Objekte an. Zur Vereinfachung wollen wir davon ausgehen, dass beide Objekte dieselbe Masse \(m\) haben und sich mit gleich großer, aber entgegengesetzter Geschwindigkeit \(v\) aufeinander zu bewegen. Bei der Kollision sollen sie komplett aneinander kleben bleiben und sich zu einem ruhenden Objekt der Masse \(M\) vereinen – es muss ruhen wegen der Impulserhaltung. Die Trägheit der beiden kollidierenden Objekte ist dabei jeweils gleich \( m \gamma\) , während die Trägheit des daraus gebildeten ruhenden Objekts einfach gleich \(M\) ist (denn \( \gamma = 1 \) für ein ruhendes Objekt). Da die Summe der Trägheiten unverändert bleiben muss, erhalten wir: \begin{equation} M = 2 m \gamma \end{equation}

inelastische Vereinigung
Inelastischer Stoß, bei dem zwei Körper gleicher Masse \(m\) mit entgegengesetzt-gleicher Geschwindigkeit aufeinanderstoßen und dabei einen neuen ruhenden Körper mit Masse \(M\) bilden.

Da der Lorentzfaktor \( \gamma \) immer größer gleich 1 ist, muss auch die gebildete Masse \( M \) größer-gleich der Massensumme \( 2 m \) der beiden Objekte sein, wobei γ und damit M umso größer wird, je schneller die beiden kollidierenden Objekte sind. Anders gesagt: Je mehr kinetische Energie die beiden kollidierenden Objekte als innere Energie im neuen Objekt deponieren, umso größer ist dessen Masse \( M \). Spiegelt die größer gewordenen Masse \( M \) also tatsächlich die im Objekt verborgene innere Energie \( U \) wider?

Nun war die innere Energie ja oben ins Spiel gebracht worden, um im nichtrelativistischen Fall die Energieerhaltung darstellen zu können. Um die Verbindung zu dieser nichtrelativistischen Überlegung herzustellen, müssen wir also unsere neue relativistische Formel \( M = 2 m \gamma \) bei kleinen Geschwindigkeiten \( v \) betrachten (relativ zur Lichtgeschwindigkeit \( c \)). In diesem Fall kann man den Lorentzfaktor \( \gamma \) näherungsweise so schreiben: \begin{equation} \gamma \approx 1 + \frac{1}{2} \frac{v^2}{c^2} \end{equation}

sodass unsere Formel für die resultierende Masse \(M\) näherungsweise so aussieht (wir multiplizieren die Gleichung noch mit dem Quadrat der Lichtgeschwindigkeit, sodass die kinetische Energie rechts besser zu sehen ist): \begin{align} M c^2 &= 2 m c^2 \gamma = \\ &\approx 2 m c^2 \, \left( 1 + \frac{1}{2} \frac{v^2}{c^2} \right) = \\ &= 2 \, \left( m c^2 + \frac{m}{2} v^2 \right) \end{align} Tatsächlich! Rechts steht die kinetische Energie \( \frac{m}{2} v^2 \) der beiden kollidierenden Objekte. Multipliziert man also alle Massen mit dem Quadrat der Lichtgeschwindigkeit, sodass sie in Energieeinheiten angegeben werden können, dann liefert die Summe der kinetischen Energien jedes der kollidierenden Objekte genau den Betrag, um den die neue Masse \( M c^2 \) im Vergleich zur ursprünglichen Massensumme \( 2 m c^2 \) angewachsen ist. Genau diese Energie steckt nun als innere Energie U im neu gebildeten Objekt. Man kann also sagen:

Genau das hatte Albert Einstein im September 1905 in seiner nur 3 Seiten langen Arbeit herausgefunden, die folgenden bezeichnenden Titel trägt:

Einsteins Arbeit schließt mit den folgenden Worten (wobei er die Lichtgeschwindigkeit mit \(V\) statt \(c\) bezeichnet):


Einstein drückt darin die Hoffnung aus, dass sich sein Ergebnis bei sehr hochenergetischen Prozessen nachweisen lässt, z.B. beim radioaktiven Zerfall von Radium. Die Radioaktivität war in den Jahren um 1900 gerade frisch entdeckt worden und wurde intensiv erforscht.

Tatsächlich kann man die Umwandlung von Masse in Energie und umgekehrt sehr gut nachweisen und sie ist mittlerweile zum entscheidenden Mechanismus zur Erzeugung neuer Teilchen an großen Teilchenbeschleunigern wie dem LHC geworden. Schauen wir uns also ein ähnliche Beispiel zu unserer obigen Kollision an, das aus der Teilchenphysik stammt, nur dass diesmal der umgekehrte Prozess betrachtet wird:

Ein neutrales Pion ist ein instabiles Teilchen, das sich in Teilchenbeschleunigern erzeugen lässt. Seine Masse hat – ausgedrückt in Energieeinheiten – den Wert \( M c^2 \) = 135 MeV, d.h. es ist ungefähr sieben mal leichter als ein Proton (938 MeV). Nach Sekundenbruchteilen zerfällt ein ruhendes neutrales Pion in zwei masselose Photonen (Gamma-Quanten), die jeweils eine Energie von (135 MeV)/2 = 67,5 MeV aufweisen.

Pionzerfall
Zerfall des neutralen Pions in zwei Photonen im Raum-Zeit-Diagramm.

In unserer obigen Formel \( M = 2 m \gamma \) müssen wir nun – wie schon im letzten Kapitel – für die masselosen Photonen den Grenzübergang zur Masse \(m\) gegen Null wieder so durchführen, dass das Produkt \( m \gamma \) konstant bleibt, d.h. der Lorentzfaktor muss passend gegen Unendlich anwachsen, die Geschwindigkeit \(v\) also gegen die Lichtgeschwindigkeit \(c\) gehen, so wie das bei masselosen Teilchen ja generell der Fall ist. Den Term \( m c^2 \gamma \) können wir dann einfach als die Energie \( E_{\mathrm{Photon}} \) eines Photons interpretieren und wir haben \( M c^2 = 2 E_{\mathrm{Photon}} \).

Nach unserer obigen Überlegung müsste dann eigentlich die gesamte Pionmasse auf innerer Energie beruhen, die beim Zerfall in Form der beiden Photonen frei wird. Umgekehrt lässt sich ein neutrales Pion im Prinzip auch aus zwei solchen masselosen Photonen erzeugen – seine Masse wird also komplett aus der Energie der Photonen aufgebaut.

Ein neutrales Pion kann aber ebenfalls – wenn auch selten – in ein Elektron plus ein Positron plus ein Photon zerfallen, bzw. im Prinzip umgekehrt in einer Kollision aus diesen drei Teilchen entstehen. Da Elektron und Positron eine Masse von jeweils rund 0,5 MeV besitzen, entsteht hier nur ein (wenn auch recht großer) Teil der Pionmasse aus der mitgebrachten Energie der Teilchen.

Welcher Teil der Pionmasse ist nun also auf die Masse von irgendwelchen massiven Bestandteilen zurückzuführen, und welcher Teil kommt durch die innere Energie zustande, die diese Bestandteile aufweisen? Das ist kaum zu sagen, denn ein Pion besteht weder aus zwei Photonen noch aus Elektron plus Positron plus Photon. Es besteht aus zwei Quarks! Nun ist aber die Masse von Quarks gar nicht so klar definiert, denn Quarks können gar nicht als freie Teilchen existieren, sodass sich ihre Masse nicht einfach bestimmen lässt.

Bei einer bestimmten Massendefinition (den sogenannten Stromquarkmassen) kommen die Quarks auf eine Masse von wenigen MeV – der Hauptteil der Pionmasse wäre dann also auf die innere Energie dieser Quarks im Pion zurückzuführen, also auf ihre kinetische plus potentielle Energie. Doch wo kommt die Masse der Quarks selbst her? Im Standardmodell der Teilchenphysik entsteht sie durch die Wechselwirkung eines masselosen Quarks mit einem überall im Raum vorhandenen Higgs-Feld, sodass letztlich die Quarksmassen und damit die gesamte Pionmasse aufgrund irgendwelcher Wechselwirkungsenergien entstehen.

Solche Überlegungen zeigen, dass es in der Relativitätstheorie oft gar keinen Sinn mehr macht, die Masse eines Objekts in eine Masse seiner Bestandteile plus den Beitrag seiner inneren Energie aufzuteilen, zumal wenn sich die Bestandteile nur schwer identifizieren lassen. Es ist viel einfacher, Masse generell als lokalisierte (eingesperrte) Energie anzusehen. Das ist genau der Inhalt von Einsteins berühmter Formel \begin{equation} E_0 = m c^2 \end{equation} wobei \( E_0 \) die sogenannte Ruheenergie des Objekts ist. Befindet sich das Objekt dagegen in Bewegung, so ist seine Energie gleich \begin{equation} E = m c^2 \gamma = E_0 \gamma \end{equation} d.h. ein bewegtes Objekt hat eine um den Faktor \( \gamma \) größere Energie als ein ruhendes Objekt, was man als Zusatzbeitrag der kinetischen Energie interpretieren kann. Aber auch die in der Masse enthaltene Energie des ruhenden Objektes lässt sich vollkommen legitim als lokalisierte oder eingesperrte Energie ansehen, denn es könnte ja beispielsweise wie das Pion in zwei masselose Photonen zerfallen und so diese Energie freisetzen. Diese masselosen Photonen besitzen dann gar keine Ruheenergie mehr, denn sie bewegen sich immer mit Lichtgeschwindigkeit; Ihre Energie ist dann über die Formel \( E = p c \) durch den Impulsbetrag \( p \) bestimmt. Für massive wie masselose Teilchen gilt ganz allgemein (siehe die Formel \( (p^0)^2 - \boldsymbol{p}^2 = (m c)^2 \) aus dem vorherigen Kapitel mit \( p^0 c = E \) ): \begin{equation} E^2 = (m c^2)^2 + (\boldsymbol{p} c)^2 \end{equation} Umgekehrt besitzt auch lokalisierte – also in einem Raumgebiet irgendwie eingesperrte – Energie eine Trägheit, die über \( E_0 = m c^2 \) einer Masse entspricht – wir hatten uns das bereits im letzten Kapitel angesehen. So könnten wir beispielsweise gedanklich zwei Photonen mit zueinander entgegengesetzem Impuls in einer ideal verspiegelten kleinen masselosen Kiste einfangen, in der sie ständig hin- und herpendeln. Von außen betrachtet unterscheidet sich die Trägheit dieser Kiste nicht von der Trägheit eines Teilchens wie dem Pion, das aus den beiden Photonen hervorgegangen ist, denn für beide Objekte gelten dieselben Zusammenhänge für die Energie-Impuls-Erhaltung mit den beiden Photonen.

Photonen in einer Kiste
Die Energie- und Impulssumme zweier masseloser Photonen, die in einem verspiegelten masselosen Kasten eingesperrt sind, verhält sich genauso wie die Energie und der Impuls eines massiven Teilchens, dessen Masse \(m\) über \( E = m c^2 \) der Gesamtenergie \(E\) der Photonen im ruhenden Kasten entspricht (oberes Bild).
Bewegt man den Kasten mit 60 % der Lichtgeschwindigkeit, so nimmt die Energie- und Impulssumme entsprechend zu, d.h. es kostet Energie, den Kasten in Bewegung zu setzen. Er besitzt also eine entsprechende Trägheit, obwohl alle Bestandteile (Kasten, Photonen) masselos sind (unteres Bild).
In beiden Bildern bewegen sich die Photonen zwar mit Lichtgeschwindigkeit, aber ihre Energien und ihr Impulse ändern sich, wenn man die ruhende Kiste (oberes Bild) aus einem nach links bewegten Bezugssystem heraus betrachtet, sodass man eine bewegte Kiste sieht (unteres Bild). Man kann dies als Dopplereffekt verstehen, denn die zu dem jeweiligen Photon gehörende Lichtwellenlänge wird von einem nach links bewegten Beobachter als gedehnt bzw. gestaucht wahrgenommen.

Ganz allgemein muss man in der Relativitätstheorie eine räumliche Verteilung aus Massen und Energien durch den sogenannten Energie-Impuls-Tensor beschreiben, wie wir aus dem letzten Kapitel wissen. Die räumliche Energiedichte ist dabei eine Komponente dieses Tensors, während die anderen Komponenten Energieflüsse und damit Impulsdichten sowie Impulsflüsse und damit Kraftdichten darstellen. Es würde zu weit führen, hier genauer darauf einzugehen, aber einen Aspekt wollen wir dennoch kurz herausgreifen: Wie ordnet sich eigentlich der Begriff der nichtrelativistischen potentiellen Energie von Teilchen in dieses relativistische Konzept ein?

Potentielle Energie hatte etwas damit zu tun, dass konservative Kräfte zwischen den Teilchen wirken. In relativistischen Formulierungen wie der Elektrodynamik muss man dieses Konzept erweitern, da man die endliche Ausbreitungsgeschwindigkeit von Kräften berücksichtigen muss. Das gelingt beispielsweise mit der Einführung von elektrischen und magnetischen Feldern und den entsprechenden relativistischen Feldgleichungen (Maxwellgleichungen). Wenn man hier den Feldern selbst in geeigneter Weise Energie und Impuls zuordnet, die sie mit elektrisch geladenen Teilchen austauschen können, so lässt sich auch hier die Erhaltung von Energie und Impuls sicherstellen. Das Wechselspiel zwischen kinetischer und potentieller Energie, das wir vom nichtrelativistischen Fall her kennen, spiegelt sich hier im Austausch von Teilchenenergie und der im elektromagnetischen Feld gespeicherten Energie wider. Mehr dazu findet man beispielsweise in den Feynman-Vorlesungen über Physik: Band II: Elektromagnetismus und Struktur der Materie in Kapitel 8-5 sowie Kapitel 15.

elektrischer Dipol
Bewegen sich zwei Ladungen langsam aufeinander zu, so ändert sich die potentielle Energie der einen Ladung im Kraftfeld der anderen Ladung. Man kann aber gleichwertig dazu auch sagen: Die räumlich verteilte Energie des elektrischen Feldes der beiden Ladungen ändert sich. Bewegen sich die Ladungen schnell, so ist allein die zweite Sichtweise die richtige, da man die endliche Ausbreitungsgeschwindigkeit von Feldern berücksichtigen muss.
Quelle: Wikimedia Commons File:VFPt dipole electric.svg, Autor: Geek3, Creative Commons Attribution-Share Alike 3.0 Unported license.

Die potentielle Energie ist also nichts anderes als die im Feld zwischen den Teilchen gespeicherte Energie. Und von oben wissen wir: Diese Energie hat neben der Bedeutung für die Energiebilanz auch eine direkte physikalische Bedeutung, denn sie trägt zur Gesamtträgheit des Objektes bei, das aus den Teilchen und dem zwischen ihnen existierenden Feld besteht. Und nicht nur das: Die Feldenergie ist sogar eine Quelle für die Gravitation, denn nach Einsteins allgemeiner Relativitätstheorie wissen wir: Jede Energieform, ob nun Masse oder Feldenergie, erzeugt ein Gravitationsfeld. Und da nun Energiedichten über den Energie-Impuls-Tensor auch eng mit Impulsen und Kräften verknüpft sind (siehe das vorherige Kapitel), wundert es nicht, dass auch Drücke eine Quelle für die Gravitation sind.



Der Grund für die Energieerhaltung

Die Energieerhaltung ist ein sehr allgemeines Phänomen der Physik, das sich in fast allen Bereichen zeigt: In der nichtrelativistischen Physik genauso wie in der relativistischen Elektrodynamik oder in der Quantentheorie. Lediglich in Einsteins allgemeiner Relativitätstheorie der Gravitation stößt der Energieerhaltungssatz bisweilen an seine Grenzen, da sich hier der Begriff der Energie für beliebig gekrümmte Raumzeiten nicht mehr allgemeingültig definieren lässt – es macht daher beispielsweise nur begrenzt Sinn, von der Energie des Universums zu sprechen.

Woran liegt es, dass die Energieerhaltung eine so universelle Gültigkeit besitzt? Im Jahr 1918 fand die begabte junge deutsche Mathematikerin Emmy Noether – die es zur damaligen Zeit als Frau im männerdominierten Wissenschaftsbetrieb nicht gerade leicht hatte – die Antwort: Immer wenn sich die physikalischen Gesetze bei Veränderungen eines bestimmten Parameters nicht ändern, so gib es eine zugehörige Erhaltungsgröße, die zeitlich konstant ist. Zur Zeit gehört dabei die Energie, zum Ort der Impuls als Erhaltungsgröße. Genauer bedeutet das (Noether-Theorem):

Emmy Noether
Emmy Noether (1882 bis 1935)
Quelle: Wikimedia Commons File:Noether.jpg, dort public domain.

Man sagt auch, die Natur ist invariant unter Orts- und Zeitverschiebungen und spricht von entsprechenden Symmetrien. Es gibt noch viele weitere solcher Symmetrien mit zugehörigen Erhaltungsgrößen. So führt die Rotationssymmetrie des Gravitationsfeldes der Sonne zur Drehimpulserhaltung für die Bahnbewegung der Planeten. Manche Symmetrien sind dabei auch sehr abstrakt: So führt die sogenannte Eichsymmetrie in der Elektrodynamik (also die Tatsache, dass elektromagnetische Potentiale nicht eindeutig festgelegt sind und daher umgeeicht werden können, ohne die physikalischen Gesetze zu verändern) zur Erhaltung der elektrischen Ladung.

Wie kam Emmy Noether auf diesen bahnbrechende Idee? Die Details wollen wir hier nicht genau besprechen (man findet sie beispielsweise in Wikipedia: Noether-Theorem), aber ich möchte zumindest den grundlegenden Gedanken kurz skizzieren:

Zunächst einmal muss man einen allgemeinen mathematischen Rahmen finden, mit dem sich die physikalischen Gesetze ausdrücken lassen. Dieser Rahmen ist das sogenannte Prinzip der kleinsten Wirkung, das zur Zeit von Emmy Noether bereits bekannt war. Dieses Prinzip funktioniert sehr allgemein: Alle grundlegenden physikalischen Gesetze wie die Newtonsche Mechanik, Maxwells Elektrodynamik, Einsteins Relativitätstheorie und sogar das Standardmodell der Teilchenphysik lassen sich in diesem mathematischem Rahmen formulieren. Eine sehr schöne Darstellung zum Prinzip der kleinsten Wirkung gibt übrigens Richard Feynman in seinen Feynman-Vorlesungen über Physik: Band II: Elektromagnetismus und Struktur der Materie in Kapitel 19.

Schauen wir uns konkret die Bahnkurve eines Teilchens in der Newtonschen Mechanik an, das sich unter dem Einfluss einer konservativen Kraft wie der Schwerkraft so bewegt, dass es sich zur Zeit \( t_1 \) am Ort \( \boldsymbol{x}_1 \) und zur späteren Zeit \( t_2 \) am Ort \( \boldsymbol{x}_2 \) befindet. Wie sieht die Bahnkurve dazwischen aus?

Das könnten wir natürlich problemlos mithilfe von Newtons Bewegungsgesetz ausrechnen, sofern uns das konservative Kraftfeld bekannt ist. Wir wollen es aber durch das Prinzip der kleinsten Wirkung ausdrücken, und dafür müssen wir natürlich erst einmal wissen, das das sein soll: die Wirkung (denn sie hat hier nicht direkt etwas mit der umgangssprachlichen Bedeutung dieses Wortes zu tun).

Ganz einfach: die Wirkung ist eine Zahl, die wir jeder prinzipiell denkbaren Bahnkurve zuordnen, die zur Zeit \( t_1 \) am Ort \( \boldsymbol{x}_1 \) beginnt und zur späteren Zeit \( t_2 \) am Ort \( \boldsymbol{x}_2 \) endet – egal wie verschnörkelt diese Bahnkurve auch sein mag. Diese Bahnkurven dürfen rein willkürlich sein, d.h. sie müssen nicht der physikalisch realen Bahnkurve entsprechen. Aber eine dieser Bahnkurven wird diejenige sein, die das Teilchen tatsächlich unter dem Einfluss von Newtons Bewegungsgesetz nimmt: Es ist genau diejenige Bahnkurve, die den kleinsten Wert für die Wirkung aufweist (etwas präziser müsste man sagen: die Wirkung muss für diese Bahnkurve im Vergleich zu benachbarten Bahnkurven einen lokalen Extremwert aufweisen, also stationär sein – wir wollen aber hier nicht allzu sehr ins Detail gehen).

Bahnkurve
Verschiedene mögliche Bahnkurven.

Damit muss die Wirkung natürlich letztlich Newtons Bewegungsgesetz in irgendeiner versteckten Form enthalten. Konkret erhält man die Wirkung \( S[\boldsymbol{x}] \) für eine Bahnkurve \( \boldsymbol{x}(t) \), die passend startet und endet, durch die folgende Formel: \begin{equation} S[\boldsymbol{x}] = \int_{t_1}^{t_2} \left( \frac{m}{2} \left( \frac{d\boldsymbol{x}(t)}{dt} \right)^2 - V(\boldsymbol{x}(t)) \right) dt \end{equation} d.h. die Wirkung für eine Bahnkurve ist die Differenz von kinetischer Energie minus potentieller Energie entlang der Bahnkurve, integriert über den Zeitraum zwischen Start- und Zielpunkt. Tatsächlich kann man nun mithilfe dieser Formel nachweisen: Aus der Forderung, dass die Wirkung \( S[\boldsymbol{x}] \) minimal werden soll, ergibt sich die Newtonsche Bewegungsgleichung für die Bahnkurve \( \boldsymbol{x}(t) \) (den Beweis findet man beispielsweise in Die Quantisierung der klassischen Mechanik).

Wenn die physikalischen Gesetze nicht davon abhängen, zu welchem Zeitpunkt man sie betrachtet, so darf auch die Bahnkurve, die die minimale Wirkung aufweist, nicht davon abhängen. Etwas vereinfacht kann man auch sagen: die Wirkung \(S\) darf sich nicht wesentlich ändern, wenn man den Zeitparameter \(t\) verschiebt, also eine beliebige Konstante \( \epsilon \) zur Zeit hinzuaddiert. Emmy Noether hat nun den entsprechenden mathematischen Ausdruck für diese Invarianz-Aussage dazu verwendet, um eine neue mathematische Größe zu konstruieren und nachzuweisen, dass diese sich zeitlich nicht ändert. Für Invarianz unter Zeitverschiebungen kommt dabei die Energie des Teilchens heraus, also die Summe von kinetischer und potentieller Energie.

Das Geniale an diesem Schema liegt nun darin, dass es nicht nur in der Mechanik funktioniert, sondern sehr allgemein bei praktisch allen bekannten fundamentalen klassischen Naturgesetzen, wobei "klassisch" gleichbedeutend mit "nicht-quantenmechanisch" zu sehen ist. In der Elektrodynamik treten dabei beispielsweise die elektromagnetischen Potentiale und ihre raum-zeitlichen Änderungen an die Stelle der Teilchenorte und Geschwindigkeiten, und man muss nicht nur über die Zeit, sondern auch über den Raum integrieren, um daraus die Wirkung für die Potentiale zu erhalten. Ganz allgemein fragt heute ein theoretischer Physiker, der sich mit irgendeiner fundamentalen physikalischen Theorie beschäftigt, zuallererst: Wie sieht die Wirkung S der Theorie aus? Aus dem Prinzip der kleinsten Wirkung kann er dann die zugehörigen Bewegungsgleichungen oder Feldgleichungen ableiten.

Ok – mathematisch ist soweit alles in Ordnung: Offenbar kann man passende Wirkungen finden, sodass sich aus dem Prinzip der kleinsten Wirkung die entsprechenden Bewegungsgleichungen ergeben und umgekehrt. Doch irgendwie bleibt die Angelegenheit mysteriös: Woher weiß die Natur eigentlich, welche der möglichen Bahnkurven diejenige mit der kleinsten Wirkung ist? Muss sie dafür nicht auch andere Bahnkurven irgendwie "ausprobieren"? Und was ist letztlich der tiefere Grund dafür, dass das Prinzip der kleinsten Wirkung eine so universelle Gültigkeit in der Natur zu haben scheint?

Als man seit Mitte des 18-ten Jahrhunderts auf dieses Prinzip stieß, hielt man es oft für den Ausdruck göttlicher Weisheit: Offenbar hatte Gott die Naturgesetze so gestaltet, dass sie in gewisser Weise "optimal" abliefen. Bereits früher (in der ersten Hälfte des 17-ten Jahrhunderts) war Pierre de Fermat bei der Analyse von Lichtstrahlen auf ein ähnliches Prinzip gestoßen: Ein Lichtstrahl nimmt in einem Medium zwischen zwei Punkten denjenigen Weg mit der kleinsten (oder manchmal auch der größten) Lichtlaufzeit (Fermat'sches Prinzip). Da liegt natürlich der Gedanke nahe, dass Gott hier einem ökonomischen Prinzip gefolgt ist nach dem Motto "blos keine Zeit verlieren".

Heute weiß man, dass die Begründung für beide Prinzipien in der Wellennatur der Materie und des Lichts liegt. Schauen wir uns dazu das folgende Beispiel an: Eine ebene Lichtwelle trifft auf einen Spalt, der eine bzw. fünf Lichtwellenlängen breit ist. Das Ergebnis sieht dann so aus:

Spalt 1   Spalt 1
Durchgang einer Welle durch einen Spalt, der eine (links) bzw. fünf (rechts) Wellenlängen breit ist. Quellen:
Wikimedia Commons File:Wavelength=slitwidthspectrum.gif
Wikimedia Commons File:5wavelength=slitwidthsprectrum.gif
Creative Commons Attribution-Share Alike 3.0 Unported license
Autor: Lookang many thanks to Fu-Kwun Hwang and author of Easy Java Simulation = Francisco Esquembre

Man sieht, dass hinter dem dünnen Spalt links die Welle sich nahezu wie eine Kugelwelle über einen breiten Fächer nach rechts ausbreitet, während sie hinter dem breiteren Spalt rechts weitgehend geradeaus weiterläuft. Allerdings gibt es auch beim breiteren Spalt seitlich vom Hauptstrahl noch geringere Wellenbewegungen, die auf der Beugung der Welle am Spalt zurückzuführen sind.

Nach dem Huygens'schen Prinzip kann man sich dabei vorstellen, dass von jeder Stelle des Spalts eine kleine kugelförmige Elementarwelle losläuft, und dass sich hinter dem Spalt alle diese Elementarwellen zu einer einzigen Welle überlagern. Je breiter man den Spalt nun macht, umso geringer wird diese Beugung in die seitlichen Bereiche, bis schließlich fast nur noch in Geradeaus-Richtung ein nennenswerter Anteil der Welle weiterläuft. Schaut man sich ein Bild mit breitem Spalt nun von Weitem an, sodass man die einzelnen Wellenberge kaum noch unterscheiden kann und der breite Spalt wieder relativ klein erscheint, so ergibt sich das bekannte Bild aus der Strahlenoptik: Der Spalt lässt ein schmales Bündel von Lichtstrahlen durch, das hinter dem Spalt geradeaus weiter verläuft, so wie auf dem folgenden Bild:

Laserstrahl
Laser-Lichtstrahl über dem Paranal-Observatorium der ESO.
Quelle: Wikimedia Commons File:Laser Towards Milky Ways Centre.jpg
European Southern Observatory (ESO), Creative Commons Attribution 3.0 Unported license

Wie kommt dieses Ergebnis bei größer werdendem Spalt (relativ zur Wellenlänge) zustande? Es ist so: In fast allen Richtungen gibt es bei größer werdendem Spalt zu jeder dort startenden Elementarwelle eine in der Nachbarschaft startende andere Elementarwelle, die in dieser Richtung die erste Elementarwelle auslöscht. Fährt man den Spalt ab und betrachtet dabei die dort startenden Elementarwellen, so haben diese in schräge Richtungen hin sehr schnell oszillierende Phasenunterschiede, was in Summe zu der Auslöschung führt. Nur in der Geradeausrichtung und eng benachbarte Richtungen haben die einzelnen Wellen keinen oder nur kleine Phasenunterschiede, sodass sie sich nennenswert verstärken können. Auf diese Weise entsteht letztlich der Lichtstrahl, wenn der Spalt sehr viel größer als die Wellenlänge geworden ist.

Ist der Spalt dagegen nur ungefähr so groß wie die Lichtwellenlänge selbst, so ist die Nachbarschaft jeder Elementarwelle am Spalt zu klein: Der Spalt hört auf, noch bevor der Gangunterschied zwischen den Elementarwellen zu groß werden kann – auch in relativ schräge Richtungen hin.

Nun besitzt nach der Quantenmechanik nicht nur Licht Wellencharakter, sondern jede Materieform besitzt diesen Charakter. Schauen wir uns als Beispiel wieder unser Teilchen auf seinem Weg zwischen den beiden Raumpunkten an: Jeder Weg \( \boldsymbol{x}(t) \), den ein Teilchen dabei theoretisch nehmen kann, ergibt dabei einen Elementarwellenbeitrag \begin{equation} e^{i S[\boldsymbol{x}]/\hbar} \end{equation} also eine Elementarwelle, deren Phase durch die Wirkung \( S[\boldsymbol{x}] \) des Weges gegeben ist, gemessen in Vielfachen des reduzierten Planckschen Wirkungsquantums \(\hbar\). Alle diese Beiträge müssen aufsummiert werden, um die Amplitude (Welle) am gemeinsamen Endpunkt der Wege zu ermitteln.

Wenn nun die Wirkung \( S[\boldsymbol{x}] \) der Wege sehr viel größer als \(\hbar\) ist, so werden die meisten von Ihnen alle möglichen Phasen bewirken, d.h. die Beiträge \( e^{i S[\boldsymbol{x}]/\hbar} \) oszillieren wild hin und her und löschen sich weitgehend aus. Das entspricht dem obigen Fall, bei dem der Spalt deutlich breiter als eine Wellenlänge ist.

Für diejenigen Wege, bei denen die Wirkung von Weg zu Nachbarweg nur sehr wenig ändert, weil sie dort ein Minimum aufweist, führen alle diese Wege zu Beiträgen mit nahezu gleicher Phase, d.h. Wellenberg trifft auf Wellenberg und die Einzelwellen verstärken sich – analog zur Geradeausrichtung bei breitem Spalt oben. Im Wesentlichen trägt dann nur der Weg mit kleinster Wirkung (und seine unmittelbaren Nachbarwege) zur Gesamtwelle bei – er entspricht dem Lichtstrahl von oben. Das ist genau der klassische Grenzfall, bei dem die quantenmechanische Wellenbetrachtung in die klassische Betrachtungsweise mit Teilchenbahnen und Lichtstrahlen übergeht.

Damit wird klar, warum die klassische Teilchenbahn gerade diejenige Bahn mit der kleinsten (oder zumindest mit stationärer) Wirkung ist. Die Natur probiert tatsächlich alle möglichen Bahnen aus, aber aufgrund der Wellennatur bleibt im klassischen Grenzfall im Wesentlichen nur die Bahn mit der kleinsten Wirkung übrig – der Rest interferiert destruktiv und verschwindet. Das Prinzip der kleinsten Wirkung ist also keineswegs das Ergebnis göttlicher Vorsehung, sondern es spiegelt nur die quantenmechanische Wellennatur der Materie wider.

Damit stellt sich natürlich die Frage: Gilt die Energieerhaltung auch in der Quantenmechanik? Nun, zumindest im klassischen Grenzfall muss sie gelten, wie uns das Prinzip der kleinsten Wirkung gezeigt hat. Aber auch in der Quantenmechanik selbst ist die Energieerhaltung (ebenso wie die Impulserhaltung) erfüllt. Der Grund ist derselbe wie im Noether-Theorem oben: Wenn Zeitverschiebungen physikalisch irrelevant sind, kann man wieder eine erhaltene Größe (den Eigenwert des Hamilton-Operators, der die Zeitentwicklung beschreibt) konstruieren, die im klassischen Grenzfall in die klassische Energie übergeht, also als Energie in der Quantenmechanik gelten kann. Allerdings muss die Energie nicht für jedes Quantensystem immer einen klar definierten Wert haben. Sie kann eine gewisse Quantenunschärfe aufweisen, die umso größer sein kann, je kürzer die Messzeit für die Energiebestimmung ist.

Beispielhaft kann man die Energie- und Impulserhaltung in den sogenannten Feynmangrafen in einer relativistischen Quantenfeldtheorie sehen. Teilchen (die genau genommen ebene Quantenwellen repräsentieren) können sich dort geradlinig fortbewegen und punktuell in sogenannten Vertices miteinander wechselwirken, wobei auch neue Teilchen entstehen und verschwinden können. Dabei gilt in jedem Vertex die relativistische Energie-Impuls-Erhaltung, wie wir sie oben bereits bei der Kollision von Objekten oder beim Zerfall des Pions kennengelernt haben – ein faszinierendes Thema, aber es würde den Rahmen dieses Kapitels sprengen, genauer darauf einzugehen.

Bahnkurve
Einfachster Feynmangraph für die elektromagnetische Wechselwirkung zwischen einem Elektron und einem Myon. Die Zeit läuft von unten nach oben. Die relativistische Energie und der Impuls sind an jedem Verzweigungspunkt (Vertex) erhalten.



Literatur: