Ich möchte hier noch einen, m.E. sehr wichtigen Punkt bei solchen Ausgleichsrechnungen ansprechen, damit niemand in diese Falle tappt.
Ein illustratives Beispiel:
Die fünf schwarzen Datenpunkte in dem angehängten Bild sollen gefittet werden.
Ein linearer Fit ergibt die blaue Kurve. Ein Fit fünfter Ordnung die rote.
Die blaue Linie ist nur eine Näherung, die rote Kurve fittet die fünf Punkte genau.
Obwohl der Ansatz fünfter Ordnung die Gleichung exakt löst, ist er völlig unbrauchbar!
Man kann sich vorstellen, was für Unfug rauskommt, wenn ich die rote Kurve zu Vorhersage von weiteren Punkten heranziehe.
Warum? Weil der lineare Verlauf die tatsächlichen Gegebenheiten besten abbildet.
Jeder Fit ist immer nur so gut, wie die Realitätsnähe der zugrundegelegten Gleichungen.
Um zu eine sinnvollen Ausgleichsrechnung zu erhalten, muss man diese Information schon vorab mit berücksichtigen.
Blind an Polynome hoher Ordung anzufitten führt zu unbrauchbaren Resultaten.
Die Anzahl der Fitparameter in die Höhe zu schrauben, um die Genauigkeit zu erhöhen ist erst dann sinnvoll, wenn diese Gleichungen passen. Bei einem falschen Ansatz führt das zum Gegenteil. Die Brauchbarkeit des Ergebnisses wird immer schlechter.
Leider kann einen die Angaben der Fehlerabweichungen beim Fit dabei noch kräftig in die Irre führen.
Das sieht man gut am dem Bildbeispiel. Führt man einen automatisch Fit 5.Ordnung durch, ohne das Bild anzusehen, so liefert der: Keine Abweichungen. Fit 100%ig. Das suggerieren einem, dass der Fit passt. Das dem nicht der Fall ist, merkt man wenn man einen neuen (den grünen) Punkt testet. Der hat eine immense Abweichung von der roten Kurve. Viel besser lässt er sich von der blauen Linie reproduzieren. (Möglicherweise hat man aber gerade diesen Fit verworfen, weil er größere Fehlerquadrate hat
).
Ein Fit, der die vorhandenen Punkte gut reproduziert und somit kleine Fehlerquadrate ausgibt, liefert also nicht notwendigerweise gute Ergebnisse bei der Vorhesage. Je mehr freie Parameter, desto größer wird diese Gefahr und deshalb sollte man einen Ansatz wählen, der mit möglichst wenigen Fitparametern auskommt.
Gruß
Ben