Sickit Learn GradientBoostingRegressor

Ich habe mir die Scikit-Learn-Dokumentation für GradientBoostingRegressor angesehen.

Hier steht, dass wir kann „ls“ als Verlustfunktion verwenden, die die Regression der kleinsten Quadrate darstellt. Aber ich bin verwirrt, da die Regression der kleinsten Quadrate eine Methode ist, um die SSE-Verlustfunktion zu minimieren.

Sollten sie hier nicht SSE erwähnen?

Antwort

Es scheint, als würden Sie die im Wesentlichen nur praktischen Kurznamen für die Modellargumente und nicht die formale Terminologie überinterpretieren. Hier " ls bezieht sich auf die Regression der kleinsten Quadrate " sollte als " „ls“ interpretiert werden. ist die Verlustfunktion, die bei der Regression der kleinsten Quadrate verwendet wird. ".

Formal haben Sie natürlich einen Punkt – sse wäre hier eine geeignetere Namenskonvention. Diskussionen über solche Namenskonventionen sind in der Community keine Seltenheit. Siehe beispielsweise die Konsistenz des Namens der Thread-Verlustfunktion bei der Gradientenverstärkung (was übrigens hier gelöst wurde). Und Sie wären die meisten Willkommen beim Öffnen eines relevanten Themas für die hier verwendete Konvention.

Kommentare

  • Vielen Dank für die Klarstellung

Antwort

Beachten Sie, dass der Algorithmus als Gradient Boostign Regressor bezeichnet wird.

Die Idee ist, dass Sie Entscheidungsbäume ankurbeln, um den Gradienten zu minimieren. Dieser Gradient ist eine Verlustfunktion, die mehr Formen annehmen kann.

Der Algorithmus aggregiert jeden Entscheidungsbaum im Fehler des zuvor angepassten und vorhergesagten Entscheidungsbaums. Dort haben Sie Ihre gewünschte Verlustfunktion.

Dieser Parameter bezieht sich darauf.

Kommentare

  • Vielen Dank für den Kommentar @ Carlos. Aber ich habe mich gefragt, ob der Begriff ' Regression der kleinsten Quadrate ', der in der sklearn-Dokumentation wie oben steht, nicht ist nicht genau eine Verlustfunktion. Ich denke, sie hätten stattdessen SSE erwähnen sollen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.