Die Wahrheit über lineare Regression im Jahr 2015
(stat.cmu.edu)Die Wahrheit über lineare Regression
-
Einführung
- Dieses Dokument basiert auf Vorlesungsnotizen, die im Herbst 2015 für 36-401, Modern Regression, erstellt wurden
- Es kann für Menschen hilfreich sein, die lineare Regression lernen oder lehren
- Es reduziert die Abhängigkeit der klassischen Theorie von gaußschem Rauschen und einem exakt spezifizierten linearen Modell und betont stattdessen rechenintensivere, aber robustere Techniken
-
Vollständiger PDF-Text
- Datendateien
- R-Code für jedes Kapitel
- Aktuelle Gliederung
-
Optimale Vorhersage
- Einführung in statistische Modellierung
- Hinweise zum einfachen linearen Regressionsmodell und zur Schätzung
-
Methode der kleinsten Quadrate für einfache lineare Regression
- Maximum-Likelihood-Methode für einfache lineare Regression
- Diagnose und Korrektur einfacher linearer Regression
- Inferenz für Parameter
- Prognoseinferenz für das einfache lineare Modell
- Interpretation von Parametern nach Transformation
- F-Test, R^2 und weitere Hinweise
- Einfache lineare Regression in Matrixform
-
Multiple lineare Regression
- Diagnose und Inferenz für multiple lineare Regression
- Polynomiale und kategoriale Regression
- Multikollinearität
- Tests und Konfidenzintervalle
- Interaktionen
- Ausreißer und einflussreiche Punkte
- Modellauswahl
- Rückblick
- Gewichtete und generalisierte kleinste Quadrate
- Variablenauswahl
- Bäume
- Bootstrap I
- Bootstrap II
Zusammenfassung von GN⁺
- Dieses Dokument bietet einen modernen Ansatz zur linearen Regression und betont robustere rechnerische Methoden, um die Grenzen klassischer Theorie zu überwinden
- Es behandelt statistische Modellierung und Regressionsanalyse umfassend, von den Grundlagen bis zu fortgeschrittenen Themen
- Insbesondere enthält es in der Praxis wichtige Themen wie Multikollinearität, Variablenauswahl und Bootstrap
- Dieses Dokument kann für Studierende oder Praktiker nützlich sein, die Statistik und Data Science lernen
- Ein anderes Projekt mit ähnlicher Funktionalität ist "Advanced Data Analysis from an Elementary Point of View"
1 Kommentare
Hacker-News-Kommentare
Die meisten Menschen verstehen lineare Regression nicht besonders gut
Ich habe vor zehn Jahren an der CMU einen Statistik-Kurs belegt und fand es gut, dabei R zu lernen
Ridge Regression ist nützlich, um Probleme mit Multikollinearität zu lösen
Ich würde gern lernen, wie Quant-Researcher bei Citadel lineare Regression einsetzen
Im Bachelorstudium habe ich mehrmals lineare Regression gelernt
Im Promotionsstudium beschäftige ich mich bei Regressionsproblemen hauptsächlich mit Modellen aus dem Deep Learning
Shalizis "Data Analysis from an Elementary Point of View" ist ein guter Einstieg
Die wichtigste Fähigkeit bei Regression ist, den Intercept zu erkennen
Als jemand, der Regression mit XGBoost unterrichtet, fand ich diesen Artikel sehr hilfreich und leicht zugänglich
In diesem Artikel wird es nicht erwähnt, aber lineare Regression zeigt ebenfalls das Double-Descent-Phänomen, das man häufig im Deep Learning sieht
Ich frage mich, ob jemand weiß, wie man dieses PDF in eine für Mobilgeräte optimierte Form umwandeln kann