Bestimmtheitsmaß \(R^2=\frac{TTS-RSS}{TTS}\) \(\hookrightarrow\) Gesamtquadratensumme (Total Sum of Squares = TTS) \(\hookrightarrow\) Residuenquadratensumme (Residual Sum of Squares = RSS) \(\hookrightarrow\) Anteil der durch die Regression erklärten Varianz an der Gesamtvarianz der abhängigen Variable \(Y\)
Multiple lineare Regression: Beispiel
Syntax:\(\hookrightarrow\) Ergänze mit + die weiteren Regressoren
data_gw <-read.csv("../data/gebrauchtwagen.csv")model <-lm(Preis ~ Kilometer + Service + Garage, data = data_gw)summary(model)
Call:
lm(formula = Preis ~ Kilometer + Service + Garage, data = data_gw)
Residuals:
Min 1Q Median 3Q Max
-97.343 -30.205 -1.084 26.777 97.323
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.187e+03 2.585e+01 239.379 <2e-16 ***
Kilometer -3.114e-02 6.359e-04 -48.966 <2e-16 ***
Service 1.345e+02 3.867e+00 34.793 <2e-16 ***
Garage 1.901e+01 8.461e+00 2.247 0.027 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 40.64 on 96 degrees of freedom
Multiple R-squared: 0.9754, Adjusted R-squared: 0.9746
F-statistic: 1267 on 3 and 96 DF, p-value: < 2.2e-16
Interpretation:
\(R^2=0.9754\): 97.54 % der Varianz (im Preis) wird durch das Modell (Achsenabschnitt und alle 3 Regressoren) erklärt \(\hookrightarrow\) sehr hoher Wert nahe Obergrenze 1 ! \(R^2 \in [0,1]\)