BeschreibungEffect of multicollinearity on coefficients of linear model.png
English: The true parameters are a_1= 2,a_2 =4 which are reliably estimated in the case of uncorrelated X_1 and X_2 (black case) but are unreliably estimated when X_1 and X_2 are correlated (red case). 1000 linear fits on 1000 training data sets are performed.
library(tidyverse) sim <- function(rho){ #Number of samples to draw N = 50 #Make a covariance matrix covar = matrix(c(1,rho, rho, 1), byrow = T, nrow = 2) # Append a column of 1s to N draws from a 2-dimensional # Gaussian # With covariance matrix covar X = cbind(rep(1,N),MASS::mvrnorm(N, mu = c(0,0), Sigma = covar)) # True betas for our regression betas = c(1,2,4) # Make the outcome y = X%*%betas + rnorm(N,0,1) # Fit a linear model model = lm(y ~ X[,2] + X[,3]) # Return a dataframe of the coefficients return(tibble(a1 = coef(model)[2], a2 = coef(model)[3])) } #Run the function 1000 times and stack the results zero_covar = rerun(1000, sim(0)) %>% bind_rows #Same as above, but the covariance in covar matrix #is now non-zero high_covar = rerun(1000, sim(0.95)) %>% bind_rows #plot zero_covar %>% ggplot(aes(a1,a2)) + geom_point(data = high_covar, color = 'red') + geom_point()
verbreitet werden – vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden
neu zusammengestellt werden – abgewandelt und bearbeitet werden
Zu den folgenden Bedingungen:
Namensnennung – Du musst angemessene Urheber- und Rechteangaben machen, einen Link zur Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Diese Angaben dürfen in jeder angemessenen Art und Weise gemacht werden, allerdings nicht so, dass der Eindruck entsteht, der Lizenzgeber unterstütze gerade dich oder deine Nutzung besonders.
Ergänze eine einzeilige Erklärung, was diese Datei darstellt.
The true parameters are a_1= 2,a_2 =4 which are reliably estimated in the case of uncorrelated X_1 and X_2 (black case) but are unreliably estimated when X_1 and X_2 are correlated (red case)
Diese Datei enthält weitere Informationen (beispielsweise Exif-Metadaten), die in der Regel von der Digitalkamera oder dem verwendeten Scanner stammen. Durch nachträgliche Bearbeitung der Originaldatei können einige Details verändert worden sein.