EXCEL de régression multiple

A. Colin Cameron, Département d'économie, Univ. de Californie -. Davis


REGRESSION MULTIPLE UTILISATION DE L'ANALYSE DE DONNÉES Add-in

Nous créons alors une nouvelle variable dans les cellules C2: C6, la taille du ménage comme variable explicative en cubes.






Ensuite, dans la cellule C1 donner la rubrique CUBED HH TAILLE.
(Il se avère que pour les données au carré se HH TAILLE a un coefficient de 0,0 exactement le cube est utilisé).

Les cellules de la feuille de calcul A1: C6 devrait ressembler à:

Nous avons la régression avec une interception et régresseurs HH TAILLE et CUBED HH TAILLE

Le modèle de régression de la population est: y = β1 + β2 + β3 x2 x3 + u
On suppose que l'erreur u est indépendante avec une variance constante (homoscédastique) - voir EXCEL LIMITATIONS au fond.

Nous le faisons en utilisant l'analyse des données Add-in et de régression.

La seule modification au cours de régression d'une variable est d'inclure plus d'une colonne dans la chaîne d'entrée X.
Notez toutefois que les variables explicatives doivent être dans les colonnes contiguës (ici les colonnes B et C).
Si ce n'est pas le cas dans les données d'origine, puis des colonnes doivent être copiés pour obtenir les variables explicatives dans les colonnes contiguës.

Frapper OK, nous obtenons


La sortie de régression comporte trois composantes:

Ceci est la sortie suivante. Le plus d'intérêt est R Square.

Total des sommes des carrés
= Somme des carrés résiduelle (ou erreur) + somme des carrés de régression (ou expliquée).

La colonne F donne le F-test global de H0: β2 = 0 et β3 = 0 contre Ha: au moins l'un des β2 et β3 ne est égal à zéro.
En plus: Excel calcule F cela comme:
F = [Régression SS / (k-1)] / [résiduelle SS / (n-k)] = [1,6050 / 2] / [0,39498 / 2] = 4,0635.

La colonne intitulée signification F a la P-valeur associée.
Depuis 0,1975> 0,05, nous ne rejetons pas H0 au niveau signficance 0,05.

Remarque: Signification F = FINV en général (F, k-1, n-k) où k est le nombre de régresseurs compris interception hte.
Ici FINV (4.0635,2,2) = 0,1975.

INTERPRETER COEFFICIENTS TABLE REGRESSION







La sortie de régression la plus intéressante est le tableau suivant de coefficients et de sortie associé:

Soit βj désignent le coefficient de la population du régresseur jème (ordonnée à l'origine, HH HH TAILLE et CUBED SIZE).

y = 0,8966 + 0,3365 + 0,0021 * x * z

CO NFIDENCE POUR INTERVALLE PENTE COEFFICIENTS

95% intervalle de confiance pour β2 de coefficients de pente est de sortie Excel (-1,4823, 2,1552).

Excel calcule ce que
b2 ± t_.025 (3) × soi (b2)
= 0,33647 ± TINV (0,05, 2) × 0,42270
= 0,33647 ± 4,303 × 0,42270
= 0,33647 ± 1,8189
= (-1,4823, 2,1552).

D'autres intervalles de confiance peuvent être obtenus.
Par exemple, pour trouver 99% intervalle de confiance: dans la boîte de dialogue de régression (dans l'analyse des données Add-in),
cochez la case de niveau de confiance et régler le niveau à 99%.

HYPOTHÈSE D'ESSAI DE ZERO PENTE COEFFICIENT ( « TEST DE significativité statistique »)

Le coefficient de HH TAILLE a estimé erreur-type de 0,4227, t-statistique de 0,7960 et la valeur p de 0,5095.
Il est donc statistiquement non significatif au niveau de signification α = .05 comme p> 0,05.

Le coefficient de CUBED HH TAILLE a estimé erreur-type de 0,0131, t-statistique de 0,1594 et la valeur p de 0,8880.
Il est donc statistiquement non significatif au niveau de signification α = .05 comme p> 0,05.

Il y a 5 observations et 3 variables explicatives (interception et x) nous utilisons donc t (5-3) = t (2).
Par exemple, pour HH TAILLE p = = LOI.STUDENT (0.796,2,2) = 0,5095.

HYPOTHÈSE D'ESSAI SUR UN PARAMETRE REGRESSION

Ici, nous testons si HH TAILLE a un coefficient β2 = 1,0.

Exemple: H0: β2 = 1,0 contre Ha: β2 ≠ 1,0 à niveau de signification α = 0,05.

En utilisant l'approche p-valeur

  • p-value = LOI.STUDENT (1,569, 2, 2) = 0,257. [Ici, n = 5 et k = 3 alors n-k = 2].
  • Ne pas rejeter l'hypothèse nulle au niveau .05 puisque la valeur p est> 0,05.
En utilisant l'approche de valeur critique
  • Nous avons calculé t = -1,569
  • La valeur critique est t_.025 (2) = TINV (0.05,2) = 4,303. [Ici, n = 5 et k = 3 alors n-k = 2].
  • Donc, ne rejette pas l'hypothèse nulle au niveau .05 puisque t = | -1,569 | < 4.303.


ESSAI D'ENSEMBLE DES IMPORTANCE DE RÉGRESSION PARAMÈTRES

Nous testons H0: β2 = 0 et β3 = 0 contre Ha: au moins l'un des β2 et β3 ne pas égal à zéro.

Remarque: Signification F = FINV en général (F, k-1, n-k) où k est le nombre de régresseurs compris interception hte.
Ici FINV (4.0635,2,2) = 0,1975.

VALEUR PRÉVUE DE Y Régresseurs Étant donné

Considérons le cas où x = 4, auquel cas CUBED HH SIZE = x ^ 3 = 4 ^ 3 = 64.

Excel limite le nombre de régresseurs (seulement jusqu'à 16 régresseurs.).

Excel erreurs standard et statistiques t et les valeurs de p sont basées sur l'hypothèse que l'erreur est indépendante avec une variance constante (homoscédastique).
Excel ne fournit pas alternaties, de telles erreurs standard asheteroskedastic robustes ou auto-corrélation robuste et statistiques t et les valeurs p.
Plus de logiciels spécialisés tels que Stata, EVIEWS, SAS, LIMDEP, PC-TSP. est nécessaire.







Articles Liés