Las ventajas y desventajas de un modelo de regresión múltiple

November 25

La regresión múltiple es una técnica estadística para examinar la relación entre una variable, llamada la variable dependiente o el resultado, y más de un variables independientes. La variable dependiente debe ser continua o casi continua. Las variables independientes pueden ser categóricas o continuas. Por ejemplo, se podría hacer una regresión múltiple se observa la relación entre el peso (la variable dependiente) y la altura, la edad y el sexo (las variables independientes).

Nivel de familiaridad

La regresión múltiple es una de las técnicas estadísticas de uso más común, y muchas personas están familiarizados con ella, al menos en líneas generales. Esto será especialmente cierto de las personas educadas en las ciencias sociales, conductuales o físicos; para esta audiencia, la familiaridad es una ventaja. Por otro lado, si su público es la población en general, a continuación, muchas personas no estarán familiarizados con la regresión múltiple; para esta audiencia, la familiaridad es una desventaja, y es posible que desee utilizar una estadística simple o depender por completo de gráficos.

supuestos

La regresión múltiple hace cuatro supuestos, y estos deben ser verificados. Los supuestos son acerca de los errores del modelo; los errores son la diferencia entre el valor predicho de la variable dependiente y el valor real de la variable dependiente. La regresión múltiple supone que los errores del modelo se distribuyen normalmente; que los errores tienen varianza constante; que la media de los errores es cero; y que los errores son independientes.

Flexibilidad

La regresión múltiple es un método muy flexible. Las variables independientes pueden ser numéricos o categóricos, y las interacciones entre las variables pueden ser incorporados; y los términos polinomiales también pueden ser incluidos. Por ejemplo, al examinar la relación entre el peso y la altura, la edad y el sexo, podría incluir la altura al cuadrado y el producto de la altura y el sexo.
A continuación, la relación entre la altura y el peso sería diferente para hombres y mujeres, y la diferencia predicha de peso entre una persona de 5 pies de alto y una persona de 5 pies y 1 no es la misma que entre un 6 pies de altura persona y una persona de 6 pies y 1.

El uso de múltiples variables

La regresión múltiple utiliza múltiples variables independientes, con cada control a los otros. Por ejemplo, en el modelo de peso relacionada con la altura, la edad y el sexo, el modelo estima el efecto de la altura de controlar por sexo. El parámetro para la altura responde a la pregunta "¿Cuál es la relación entre la altura y el peso, dado que una persona es hombre o mujer y de una cierta edad?"