Capitulo 17
- jimena padilla
- 16 feb 2021
- 3 Min. de lectura
Actualizado: 9 abr 2021
Correlación y regresión bivariadas.

En este capitulo hablaremos acerca de la correlación y regresión bivariadas, además de que podrás conocer el procedimiento de estimación de mínimos cuadrados.
¿QUÉ ES LA CORRELACIÓN BIVARIADA?
La correlación bivariada es una técnica estadística destinada a averiguar:
a) si dos variables tienen relación entre sí
b) si la relación es fuerte-moderada-o débil y
c) qué dirección tiene la relación
Análisis bivariado de asociación
Técnicas bivariadas: Métodos estadísticos para analizar la relación entre dos variables.
Variable independiente:Variable que se cree que afecta el valor de la variable dependiente.
Variable dependiente: Variable que se espera que sea explicada o causada por la variable independiente.
Regresión bivariada
El análisis de regresión bivariada es un procedimiento estadístico apropiado para analizar la relación entre dos variables cuando una se considera la variable dependiente y la otra la variable independiente.
Naturaleza de la relación
Una forma de estudiar la naturaleza de la relación entre la variable dependiente y la independiente es trazar los datos en un diagrama de dispersión.
Diagrama de dispersión: Gráfica de los datos con la variable dependiente en el eje Y (vertical) y la variable independiente en el eje X (horizontal). Indica la naturaleza de la relación, lineal o no lineal, entre las dos variables.
Procedimiento de estimación de mínimos cuadrados
El procedimiento de mínimos cuadrados es una técnica matemática muy sencilla que puede usarse para ajustar datos de X y Y a una línea que represente mejor la relación entre las dos variables. Ninguna línea recta representará perfectamente cada observación en el diagrama de dispersión.Toda recta ajustada a los datos en un diagrama de dispersión está sujeta a error.
La ecuación general para la recta es Y = a + bX. La ecuación para estimar el análisis de regresión es:
Los valores de aˆ y ˆ b pueden calcularse con las ecuaciones siguientes:
Línea de regresión: Valores predichos de Y, basados en valores calculados de aˆ y ˆ b.
Intensidad de asociación: R2 La función de regresión estimada describe la naturaleza de la relación entre X y Y. Otro importante factor es la intensidad de la relación entre las variables.
Coeficiente de determinación
Porcentaje de la variación total en la variable dependiente explicado por la variable independiente
Fórmula:
La variación total es una medida de variación de los valores observados de Y en torno a su media Y . Mide la variación de los valores de Y sin consideración de los valores de X. La variación total, llamada suma de cuadrados total (SCT), está dada por:
Suma de cuadrados debida a la regresión
Variación explicada por la regresión.
Fórmula:
La SCR representa las diferencias entre Yi (los valores de Y predichos por la ecuación de estimación de la regresión) y Y (el valor promedio de Y ). La variación explicada por la regresión (SCR) representará una gran porción de la variación total (SCT).
Suma de cuadrados del error
Variación no explicada por la regresión.
Fórmula:
la SCE representa las diferencias residuales (error) entre los valores observados y predichos de Y. En consecuencia, la variación no explicada es una medida de la dispersión alrededor de la línea de regresión. Si el ajuste fuera perfecto, no habría dispersión alrededor de la línea de regresión y la SCE sería de cero.
Correlación para datos métricos: correlación producto-momento de Pearson
La correlación es el grado en el que cambios en una variable (la variable dependiente) se asocian con cambios en otra.
Análisis de correlación: Análisis del grado en el que cambios en una variable se asocian con cambios en otra.
Correlación producto momento de Pearson: Técnica de análisis de correlación para su uso con datos métricos.
Comments