Tema 12: Concordancia y correlación
Relaciones entre variables y regresión
Estudio conjunto de dos variables
Relación directa e inversa
Regresión lineal simple: Corrwlación y determinación
Se trata de estudiar la asociación lineal entre dos variables cuantitativas.
EJEMPLO: Influencia de la edad en las cifras de Tensión arterial Sistólica
Este ejemplo se trata de una regresión lineal simple: una sola variable independiente que es la edad, esperamos una correlación positiva.
Si hubiese más de una variable independiente (por ejemplo, que no solo influye la edad, sino también el peso) entonces tenemos una regresión lineal múltiple.
Todo parte de la ecuación de la recta: y=ax+b
Modelos lineales determinista: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente. Yo no puedo decir que una persona cuando tenga 80 años va a tener “x” tensión, aunque el modelo me lo diga.
Hay dos tipos de coeficientes, se elige uno u otro dependiendo de si las variables siguen una distribución normal:
- Pearson: paramétrica, por lo que requiere que la distribución siga la normalidad. Si siguen ambas variables una normal cogemos a Pearson.
- Spearman: no paramétrica, por lo que requiere que se emplee cuando la distribución no siga una normalidad. Si tiene solo una variable que sigue una distribución normal o ninguna.
Análisis de correlación
El análisis de correlación se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables.
Coeficiente de Correlación r de Pearson (r), (Rxy): Es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde -1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta.
¿Cómo comprobar la normalidad de datos?
Epi Info nos muestra un histograma donde vemos si la gráfica sigue una distribución normal o no.
Los métodos más fiables son pruebas estadísticas, hay dos:
- Prueba de kolmogorov-smirnov: Si el tamaño muestral es grande.
- Prueba de shapiro-wilk: Si el tamaño muestral es pequeño, si tiene menos o igual de 50.
Para las pruebas de normalidad: si p0,05 es normal. Se compara con unos valores que nos da un programa.
Coeficiente de Pearson
Y= β1*x + β0 (Determinista)
Y= β1 *x + β0 + e1 (Probabilista)
Y sería la media de la variable dependiente en un grupo con el mismo valor de la variable independiente.
Para construir un modelo de regresión lineal hace falta conocer: Punto de intersección con el eje de coordenadas=β0 y la Pendiente de la recta a = β1
No hay un modelo determinista: hay una nube de puntos y buscamos la recta que mejor explica el
comportamiento de la variable dependiente en función de la variable independiente.
Comentarios
Publicar un comentario