Tema 12: Concordancia y correlación

junio 08, 2020

Relaciones entre variables y regresión

Estudio conjunto de dos variables

Relación directa e inversa

Regresión lineal simple: Corrwlación y determinación

Se trata de estudiar la asociación lineal entre dos variables cuantitativas.

EJEMPLO: Influencia de la edad en las cifras de Tensión arterial Sistólica

Este ejemplo se trata de una regresión lineal simple: una sola variable independiente que es la edad, esperamos una correlación positiva.

Si hubiese más de una variable independiente (por ejemplo, que no solo influye la edad, sino también el peso) entonces tenemos una regresión lineal múltiple.

Todo parte de la ecuación de la recta: y=ax+b

Modelos lineales determinista: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente. Yo no puedo decir que una persona cuando tenga 80 años va a tener “x” tensión, aunque el modelo me lo diga.

Hay dos tipos de coeficientes, se elige uno u otro dependiendo de si las variables siguen una distribución normal:

Pearson: paramétrica, por lo que requiere que la distribución siga la normalidad. Si siguen ambas variables una normal cogemos a Pearson.
Spearman: no paramétrica, por lo que requiere que se emplee cuando la distribución no siga una normalidad. Si tiene solo una variable que sigue una distribución normal o ninguna.

Análisis de correlación

El análisis de correlación se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables.

Coeficiente de Correlación r de Pearson (r), (Rxy): Es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde -1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta.

¿Cómo comprobar la normalidad de datos?

Epi Info nos muestra un histograma donde vemos si la gráfica sigue una distribución normal o no.

Los métodos más fiables son pruebas estadísticas, hay dos:

Prueba de kolmogorov-smirnov: Si el tamaño muestral es grande.
Prueba de shapiro-wilk: Si el tamaño muestral es pequeño, si tiene menos o igual de 50.

Para las pruebas de normalidad: si p0,05 es normal. Se compara con unos valores que nos da un programa.

Coeficiente de Pearson

Y= β1*x + β0 (Determinista)

Y= β1 *x + β0 + e1 (Probabilista)

Y sería la media de la variable dependiente en un grupo con el mismo valor de la variable independiente.

Para construir un modelo de regresión lineal hace falta conocer: Punto de intersección con el eje de coordenadas=β0 y la Pendiente de la recta a = β1

No hay un modelo determinista: hay una nube de puntos y buscamos la recta que mejor explica el

comportamiento de la variable dependiente en función de la variable independiente.

Buscar este blog

Un alumno en cuarentena