Tema 4: Introducción a la estadística descriptiva

Estadística descriptiva:

  • Sirve para describir y resumir datos.
  • Se refiere al tipo de estadística que normalmente vemos en los medios de difusión.
  • Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. 

Estadística inferencial:

  • Utiliza muestras de datos para sacar conclusiones sobre poblaciones más grandes. De una población sacamos una muestra, a partir de los estimadores podemos aproximarnos a los parámetros.
  • Este tipo de método se encuentra más frecuentemente en artículos publicados sobre investigación científica.
  •  Induce o infiere leyes de comportamiento de una población, a partir del estudio del análisis de una muestra.
  • Apoyándose en el cálculo de probabilidad y a partir de datos muestrales, efectúa:
    • Estimaciones
    • Decisiones
    • Predicciones
    • Generalizaciones sobre un conjunto mayor de datos 

Variables

Tablas de frecuencias:
  • Tiene columnas y filas.
  • Datos que muestran frecuencias en columnas y las categorías de las variables en las filas.
  • Utilizamos tablas de frecuencia porque presentan información repetitiva de forma visible y comprensible.
  • Requesitos:
    • Son autoexplicativas.
    • Son sencillas y de fácil comprensión.
    • Indican lugar, fecha y fuente de información.
    • Tienen título, breve y claro.
    • Incluye las unidades de medida en cada cabecera.
    • Indican frecuencias absolutas.

Variables continuas: tablas de frecuencia

En esta tabla están ordenados por orden de llegada, lo primero que debemos hacer para construir la tabla de frecuencia es ordenarlos de mayor a menor peso. Una vez que están ordenados, convierto esta variable en una variable ordinal, creo unos intervalos:
  • Primero defino los intervalos.
  • Defino de extremos de los intervalos.
  • Definición de amplitud o distancia entre los extremos.
  • Cálculo de la marca de clase (dato de cada uno de los intervalos) de cada intervalo.
La manera de hacerlo sería la siguiente: primero, calculamos el recorrido o rango.
Cuando no se os dice nada de número de intervalos, se obtiene calculando la raíz cuadrada del número de datos observado.
Luego se divide la amplitud total por el número de intervalos para obtener la amplitud de cada intervalo.

Tablas de frecuencias de datos agrupados:

  • Frecuencias absolutas: número de individuos que presentan una modalidad, o que están incluidos en un intervalo.
  • Frecuencias relativas: proporción de individuos referidos al total que presentan una modalidad o que están incluidos en un intervalo.
  • Frecuencias acumuladas: número de individuos menores o iguales que la modalidad o el intervalo que estamos estudiando.

Indicadores

  • En el análisis descriptivo usamos en gran medida los números relativos, que son la expresión de la relación de dos o más cantidades.
  • La frecuencia absoluta no puede ser un indicador pues le falta un denominador que la relacione con el tamaño de la muestra o población, y/o el periodo en el que se presentaron los eventos.
  • Existen muchos indicadores elaborados en:
    • Instituto Nacional de Estadística
    • Instituto Estadística de Andalucía
    • Centro de investigaciones Sociológicas
Un indicador es la medida de frecuencia de un determinado suceso en una población, que se expresa como un número que puede ser:
  • Proporción
  • Tasa
  • Razón
  • Odds

Proporciones

Se define como una medida resumen para variables cualitativas, que consiste en la comparación, a través de un cociente (división) entre un subconjunto y el conjunto al que pertenece.
  •  El numerador siempre está incluido en el denominador.
  • Adopta valores reales entre 0 y 1, expresando la frecuencia relativa del suceso que medimos.
  • Se suele multiplicar por 100, para una mejor comprensión, expresando los porcentajes correspondientes.
  • Si el suceso que medimos es muy poco frecuente, podemos multiplicar por 1000, por 10.000, etc.

Tasas (Rate)

  • Es una medida de riesgo que expresa el riesgo de ocurrencia del evento estudiado.
  • En realidad, es una proporción, pero con relación espacial y temporal. El denominador incluye una unidad de tiempo.
  • Consiste en la comparación, a través de una división, entre el número de veces que ocurre un cierto tipo de fenómeno y la población en la que puede ocurrir dicho evento en un tiempo determinado.
  • Usualmente el resultado de tal división consiste en una cifra fraccionaria menor a 1, por lo que el resultado suele ser multiplicado por alguna constante que sea múltiplo de 10 (100, 1000, 10000, etc.)

Medidas más empleadas en estadística sanitaria:

  • Prevalencia: La situación en un punto en el tiempo. Describe qué proporción de la población tiene la enfermedad en un punto específico en el tiempo.
  • Incidencia: Lo que está pasando durante un periodo de tiempo. Describe la frecuencia de nuevos casos que ocurren durante un periodo de tiempo. Es el flujo de sanos a enfermos.
Hay dos maneras de medir la incidencia, incidencia acumulada (número de nuevos casos detectados durante el seguimiento que desarrollan la enfermedad) y la densidad de incidencia.

Incidencia

La incidencia mide cambio: de ausencia a presencia de enfermedad, de vivo a muerto, de no tener una característica a tenerla. La incidencia es una medida de riesgo.

Incidencia acumulada

Se calcula utilizando un periodo de tiempo durante el cual consideramos que todos los individuos de la población están a riesgo de la enfermedad.
Mide el riesgo promedio de padecer la enfermedad (probabilidad de desarrollar la enfermedad.
Por ejemplo: esta es la incidencia del contagio por coronavirus en España entre el 10 y el 14 de abril, distribuidos por comunidades.

Tasa de incidencia

  • Con frecuencia, no todos los individuos a riesgo (denominador) son seguidos durante el mismo período de tiempo. Sabemos que no todos los individuos a riesgo lo están durante todo el periodo de estudio, por ello decimos que no son seguidos durante el mismo periodo de tiempo. 
  • Si se disponen de los diferentes tiempos de observación (“tiempos de riesgo”) de los diferentes individuos, se puede calcular la densidad de incidencia o tasa de incidencia.
    • Es necesario especificar la unidad de tiempo a las que se refiere la tasa (personas-año; personas-mes; personas-semanas, etc.)
    • Una misma cantidad de personas-tiempo se puede obtener mediante el seguimiento de distintos grupos de población.
    • Se mide en unidades de tiempo.
    • No son proporciones, es una tasa instantánea. (podemos tener valores mayores de 1)
    • Expresa la “tasa” a la cual ocurren los eventos en sujetos de la población en riesgo en cualquier momento.
    • Expresa velocidad: la tasa de cambio instantáneo o la rapidez con la que se desarrolla un evento en una población.
    • Lo podemos obtener mediante procedimiento de tasa: son los datos agregados o mediante densidad de incidencia: tasa obtenida de datos individuales.

Razones o "ratios"

  • Es una medida de resumen para variables cualitativas que consiste en la comparación, a través de una división entre dos conjuntos.
  • Los dos conjuntos son distintos, uno no incluye al otro.
  • El numerador del cociente, por tanto, no está incluido en el denominador, como sí sucedía en las proporciones.

Odds o ventaja

  • El cociente entre la proporción o probabilidad de ocurrencia de un evento y la proporción o probabilidad (complementaria) de no ocurrencia, se denomina con el término inglés “odds”, empleado en el lenguaje de apuestas.
  • No hay término exacto para definir la Odds, el más aceptado es “ventaja” u “oportunidad”.
  • La odds representa la frecuencia de un aspecto relativa a los sujetos que no presentan dicho aspecto, por lo que es un tipo especial de razón.
  • Sus valores van desde 0 (eventos que nunca ocurren) hasta el infinito (eventos que ocurren siempre).

Medidas de asociación: Relaciones entre proporción, ratios y odds.

Se utilizan para medir fuerzas de asociación. Vamos a ver como se relacionan entre ellas:
  • La magnitud de asociación entre dos fenómenos, puede estimarse a través de medidas que relacionen proporciones, tasas y odds.
  • Es lo que se llaman “medidas de asociación” y dependiendo del estudio se usarán una u otra.
  • Las tres más importantes que hay son:
    • Razón de prevalencias: una razón entre dos prevalencias. Estudios descriptivos de corte transversal. Realiza una ratio entre dos prevalencias (proporciones).
    • Riesgo relativo o razón de riesgo: Una ratio entre dos incidencias acumuladas. Estudios de observaciones de seguimiento o estudios experimentales. Realiza una ratio entre dos incidencias acumuladas (dos proporciones) o dos densidades de incidencia (tasas).
    • Odds ratio: estudios de casos y controles. Realiza una ratio entre dos medidas “odds” o ventajas.

Estudios descriptivos: razón de prevalencia

Es la razón entre la proporción de enfermos en los expuestos y la proporción de enfermos entre los no expuestos. Cuantifica una estimación de la asociación entre el factor de exposición y la enfermedad. 
¿Cómo lo interpreto? Si la razón de prevalencia es 1, la enfermedad se distribuye por igual entre los fumadores y los no expuestos, lo que me llevaría a que la magnitud de asociación es baja o nula (no hay riesgo). Si me da 5 por ejemplo, significa que hay 5 veces más enfermos entre los fumadores que entre los no fumadores. Si nos da 0,1 significa que la prevalencia entre fumadores es mucho más baja que entre los no fumadores, lo que significaría que no fumar sería el factor de riesgo.

Estudio de seguimiento y experimentales: razón de incidencias, razón de riesgos o riesgo relativo

Tenemos los expuestos y no expuestos, pero voy a observar en el tiempo quién desarrolla y quien no desarrolla la enfermedad.
La razón de riesgo o riesgo relativo es el cociente entre incidencia expuestos /incidencia no expuestos.
Si el valor se aproxima a 1, la enfermedad o el suceso aparece de forma similar ente los expuestos y no expuestos. Si me da un valor por encima de 1, es mayor en los expuestos. Si da por debajo de 1, hay más razón de riesgo entre los no expuestos que entre los expuestos.

Estudios de casos y controles: odd ratio o razón de ventajas

Partimos de la enfermedad y busco si hay antecedentes que puedan provocar la enfermedad.

Comentarios

Entradas populares de este blog

Tema 13: Pruebas paramétricas más utilizadas en enfermería. La prueba T-Student. La prueba T-Student para datos apareados. Anova.

Tema 7: Teoría de la probabilidad