domingo, 7 de junio de 2020

TEMA 5: estadísticos univariables

TEMA 5.

(1) Existen un total de 3 tipos de medidas estadísticas que son:
   - Medidas de tendencia central: dan idea de los valores alrededor de los cuales, el resto de los datos, tienen tendencia a agruparse --> media, moda y mediana
   - Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos --> cuartiles, deciles y percentiles
   - Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de nuestras observaciones --> rango, desviación media, varianza, desviación típica y coeficiente de variación



(2) MEDIDAS DE TENDENCIA CENTRAL
  1. Media (x) aritmética
Es el estadístico más empleado en la estadística descriptiva que siempre va acompañado de la variación típica. Se emplea en variables cuantitativas y su fórmula es:
- La suma de las desviaciones respecto de la media es igual a 0
- No se altera por una transformación lineal de escala


 2. Mediana
Es la puntuación que ocupa la posición central de la distribución; es decir, es un valor que habla sobre la posición. Para poder ejecutarla, se precisan de una serie de datos ordenados de forma creciente o decreciente.
- Si media y mediana son iguales, la distribución de la variable es simétrica
- Si el número de observaciones es impar, el valor de la observación será justamente la observación que ocupa la posición (n+1)/2
- Si la observación es par, el valor de la mediana se corresponde al valor de la media entre los dos valores centrales (n/2)

 3. Moda
Es el valor que se repite con mayor frecuencia en la distribución de los datos. Si los distribuciones poseen una única moda, se denominan unimodales. También existen bimodales y multimodales.
- Se puede emplear en cualquier tipo de variable

Para comprender estos conceptos en su totalidad, en este vídeo de youtube se muestran una serie de ejemplos con la teoría aplicada: https://www.youtube.com/watch?v=CrItHF8aJ3M .



(3) MEDIDAS DE POSICIÓN
 1. Cuartiles: usado en variables cuantitativas y sólo tiene en cuenta la posición de los valores en la muestra


 2. Percentiles
- Los percentiles son los 99 puntos o valores que dividen la distribución en cien partes iguales
- Se representan por P(n). Así, por ejemplo, P70 (percentil 70) es el valor de la variable que es igual o deja por debajo de sí al 70% del total de las puntuaciones
- El percentil “i” (Pi), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores

 3. Deciles: dividen la muestra en 10 partes



(4) MEDIDAS DE DISPERSIÓN
 1. Rango
- Es la medida de dispersión más simple y consiste en tomar la puntuación mayor y restarle la puntuación menor. Es el recorrido de una variable.
- Ejemplo —> Si ordenamos esta puntuación de menor a mayor tendríamos: 22, 40, 53, 57, 93, 98, 103, 108, 116, 121, 252.
La puntuación más alta era 252 y la puntuación más baja 22, por tanto el rango es 252-22=230
- Existe el rango intercuartílico (diferencia entre el tercer y primer cuartil) y rango semiintercuartil cuya fórmula es:


 2. Desviación media
- Es la media aritmética de las distancias de cada observación respecto a la media de la muestra
- La fórmula es..


 3. Varianza
- Es la media de los cuadrados de la diferencia entre cada valor de la variable y la media aritmética de la distribución
- Siempre posee un valor positivo
- Su fórmula es...


 4. Desviación típica o estándar (S)
- Expresa la dispersión de la distribución mediante un valor que siempre es positivo y en las mismas unidades de medida de la variable, siendo la medida de dispersión más utilizada en estadística descriptiva
      Propiedades...
1. La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3. Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.
      Observaciones de la desviación típica...
1. La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas.
2. En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.
3. Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media.


 5. Coeficiente de variación (CV)
- Es una medida de dispersión relativa de los datos

En este enlace se muestran una serie de ejemplos de estos conceptos: https://www.youtube.com/watch?v=KsVQygSlf4k&t=300s



(5) DISTRIBUCIONES NORMALES
- En estadística se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.


Las distribuciones asimétricas son también llamadas sesgadas y se caracterizan porque el pico no es simétrico. Es adimensional y adopta valores entre -1 y 1.

- g 1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media)
- g1 > 0 (distribución asimétrica positiva; La cola de la distribución es más larga hacia la derecha y los valores más elevados quedan a la izquierda)
- g1 < 0 (distribución asimétrica negativa; La cola de la distribución es más larga hacia la izquierda y los valores más elevados quedan a la derecha)

Para explicar la curtosis o apuntamiento, dejaré este enlace explicativo: https://www.youtube.com/watch?v=9-nRaVKs5No .





No hay comentarios:

Publicar un comentario

TEMAS 15-17: visión general de las TICs

Temas 15-17. - SANIDAD DEL FUTURO A TRAVÉS DE LAS TICs...         Cada vez hay más información sobre salud, pero con ella también se mul...