Los datos estan dispersos?

1. Introducción a la Estadística y la Variabilidad

Introducción a la Estadística y la Variabilidad

¿Qué es la Estadística?

La estadística es la ciencia que recolecta, organiza, analiza, interpreta y presenta datos para obtener conclusiones y tomar decisiones. Es una herramienta fundamental en muchos campos.

Ejemplo 1: Un laboratorio analiza muestras de sangre para determinar la prevalencia de una enfermedad.

Ejemplo 2: Una encuestadora pregunta a personas sobre su intención de voto en las próximas elecciones.


Importancia de la Estadística

La estadística nos ayuda a entender el mundo, identificar patrones y evaluar la incertidumbre, mejorando la toma de decisiones.

Ejemplo 1: Un agricultor usa datos históricos de lluvia para decidir cuándo plantar sus cultivos.

Ejemplo 2: Una compañía de seguros analiza datos de accidentes para calcular las primas de los seguros.


Tipos de Datos

Los datos son la base de la estadística. Se clasifican en:

  • Cualitativos (o Categóricos): Características no numéricas.


    • Nominal: Categorías sin orden inherente.

      Ejemplo 1: Estado civil (soltero, casado, divorciado).

      Ejemplo 2: Marca de un automóvil (Toyota, Ford, Chevrolet).


    • Ordinal: Categorías con un orden significativo.

      Ejemplo 1: Nivel de educación (primaria, secundaria, universitaria).

      Ejemplo 2: Calificación de un servicio (excelente, bueno, regular, malo).


  • Cuantitativos (o Numéricos): Cantidades medibles.


    • Discretos: Valores enteros (generalmente, conteos).

      Ejemplo 1: Número de hijos en una familia.

      Ejemplo 2: Cantidad de errores en un examen.


    • Continuos: Cualquier valor en un rango.

      Ejemplo 1: Peso de una persona.

      Ejemplo 2: Longitud de un tornillo.


    • De Intervalo: Datos cuantitativos donde el cero es arbitrario (no indica ausencia).

      Ejemplo 1: Temperatura en grados Celsius o Fahrenheit (0°C no significa ausencia de temperatura).

      Ejemplo 2: Año de nacimiento.


    • De Razón: Datos cuantitativos donde el cero es absoluto (indica ausencia).

      Ejemplo 1: Ingreso mensual de una persona (0 pesos significa ausencia de ingresos).

      Ejemplo 2: Altura de un edificio (0 metros significa ausencia de altura).


Variabilidad o Dispersión

La variabilidad indica qué tan "esparcidos" están los datos respecto a un valor central.

Ejemplo 1: Edades de dos grupos:

  • Grupo A: 20, 21, 20, 19, 20
  • Grupo B: 5, 60, 15, 40, 20

El Grupo B tiene mayor variabilidad.

Ejemplo 2: Ventas diarias en dos tiendas:

  • Tienda A: $1000, $1050, $950, $1000, $1100
  • Tienda B: $500, $1500, $800, $1200, $1000

La Tienda B tiene mayor variabilidad.


Medidas de Tendencia Central

Dan una idea del "valor típico".

  • Media: Suma de valores dividida por la cantidad. \( \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} \)


  • Ejemplo 1: \(Variable \ x = [1,3,5,7]\), media =\( \frac{1+3+5+7}{4} =4 \) 

  • Ejemplo 2\( Variable \ y = [100, 200,600]\), media = \( \frac{100+200+600}{3} =450 \)


  • Mediana: Valor central ordenado.


  • Ejemplo 1 (caso cantidad impar):    \( Variable \ x = [10, 50, 30, 40, 20], \underbrace{ \Rightarrow }_{ordenar} x = [10, 20, 30, 40, 50] \underbrace{ \Rightarrow }_{caso \ Impar \newline valor \newline central} Mediana= 30. \newline \color{brown}{ Nota: \ si \ n=5(Impar) \Rightarrow  valor \ central \Rightarrow  \frac{n}{2} + \frac{1}{2} = \frac{5}{2} + \frac{1}{2} = \frac{6}{2}=3°}  \)


  • Ejemplo 2 (caso cantidad par):    \( Variable \ y = [4, 8, 2, 6], \underbrace{ \Rightarrow }_{ordenar} y = [2, 4, 6, 8] \underbrace{ \Rightarrow }_{caso \ Par \newline promedio \newline centrales} Mediana =\frac{4+6}{2} = 5 \newline \color{brown}{ Nota: \ si \ n=4(par) \Rightarrow valor \ central \Rightarrow \begin{array}{lcr} promedio ( \frac{n}{2} \ ; \ \frac{n}{2}+1) \\ promedio ( \frac{4}{2} \ ; \ \frac{4}{2}+1) \\ promedio (2°; 3°) \end{array}} \)


  • Moda: Valor más frecuente.
  • Ejemplo 1: 2, 2, 3, 4, 5. Moda = 2.

  • Ejemplo 2: 1, 1, 2, 3, 3. Bimodal: 1 y 3.

(*Nota: Esto solo es un repaso.*)


Ejercicios y Problemas

Ejercicio 1: Clasifica los siguientes datos:

  1. Tipo de película favorita (comedia, drama, acción, etc.).
  2. Número de estudiantes ausentes en una clase.
  3. Temperatura máxima diaria en una ciudad.
  4. Nivel de acuerdo con una afirmación (totalmente en desacuerdo, en desacuerdo, neutral, de acuerdo, totalmente de acuerdo).
  5. Cantidad de dinero en una billetera.
  6. Año de fabricación de un auto.
  7. Peso de un paquete de arroz.
  8. Número de habitaciones en una casa.

Ejercicio 2:Observa la siguiente distribución de datos y responde:

          12 15 18 18 20 21 21 21 25 30
        
  1. Indica la media de la distribución.
  2. Identifica los valores que consideras que están en los "extremos" de la distribución.
  3. Identifica el sector donde consideras hay una mayor concentracion de datos.

Ejercicio 3: Para cada uno de los siguientes escenarios, proporciona un ejemplo de cada uno de los tipos de datos que se indican:

  • Cualitativo nominal
  • Cualitativo ordinal
  • Cuantitativo discreto
  • Cuantitativo continuo
  • Cuantitativo de intervalo
  • Cuantitativo de razón

    Los escenarios son:

  1. Escenario 1: Una encuesta en un supermercado.
  2. Escenario 2: El registro de pacientes en un consultorio médico.
  3. Escenario 3: La medición de la calidad del aire en una ciudad.

Problema 1: Dos equipos de baloncesto registran sus puntajes en los últimos 5 partidos:

Equipo A: 85, 90, 88, 92, 80

Equipo B: 75, 105, 80, 95, 85

  1. Calcula la media de los puntajes de cada equipo.
  2. Sin calcular la desviación estándar(pronto la aprenderemos), ¿qué equipo tiene mayor variabilidad en sus puntajes registrados? ¿Por qué?

Problema 2: Se registró el tiempo (en minutos) que tardaron 10 personas en completar una tarea:

25, 30, 28, 32, 27, 29, 31, 26, 33, 29

  1. Calcula la media, mediana y moda de los tiempos.
  2. ¿Qué medida de tendencia central describe mejor el "tiempo típico" para completar la tarea? Justifica.
  3. Si una persona adicional completa la tarea en 60 minutos, ¿cómo afectaría esto a la media, mediana y moda? ¿Cuál sería más afectada?

Problema 3: Se pregunta a un grupo de personas cuántos libros leyeron en el último año. Las respuestas son:

2, 0, 5, 1, 3, 2, 1, 0, 4, 6, 2, 3, 1, 0, 40

  1. Calcula la media, mediana y moda.
  2. ¿Cuál es más representativa de la cantidad de libros que leyó *la mayoría*? Justifica.
  3. ¿Hay valores atípicos? ¿Cómo afectan a la media?

© 2025 - Material de Apoyo para la Unidad de Estadística