Estadistica
8. Organización de datos en tablas, histogramas y gráfico poligonal
Organización de datos en tablas, histogramas y gráfico poligonal
En estadística no basta con reunir datos: también es necesario organizarlos y representarlos de manera clara para poder interpretarlos.
En esta página trabajaremos con tres herramientas muy importantes:
- Tabla de frecuencias, para ordenar los datos.
- Histograma, para representar visualmente cómo se distribuyen.
- Gráfico poligonal, para observar la forma general de la distribución.
Objetivo de la página
- Organizar datos en tablas de frecuencias.
- Construir e interpretar histogramas con intervalos de igual amplitud.
- Construir e interpretar gráficos poligonales.
- Relacionar tablas y gráficos con conclusiones en contexto.
Al finalizar esta página deberías poder:
- Contar frecuencias absolutas y relativas en un conjunto de datos.
- Identificar intervalos con mayor o menor concentración de datos.
- Reconocer la forma general de una distribución a partir de un histograma o de un gráfico poligonal.
Elementos básicos
Cuando organizamos datos cuantitativos, usamos con frecuencia las siguientes ideas:
- Frecuencia absoluta (\(f_i\)): cantidad de datos que caen en un valor o intervalo.
- Frecuencia relativa (\(h_i\)): proporción del total que representa una frecuencia.
\[ h_i=\frac{f_i}{N} \]
donde \(N\) es el total de datos.
En un gráfico poligonal se unen con segmentos los puntos correspondientes a las marcas de clase.
Si un intervalo va de \(a\) a \(b\), su marca de clase es:
\[ \frac{a+b}{2} \]
Idea clave
La tabla ordena los datos; el histograma muestra dónde se concentran; el gráfico poligonal permite ver más fácilmente la forma general de la distribución.
Error frecuente
No confundas histograma con gráfico de barras. En el histograma las barras van pegadas, porque representan intervalos numéricos contiguos.
Importante
En esta página trabajaremos con histogramas usando intervalos de igual amplitud. En ese caso, comparar alturas de barras es correcto porque la frecuencia puede representarse directamente en el eje vertical.
Resumen comparativo
| Representación | ¿Para qué sirve? | ¿Qué se observa mejor? |
|---|---|---|
| Tabla de frecuencias | Ordenar datos | Valores o intervalos y cantidades exactas |
| Histograma | Visualizar distribución | Concentración y dispersión |
| Gráfico poligonal | Seguir la forma general | Subidas, bajadas y tendencia |
Ejemplo guiado 1: tabla de frecuencias
Los siguientes datos representan la cantidad de libros leídos por 12 estudiantes en un mes:
\[ 0,\ 1,\ 2,\ 1,\ 3,\ 2,\ 2,\ 4,\ 1,\ 3,\ 2,\ 0 \]
Contamos cuántas veces aparece cada valor:
| Libros leídos | Frecuencia absoluta | Frecuencia relativa |
|---|---|---|
| 0 | 2 | \(\frac{2}{12}=\frac{1}{6}\) |
| 1 | 3 | \(\frac{3}{12}=\frac{1}{4}\) |
| 2 | 4 | \(\frac{4}{12}=\frac{1}{3}\) |
| 3 | 2 | \(\frac{2}{12}=\frac{1}{6}\) |
| 4 | 1 | \(\frac{1}{12}\) |
La mayor frecuencia corresponde a 2 libros, por lo tanto ese valor es el más frecuente del grupo.
Ejemplo guiado 2: histograma y gráfico poligonal
Se registraron los tiempos de traslado al colegio, en minutos, de 20 estudiantes. Los datos se agruparon así:
| Intervalo (min) | Frecuencia | Marca de clase |
|---|---|---|
| 10 a 20 | 3 | 15 |
| 20 a 30 | 7 | 25 |
| 30 a 40 | 6 | 35 |
| 40 a 50 | 4 | 45 |
Como todos los intervalos tienen la misma amplitud, podemos representar directamente las frecuencias en el histograma.
Histograma
Gráfico poligonal
La mayor concentración de estudiantes está entre 20 y 40 minutos, especialmente en el intervalo 20 a 30.
¿Por qué se usan marcas de clase en el gráfico poligonal?
Porque cada intervalo representa muchos valores posibles. Para dibujar un solo punto por intervalo, se usa su punto medio, que resume la posición del grupo dentro del eje horizontal.
Aplicación en el mundo real
Hospitales, colegios, empresas y centros deportivos organizan datos en tablas e histogramas para detectar concentraciones, comparar grupos y tomar decisiones. Por ejemplo, una escuela puede analizar tiempos de llegada, puntajes o asistencia para reconocer patrones del curso.
Ejercicios
Ejercicio 1
Las edades de 10 personas son:
\[ 14,\ 15,\ 14,\ 16,\ 15,\ 14,\ 17,\ 16,\ 15,\ 14 \]
Construye una tabla de frecuencias absolutas.
| Edad | Frecuencia |
|---|---|
| 14 | 4 |
| 15 | 3 |
| 16 | 2 |
| 17 | 1 |
Ejercicio 2
En una encuesta sobre cantidad de mascotas, se obtuvo la siguiente tabla incompleta:
| Mascotas | Frecuencia absoluta | Frecuencia relativa |
|---|---|---|
| 0 | 5 | \(\frac{5}{20}\) |
| 1 | 7 | \(?\) |
| 2 | 6 | \(?\) |
| 3 | 2 | \(?\) |
Completa las frecuencias relativas.
Como el total es \(20\):
- Para 1 mascota: \(\frac{7}{20}\)
- Para 2 mascotas: \(\frac{6}{20}=\frac{3}{10}\)
- Para 3 mascotas: \(\frac{2}{20}=\frac{1}{10}\)
Ejercicio 3
Los puntajes de 15 estudiantes se agrupan así:
| Intervalo | Frecuencia |
|---|---|
| 40 a 50 | 2 |
| 50 a 60 | 4 |
| 60 a 70 | 5 |
| 70 a 80 | 3 |
| 80 a 90 | 1 |
Indica cuál es el intervalo modal y explica qué significa.
El intervalo modal es 60 a 70, porque tiene la mayor frecuencia: 5.
Eso significa que ese es el rango de puntajes donde se concentra la mayor cantidad de estudiantes.
Ejercicio 4
Usa la tabla siguiente para construir un histograma:
| Intervalo | Frecuencia |
|---|---|
| 0 a 5 | 1 |
| 5 a 10 | 4 |
| 10 a 15 | 6 |
| 15 a 20 | 3 |
Luego responde: ¿en qué intervalo hay mayor concentración de datos?
El histograma debe tener 4 barras pegadas, con alturas 1, 4, 6 y 3.
La mayor concentración de datos está en el intervalo 10 a 15.
Ejercicio 5
Con la misma tabla del ejercicio anterior, determina las marcas de clase y describe cómo se vería el gráfico poligonal.
Las marcas de clase son:
- \(\frac{0+5}{2}=2{,}5\)
- \(\frac{5+10}{2}=7{,}5\)
- \(\frac{10+15}{2}=12{,}5\)
- \(\frac{15+20}{2}=17{,}5\)
El gráfico poligonal une los puntos \((2{,}5,1)\), \((7{,}5,4)\), \((12{,}5,6)\) y \((17{,}5,3)\).
Primero sube, luego alcanza su punto más alto y finalmente baja.
Ejercicio 6
Se comparan dos cursos.
| Intervalo de puntaje | Curso A | Curso B |
|---|---|---|
| 40 a 50 | 2 | 5 |
| 50 a 60 | 5 | 4 |
| 60 a 70 | 7 | 3 |
| 70 a 80 | 4 | 2 |
¿Cuál curso parece concentrarse en puntajes más altos? Justifica.
El Curso A parece concentrarse en puntajes más altos, porque sus mayores frecuencias están en los intervalos 60 a 70 y 70 a 80.
En cambio, el Curso B concentra más estudiantes en intervalos más bajos.
Ejercicio 7
Observa la siguiente información agrupada sobre horas de estudio semanales:
| Intervalo | Frecuencia |
|---|---|
| 0 a 2 | 3 |
| 2 a 4 | 6 |
| 4 a 6 | 8 |
| 6 a 8 | 5 |
| 8 a 10 | 2 |
Redacta dos conclusiones que podrían obtenerse a partir del histograma o del gráfico poligonal.
Dos conclusiones posibles son:
- La mayor concentración de estudiantes está entre 4 y 6 horas semanales.
- Muy pocos estudiantes estudian 8 a 10 horas por semana.
Ejercicio 8
En una sala de clases se registró el tiempo, en minutos, que tardan 16 estudiantes en llegar al colegio:
\[ 12,\ 18,\ 21,\ 25,\ 27,\ 29,\ 30,\ 31,\ 33,\ 35,\ 36,\ 39,\ 41,\ 43,\ 46,\ 48 \]
- Agrupa los datos en los intervalos 10 a 20, 20 a 30, 30 a 40 y 40 a 50.
- Construye la tabla de frecuencias.
- Indica qué intervalo concentra más datos.
a) y b)
| Intervalo | Frecuencia |
|---|---|
| 10 a 20 | 2 |
| 20 a 30 | 4 |
| 30 a 40 | 6 |
| 40 a 50 | 4 |
c) El intervalo con mayor concentración es 30 a 40.
Ejercicios tipo PAES
PAES 1
Si un intervalo va de 12 a 18, ¿cuál es su marca de clase?
- 12
- 18
- 15
- 6
\[ \frac{12+18}{2}=15 \]
Alternativa correcta: c
PAES 2
¿Cuál de las siguientes afirmaciones describe correctamente un histograma?
- Representa categorías separadas, por eso sus barras van con espacio.
- Representa intervalos numéricos, por eso sus barras van pegadas.
- Siempre usa puntos unidos por segmentos.
- Solo sirve para datos cualitativos.
La descripción correcta es la b.
Alternativa correcta: b
PAES 3
Una tabla presenta las siguientes frecuencias:
| Intervalo | Frecuencia |
|---|---|
| 0 a 10 | 2 |
| 10 a 20 | 5 |
| 20 a 30 | 7 |
| 30 a 40 | 4 |
¿Cuál es el intervalo modal?
- 0 a 10
- 10 a 20
- 20 a 30
- 30 a 40
La mayor frecuencia es 7, por lo tanto el intervalo modal es 20 a 30.
Alternativa correcta: c
PAES 4
En una tabla de frecuencias relativas, la suma de todas las frecuencias relativas debe ser:
- 0
- 1
- El número de datos
- La frecuencia mayor
La suma de todas las frecuencias relativas es 1.
Alternativa correcta: b
Cierre
En esta página organizamos datos en tablas y los representamos mediante histogramas y gráficos poligonales. Estas herramientas permiten ver de forma rápida dónde se concentran los datos y cómo se distribuyen.
Esto será muy útil en la siguiente página, porque nos preparará para reconocer distribuciones con forma aproximadamente acampanada y conectar esa lectura con la distribución normal.
Para recordar
- La tabla ordena.
- El histograma muestra concentración y dispersión.
- El gráfico poligonal permite seguir la forma general de la distribución.
- La marca de clase es el punto medio de cada intervalo.