Bloque V. Sentido algebraico y tratamiento de la información
Estadística
¿Qué es la estadística?
La estadística en la vida cotidiana
La estadística es la parte de las Matemáticas que se encarga de recoger, organizar, representar y analizar datos.
Gracias a la estadística podemos estudiar grandes cantidades de información y obtener conclusiones a partir de ella.
La estadística aparece continuamente en nuestra vida diaria. Por ejemplo:
- En las encuestas de opinión.
- En los resultados deportivos.
- En las previsiones meteorológicas.
- En los estudios de población.
- En las notas de una clase.
- En las estadísticas de visitantes de una página web.
Cuando una noticia afirma que un determinado porcentaje de personas piensa de una forma concreta, esa información suele proceder de un estudio estadístico.
Fases de un estudio estadístico
Un estudio estadístico suele seguir varios pasos.
- Recoger los datos.
- Organizar la información.
- Representar los datos mediante tablas o gráficos.
- Analizar los resultados.
- Obtener conclusiones.
Por ejemplo, imaginemos que queremos conocer el deporte favorito de los alumnos de una clase.
Paso 1. Recogida de datos
Preguntamos a cada alumno cuál es su deporte favorito.
Paso 2. Organización
Anotamos las respuestas en una tabla.
| Deporte | Número de alumnos |
|---|---|
| Fútbol | 12 |
| Baloncesto | 7 |
| Natación | 4 |
| Otros | 2 |
Paso 3. Representación
Podemos representar los datos mediante un diagrama de barras o un gráfico de sectores.
Paso 4. Análisis
Observamos que el fútbol es el deporte más elegido.
Paso 5. Conclusión
Concluimos que el fútbol es el deporte favorito de la mayoría de los alumnos de la clase.
La estadística nos ayuda a transformar una gran cantidad de datos en información fácil de comprender y utilizar.
Recogida de datos
Para realizar un estudio estadístico, lo primero que necesitamos es obtener información. A este proceso se le llama recogida de datos.
Los datos pueden obtenerse de muchas formas:
- Mediante encuestas.
- Realizando mediciones.
- Observando situaciones.
- Consultando registros ya existentes.
Por ejemplo:
- Preguntar a los alumnos cuál es su color favorito.
- Medir la altura de los alumnos de una clase.
- Contar los coches que pasan por una calle.
- Registrar las temperaturas de una semana.
La calidad de un estudio estadístico depende en gran medida de que los datos se recojan correctamente.
Población y muestra
Cuando realizamos un estudio estadístico debemos decidir sobre qué grupo queremos obtener información.
Población
La población es el conjunto completo de elementos que queremos estudiar.
Ejemplos:
- Todos los alumnos de un colegio.
- Todos los habitantes de una ciudad.
- Todos los coches de un aparcamiento.
A veces la población es demasiado grande para estudiar todos sus elementos.
En esos casos se selecciona una parte representativa de la población.
Muestra
La muestra es un subconjunto de la población que utilizamos para realizar el estudio.
Ejemplos:
- 50 alumnos elegidos de un colegio con 600 alumnos.
- 500 habitantes de una ciudad con 100 000 habitantes.
- 100 coches observados en una carretera.
Si la muestra está bien elegida, las conclusiones obtenidas suelen ser parecidas a las que obtendríamos estudiando toda la población.
Queremos conocer el deporte favorito de los alumnos de un colegio.
- Población: todos los alumnos del colegio.
- Muestra: 80 alumnos seleccionados para responder una encuesta.
Variables estadísticas
La característica que estudiamos en cada elemento de la población o de la muestra se llama variable estadística.
Por ejemplo:
- Color favorito.
- Altura.
- Edad.
- Número de hermanos.
- Deporte favorito.
Las variables estadísticas pueden ser de dos tipos.
Variables cualitativas
Describen una cualidad o característica y no se expresan mediante números.
Ejemplos:
- Color de ojos.
- Deporte favorito.
- Medio de transporte utilizado para ir al colegio.
- Asignatura preferida.
Variable: color favorito
Posibles valores:
- Azul
- Rojo
- Verde
- Amarillo
- Negro
Variables cuantitativas
Se expresan mediante números porque representan cantidades.
Ejemplos:
- Edad.
- Altura.
- Peso.
- Número de hermanos.
- Número de mascotas.
Variable: número de hermanos
Posibles valores:
- 0
- 1
- 2
- 3
- 4
- ...
Ejemplos de recogida de datos
Observa los siguientes estudios estadísticos.
| Estudio | Población | Variable |
|---|---|---|
| Color favorito de una clase | Alumnos de la clase | Color favorito |
| Altura de los alumnos de un colegio | Alumnos del colegio | Altura |
| Número de libros leídos en un mes | Alumnos de un curso | Número de libros |
| Deporte favorito de los alumnos | Alumnos encuestados | Deporte favorito |
En todos los casos se recogen datos que posteriormente se organizarán en tablas y gráficos para facilitar su estudio.
Antes de comenzar un estudio estadístico debemos responder tres preguntas:
- ¿Qué queremos estudiar?
- ¿A quién vamos a estudiar?
- ¿Qué datos necesitamos recoger?
Organización de datos en tablas
Cuando recogemos datos, normalmente obtenemos una lista de respuestas que puede resultar difícil de interpretar.
Para facilitar su estudio, organizamos la información en tablas.
Las tablas permiten:
- Ordenar los datos.
- Contar con facilidad cuántas veces aparece cada valor.
- Comparar resultados.
- Preparar la información para construir gráficos.
Tablas de datos
Una tabla de datos muestra directamente la información recogida.
Por ejemplo, preguntamos a 12 alumnos cuál es su color favorito y obtenemos las siguientes respuestas:
| Alumno | Color favorito |
|---|---|
| 1 | Azul |
| 2 | Rojo |
| 3 | Azul |
| 4 | Verde |
| 5 | Azul |
| 6 | Rojo |
| 7 | Azul |
| 8 | Amarillo |
| 9 | Verde |
| 10 | Azul |
| 11 | Rojo |
| 12 | Azul |
Esta tabla contiene todos los datos obtenidos en la encuesta.
Sin embargo, cuando el número de datos es grande, resulta más útil resumir la información.
Tablas de frecuencia
Una tabla de frecuencia agrupa los datos iguales y cuenta cuántas veces aparece cada uno.
A partir de la tabla anterior obtenemos:
| Color favorito | Número de alumnos |
|---|---|
| Azul | 6 |
| Rojo | 3 |
| Verde | 2 |
| Amarillo | 1 |
Ahora resulta mucho más fácil observar qué respuestas son las más frecuentes.
Ventajas de las tablas de frecuencia
Las tablas de frecuencia permiten:
- Resumir grandes cantidades de datos.
- Localizar rápidamente los valores más frecuentes.
- Comparar diferentes resultados.
- Construir gráficos estadísticos de forma sencilla.
Por esta razón son una de las herramientas más utilizadas en estadística.
Construcción de una tabla de frecuencia
Para construir una tabla de frecuencia podemos seguir estos pasos:
- Recoger los datos.
- Identificar los valores diferentes que aparecen.
- Contar cuántas veces aparece cada valor.
- Organizar los resultados en una tabla.
Ejemplo:
Datos obtenidos al preguntar por el número de mascotas:
2, 1, 0, 2, 3, 1, 2, 1, 0, 2
Valores distintos:
0, 1, 2 y 3
Tabla de frecuencia:
| Número de mascotas | Número de alumnos |
|---|---|
| 0 | 2 |
| 1 | 3 |
| 2 | 4 |
| 3 | 1 |
Comprobación:
2 + 3 + 4 + 1 = 10
La suma de todas las frecuencias debe coincidir con el número total de datos recogidos.
Antes de elaborar gráficos estadísticos es conveniente organizar siempre los datos en una tabla de frecuencia.
Las tablas permiten detectar errores y facilitan mucho el análisis posterior.
Frecuencias
Cuando realizamos un estudio estadístico, una de las preguntas más importantes es saber cuántas veces aparece cada dato.
Para responder a esta pregunta utilizamos las frecuencias.
La frecuencia indica cuántas veces aparece un valor dentro del conjunto de datos.
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un dato.
Se suele representar mediante las letras $f$ o $f_i$.
Observa el siguiente ejemplo:
| Color favorito | Frecuencia absoluta |
|---|---|
| Azul | 12 |
| Rojo | 6 |
| Verde | 2 |
Esto significa que:
- 12 alumnos prefieren el color azul.
- 6 alumnos prefieren el color rojo.
- 2 alumnos prefieren el color verde.
La suma de todas las frecuencias absolutas es igual al número total de datos recogidos.
En este caso:
$$ 12 + 6 + 2 = 20 $$
Por tanto, participaron 20 alumnos en la encuesta.
Frecuencia relativa
La frecuencia relativa indica qué parte del total representa cada dato.
Para calcularla dividimos la frecuencia absoluta entre el número total de datos.
$$ \text{Frecuencia relativa} = \frac{\text{Frecuencia absoluta}}{\text{Número total de datos}} $$
Utilizando el ejemplo anterior:
| Color favorito | Frecuencia absoluta | Frecuencia relativa |
|---|---|---|
| Azul | 12 | 0,6 |
| Rojo | 6 | 0,3 |
| Verde | 2 | 0,1 |
Cálculos:
$$ \frac{12}{20}=0,6 $$
$$ \frac{6}{20}=0,3 $$
$$ \frac{2}{20}=0,1 $$
La suma de todas las frecuencias relativas siempre es 1.
$$ 0,6 + 0,3 + 0,1 = 1 $$
Frecuencia relativa en porcentaje
La frecuencia relativa también puede expresarse como porcentaje.
Para ello multiplicamos la frecuencia relativa por 100.
$$ \text{Porcentaje} = \text{Frecuencia relativa} \times 100 $$
Continuando con el ejemplo:
| Color favorito | Frecuencia absoluta | Frecuencia relativa | Porcentaje |
|---|---|---|---|
| Azul | 12 | 0,6 | 60 % |
| Rojo | 6 | 0,3 | 30 % |
| Verde | 2 | 0,1 | 10 % |
Cálculos:
$$ 0,6 \times 100 = 60\% $$
$$ 0,3 \times 100 = 30\% $$
$$ 0,1 \times 100 = 10\% $$
La suma de todos los porcentajes debe ser siempre 100 %.
$$ 60\% + 30\% + 10\% = 100\% $$
Relación entre las distintas frecuencias
Las tres formas de expresar la información están relacionadas.
| Color favorito | Frecuencia absoluta | Frecuencia relativa | Porcentaje |
|---|---|---|---|
| Azul | 12 | 0,6 | 60 % |
| Rojo | 6 | 0,3 | 30 % |
| Verde | 2 | 0,1 | 10 % |
| Total | 20 | 1 | 100 % |
Cada columna proporciona la misma información de una manera diferente:
- La frecuencia absoluta indica cuántas veces aparece cada dato.
- La frecuencia relativa indica qué parte del total representa.
- El porcentaje indica esa misma proporción sobre 100.
Supongamos que en una clase de 25 alumnos, 15 practican algún deporte.
Frecuencia absoluta:
15 alumnos
Frecuencia relativa:
$$ \frac{15}{25}=0,6 $$
Porcentaje:
$$ 0,6 \times 100 = 60\% $$
Podemos decir que el 60 % de los alumnos practica algún deporte.
Diagramas de barras
Los diagramas de barras son gráficos que utilizan barras rectangulares para representar datos.
La altura de cada barra indica la frecuencia del dato representado.
Observa el siguiente ejemplo:
En este gráfico:
- El color azul ha sido elegido por 12 alumnos.
- El color rojo ha sido elegido por 6 alumnos.
- El color verde ha sido elegido por 2 alumnos.
Cómo construir un diagrama de barras
Para construir un diagrama de barras podemos seguir estos pasos:
- Dibujar dos ejes perpendiculares.
- Colocar los datos en el eje horizontal.
- Elegir una escala adecuada para el eje vertical.
- Dibujar una barra para cada dato.
- Comprobar que la altura de cada barra coincide con su frecuencia.
Ventajas de los diagramas de barras
Los diagramas de barras permiten:
- Comparar fácilmente distintos datos.
- Identificar los valores más frecuentes.
- Detectar diferencias entre categorías.
- Presentar información de forma clara y visual.
Al observar un diagrama de barras conviene fijarse primero en:
- La barra más alta.
- La barra más baja.
- Las diferencias entre las distintas barras.
Esto permite interpretar rápidamente la información representada.
Gráficos de líneas
Los gráficos de líneas representan datos mediante puntos unidos por segmentos.
Se utilizan especialmente cuando queremos observar cómo cambia una cantidad a lo largo del tiempo.
Por ejemplo, podemos representar la temperatura máxima registrada durante una semana.
Observamos que:
- La temperatura aumenta desde el lunes hasta el miércoles.
- Desciende ligeramente el jueves.
- Vuelve a aumentar hasta alcanzar su valor máximo el sábado.
- Baja ligeramente el domingo.
Cómo construir un gráfico de líneas
Para construir un gráfico de líneas podemos seguir estos pasos:
- Dibujar los ejes.
- Colocar los valores de la variable horizontal.
- Representar cada dato mediante un punto.
- Unir los puntos con segmentos.
Utilidad de los gráficos de líneas
Los gráficos de líneas permiten:
- Observar tendencias.
- Detectar aumentos y disminuciones.
- Comparar cambios a lo largo del tiempo.
- Analizar la evolución de una variable.
Los gráficos de líneas son muy utilizados para representar:
- Temperaturas.
- Precios.
- Población.
- Ventas.
- Resultados deportivos.
Siempre que interese estudiar la evolución de una cantidad a lo largo del tiempo, un gráfico de líneas suele ser una buena elección.
Gráficos de sectores
Los gráficos de sectores representan los datos mediante partes de un círculo.
Cada sector ocupa una parte proporcional a la frecuencia o al porcentaje que representa.
Por este motivo también reciben el nombre de gráficos circulares.
Observa el siguiente ejemplo:
En este gráfico:
- El sector azul representa el 60 % de los alumnos.
- El sector rojo representa el 30 % de los alumnos.
- El sector verde representa el 10 % de los alumnos.
Cuanto mayor es el porcentaje, mayor es el sector correspondiente.
Cómo construir un gráfico de sectores
Para construir un gráfico de sectores podemos seguir estos pasos:
- Organizar los datos en una tabla.
- Calcular los porcentajes.
- Dibujar un círculo.
- Dividir el círculo en sectores proporcionales a cada porcentaje.
- Añadir etiquetas y una leyenda.
Utilidad de los gráficos de sectores
Los gráficos de sectores permiten:
- Comparar porcentajes.
- Visualizar partes de un total.
- Identificar rápidamente las categorías más importantes.
- Presentar información de forma clara y atractiva.
Comparación con otros gráficos
Cada tipo de gráfico tiene ventajas diferentes.
| Tipo de gráfico | Utilidad principal |
|---|---|
| Barras | Comparar cantidades |
| Líneas | Estudiar cambios a lo largo del tiempo |
| Sectores | Comparar partes de un total |
Si queremos saber qué parte del total representa cada categoría, el gráfico de sectores suele ser la mejor opción.
Media aritmética
La media aritmética, también llamada promedio, es una medida que representa el valor central de un conjunto de datos.
Para calcularla:
- Sumamos todos los datos.
- Dividimos el resultado entre el número total de datos.
Ejemplo
Número de libros leídos por varios alumnos durante un mes:
| Alumno | Libros leídos |
|---|---|
| 1 | 2 |
| 2 | 3 |
| 3 | 4 |
| 4 | 5 |
| 5 | 5 |
| 6 | 6 |
| 7 | 7 |
Sumamos todos los datos:
$$ 2 + 3 + 4 + 5 + 5 + 6 + 7 = 32 $$
Contamos cuántos datos hay:
$$ 7 $$
Calculamos la media:
$$ \text{Media}=\frac{32}{7}\approx 4,57 $$
Podemos decir que cada alumno ha leído aproximadamente 4,57 libros.
Interpretación de la media
La media representa un valor que resume todos los datos del conjunto.
No siempre coincide con uno de los datos observados.
La media es útil cuando queremos obtener una idea general del conjunto de datos.
Moda
La moda es el dato que aparece con mayor frecuencia en un conjunto de datos.
Dicho de otra forma, la moda es el valor que más se repite.
Ejemplo
Número de libros leídos por varios alumnos durante un mes:
| Alumno | Libros leídos |
|---|---|
| 1 | 2 |
| 2 | 3 |
| 3 | 4 |
| 4 | 5 |
| 5 | 5 |
| 6 | 6 |
| 7 | 7 |
Observamos cuántas veces aparece cada dato:
| Libros leídos | Frecuencia |
|---|---|
| 2 | 1 |
| 3 | 1 |
| 4 | 1 |
| 5 | 2 |
| 6 | 1 |
| 7 | 1 |
El número 5 aparece dos veces, mientras que los demás valores aparecen una sola vez.
Por tanto:
$$ \text{Moda}=5 $$
Conjuntos sin moda
A veces ningún dato se repite.
Por ejemplo:
$$ 2,\;3,\;4,\;5,\;6 $$
Todos los valores aparecen una sola vez.
En este caso decimos que el conjunto no tiene moda.
Conjuntos con varias modas
También puede ocurrir que varios datos tengan la misma frecuencia máxima.
Ejemplo:
$$ 2,\;2,\;4,\;4,\;5,\;6 $$
Los números 2 y 4 aparecen dos veces.
Por tanto:
$$ \text{Moda}=2\text{ y }4 $$
Interpretación de la moda
La moda indica cuál es el valor más frecuente dentro de un conjunto de datos.
Por esta razón se utiliza mucho en encuestas y estudios estadísticos.
Si realizamos una encuesta sobre el deporte favorito de una clase, la moda será el deporte elegido por más alumnos.
Mediana
La mediana es el dato que ocupa la posición central cuando los datos se ordenan de menor a mayor.
La mediana divide el conjunto de datos en dos partes con el mismo número de elementos.
Cómo calcular la mediana
- Ordenamos los datos de menor a mayor.
- Buscamos el dato que ocupa la posición central.
Ejemplo con un número impar de datos
Número de libros leídos por varios alumnos:
$$ 2,\;3,\;4,\;5,\;5,\;6,\;7 $$
Los datos ya están ordenados.
Contamos las posiciones:
| Posición | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
|---|---|---|---|---|---|---|---|
| Dato | 2 | 3 | 4 | 5 | 5 | 6 | 7 |
El dato central ocupa la posición 4.
Por tanto:
$$ \text{Mediana}=5 $$
Ejemplo con un número par de datos
Consideremos ahora los siguientes datos:
$$ 2,\;3,\;4,\;5,\;6,\;7 $$
Hay 6 datos, por lo que no existe una única posición central.
Los dos valores centrales son:
$$ 4 \text{ y } 5 $$
Calculamos su media:
$$ \frac{4+5}{2}=4,5 $$
Por tanto:
$$ \text{Mediana}=4,5 $$
Importancia del orden
Para calcular la mediana es imprescindible ordenar los datos.
Por ejemplo:
$$ 7,\;2,\;5,\;3,\;6,\;4,\;5 $$
Primero debemos ordenarlos:
$$ 2,\;3,\;4,\;5,\;5,\;6,\;7 $$
Ahora sí podemos localizar correctamente la mediana.
Interpretación de la mediana
La mediana representa el valor central de un conjunto de datos.
La mitad de los datos queda por debajo de la mediana y la otra mitad queda por encima.
La mediana es especialmente útil cuando algunos datos son muy grandes o muy pequeños, ya que no se ve afectada tanto como la media por los valores extremos.
Rango
El rango es una medida que indica la diferencia entre el dato mayor y el dato menor de un conjunto de datos.
Nos permite saber si los datos están muy agrupados o muy dispersos.
Cómo calcular el rango
- Identificamos el dato mayor.
- Identificamos el dato menor.
- Restamos:
$$ \text{Rango} = \text{Dato mayor} - \text{Dato menor} $$
Ejemplo
Número de libros leídos por varios alumnos:
$$ 2,\;3,\;4,\;5,\;5,\;6,\;7 $$
El dato menor es:
$$ 2 $$
El dato mayor es:
$$ 7 $$
Calculamos la diferencia:
$$ 7-2=5 $$
Por tanto:
$$ \text{Rango}=5 $$
Otro ejemplo
Temperaturas máximas registradas durante una semana:
$$ 22,\;24,\;27,\;25,\;28,\;30,\;29 $$
El valor menor es:
$$ 22 $$
El valor mayor es:
$$ 30 $$
Calculamos:
$$ 30-22=8 $$
Por tanto:
$$ \text{Rango}=8 $$
Interpretación del rango
Un rango pequeño indica que los datos están bastante próximos entre sí.
Un rango grande indica que existen diferencias importantes entre los datos.
Observa estos dos conjuntos:
Conjunto A:
$$ 10,\;11,\;12,\;13,\;14 $$
Rango:
$$ 14-10=4 $$
Conjunto B:
$$ 2,\;8,\;14,\;20,\;26 $$
Rango:
$$ 26-2=24 $$
Aunque ambos conjuntos tienen cinco datos, el conjunto B presenta mucha más dispersión.
Resumen de las medidas estadísticas
| Medida | ¿Qué indica? |
|---|---|
| Media | Valor promedio |
| Moda | Valor que más se repite |
| Mediana | Valor central |
| Rango | Diferencia entre el mayor y el menor |
La media, la moda, la mediana y el rango proporcionan información diferente sobre un mismo conjunto de datos.
Por este motivo suelen utilizarse conjuntamente para comprender mejor la información recogida.
Interpretación crítica de datos
Los gráficos y las tablas nos ayudan a comprender la información de forma rápida.
Sin embargo, debemos analizarlos con atención antes de sacar conclusiones.
La estadística es una herramienta muy útil, pero una interpretación incorrecta puede llevarnos a conclusiones equivocadas.
Leer correctamente los datos
Antes de interpretar un gráfico debemos fijarnos en:
- Qué información representa.
- Qué significan los ejes.
- Qué unidades se utilizan.
- Cuántos datos se han recogido.
Por ejemplo, no es lo mismo hablar de 20 alumnos que de 2 000 alumnos.
Las muestras pequeñas pueden ser engañosas
A veces se obtienen conclusiones a partir de muy pocos datos.
Por ejemplo:
Supongamos que preguntamos a 5 alumnos cuál es su deporte favorito.
| Deporte | Alumnos |
|---|---|
| Fútbol | 3 |
| Baloncesto | 2 |
Podríamos concluir que el fútbol es el deporte favorito.
Pero si preguntáramos a todos los alumnos del colegio, quizá el resultado sería diferente.
Por eso es importante que la muestra sea suficientemente representativa.
Cuidado con los gráficos engañosos
Un gráfico puede parecer más impresionante de lo que realmente indican los datos.
Por ejemplo, observa estos resultados:
| Año | Ventas |
|---|---|
| 2024 | 100 |
| 2025 | 110 |
Las ventas han aumentado, pero solo en 10 unidades.
Si dibujamos un gráfico utilizando una escala poco adecuada, el aumento podría parecer mucho mayor de lo que realmente es.
Por esta razón siempre debemos observar las escalas de los ejes.
No confundir opinión con datos
Las conclusiones estadísticas deben basarse en los datos recogidos.
Por ejemplo:
Datos:
| Medio de transporte | Alumnos |
|---|---|
| A pie | 12 |
| Autobús | 8 |
| Coche | 5 |
Conclusión correcta:
- La mayoría de los alumnos va al colegio a pie.
Conclusión incorrecta:
- Ir andando es la mejor forma de ir al colegio.
La primera afirmación se basa en los datos. La segunda es una opinión.
Comparar varias fuentes de información
A veces diferentes estudios ofrecen resultados distintos.
Esto puede ocurrir porque:
- Han estudiado poblaciones diferentes.
- Han utilizado muestras diferentes.
- Han recogido los datos en momentos distintos.
Por ello es conveniente comparar varias fuentes antes de aceptar una conclusión.
La estadística en la vida cotidiana
La estadística aparece continuamente en:
- Noticias.
- Deportes.
- Encuestas.
- Estudios científicos.
- Economía.
- Meteorología.
Comprender cómo se obtienen y se interpretan los datos nos ayuda a tomar decisiones mejor fundamentadas.
Cuando veas una tabla o un gráfico, pregúntate siempre:
- ¿De dónde proceden los datos?
- ¿Cuántos datos se han recogido?
- ¿La muestra es representativa?
- ¿La conclusión se basa realmente en los datos?
Estas preguntas ayudan a interpretar la información de forma crítica y responsable.