|
ESTADÍSTICA
La estadística se ocupa de recopilar datos, organizarlos en tablas y gráficos y analizarlos con un determinado objetivo.
La estadística puede ser descriptiva o inferencial. La estadística descriptiva tabula, representa y describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones. La estadística inferencial infiere propiedades de gran número de datos recogidos de una muestra tomada de la población.
Nosotros sólo estudiaremos la estadística descriptiva. En ella debemos tener en cuenta las siguientes etapas:
c) Análisis y medición de datos
Para esta etapa tomaremos los siguientes conceptos básicos:
Por ejemplo: si se desea realizar un estudio estadístico de las estaturas de los alumnos de tercer año,
b)Organización de los datos
(1) Tabulación: puede ser a través de una serie simple, con la presentación de los datos recogidos en forma de tabla ordenada, o a través de la agrupación de datos, este método se utiliza cuando el número de observaciones es muy grande.
Ejemplo: En un curso de 40 alumnos, se desea estudiar el comportamiento de la variable estatura, registrándose los siguientes valores:
1,52 |
1,64 |
1,54 |
1,64 |
1,73 |
1,55 |
1,56 |
1,57 |
1,58 |
1,58 |
1,59 |
1,53 |
1,60 |
1,60 |
1,61 |
1,61 |
1,65 |
1,63 |
1,79 |
1,63 |
1,62 |
1,60 |
1,64 |
1,54 |
1,65 |
1,62 |
1,66 |
1,76 |
1,70 |
1,69 |
1,71 |
1,72 |
1,72 |
1,55 |
1,73 |
1,73 |
1,75 |
1,67 |
1,78 |
1,63 |
i. Serie simple:
Alumno |
Talla |
Alumno |
Talla |
Alumno |
Talla |
Alumno |
Talla |
|||
1 |
1,52 |
11 |
21 |
31 |
||||||
2 |
1,53 |
12 |
22 |
32 |
||||||
3 |
1,54 |
13 |
23 |
33 |
||||||
4 |
1,54 |
14 |
24 |
34 |
||||||
5 |
1,55 |
15 |
25 |
35 |
||||||
6 |
1,55 |
16 |
26 |
36 |
||||||
7 |
1,56 |
17 |
27 |
37 |
||||||
8 |
1,57 |
18 |
28 |
38 |
||||||
9 |
1,58 |
19 |
29 |
39 |
||||||
10 |
1,58 |
20 |
30 |
40 |
x (tallas) |
f (frecuencia) |
fr = f/n (frecuencia relativa) |
(100.fr) % (porcentaje) |
1,52 |
1 |
1/40 = 0,025 |
(100 . 0,025)% = 2,5 % |
1,53 |
1 |
1/40 = 0,025 |
2,5% |
1,54 |
2 |
2/40 = 0,05 |
5% |
1,55 |
|||
1,56 |
|||
1,57 |
|||
1,58 |
|||
1,59 |
|||
1,60 |
|||
1,61 |
|||
1,62 |
|||
1,63 |
|||
1,64 |
|||
1,65 |
|||
1,66 |
|||
1,67 |
|||
1,68 |
|||
1,69 |
|||
1,70 |
|||
1,71 |
|||
1,72 |
|||
1,73 |
|||
1,74 |
|||
1,75 |
|||
1,76 |
|||
1,77 |
|||
1,78 |
|||
1,79 |
...................................................................................................................................
...................................................................................................................................
...................................................................................................................................
Agrupación de datos por intervalos de clase: intervalos iguales en los que se divide el número total de observaciones. Es conveniente utilizar los intervalos de clase cuando se tiene un gran número de datos de una variable continua.
¿Cómo saber cuántos intervalos considerar? ¿Cómo determinar su amplitud?
Primero debemos determinar el rango de los datos, que es la diferencia entre el mayor y el menor de los valores obtenidos.
Rango = xmáx - xmín
....................................................................................................................................
Luego debemos establecer el número de intervalos (N) y determinar la amplitud (A) de los mismos.
A = rango / N
Tallas |
Frecuencia |
Frecuencia relativa |
Porcentaje |
[1,52 ; 1.55) |
|||
[1,55 ; 1,58) |
|||
[1,58 ; 1,61) |
|||
totales |
38 |
51 |
32 |
65 |
25 |
28 |
34 |
12 |
29 |
43 |
71 |
62 |
50 |
37 |
8 |
24 |
19 |
47 |
81 |
53 |
16 |
62 |
50 |
37 |
4 |
17 |
75 |
94 |
6 |
25 |
55 |
38 |
46 |
16 |
72 |
64 |
61 |
33 |
59 |
21 |
13 |
92 |
37 |
43 |
58 |
52 |
88 |
27 |
74 |
66 |
63 |
28 |
36 |
19 |
56 |
84 |
38 |
6 |
42 |
50 |
98 |
51 |
62 |
3 |
17 |
43 |
47 |
54 |
58 |
26 |
12 |
42 |
34 |
68 |
77 |
45 |
60 |
31 |
72 |
23 |
18 |
22 |
70 |
34 |
5 |
59 |
20 |
68 |
55 |
49 |
33 |
52 |
14 |
40 |
38 |
54 |
50 |
11 |
41 |
76 |
Presenta dichos datos en una tabla de intervalos de clase.
6 |
4 |
2 |
8 |
18 |
16 |
10 |
6 |
7 |
5 |
12 |
8 |
9 |
12 |
17 |
11 |
9 |
16 |
19 |
18 |
18 |
16 |
14 |
12 |
7 |
10 |
3 |
11 |
7 |
12 |
5 |
9 |
11 |
15 |
9 |
4 |
1 |
6 |
11 |
7 |
8 |
10 |
15 |
3 |
2 |
13 |
9 |
11 |
17 |
13 |
12 |
8 |
Confecciona una tabla de distribución de frecuencia y otra de intervalos de clase.
(3)Graficación: la recopilación de datos y la tabulación pueden traducirse gráficamente mediante representaciones convenientemente elegidas: barras, sectores circulares, mapas curvas, etc.
Los gráficos permiten visualizar e interpretar el fenómeno que se estudia, en forma más clara.
Las barras se utilizan generalmente para representar atributos cualitativos o cuantitativos discreto. La longitud es igual a la frecuencia de cada observación. Pueden ser barras simples o múltiples, según se trate de representar uno o más atributos.
Las barras pueden ser horizontales o verticales.
Gráf de barras compuesto: Remuneraciones medias (año Z)
Los gráficos circulares o gráficos de torta son útiles para comparar datos pues, en general, trabajan con porcentuales. El área de cada sector representa el porcentaje que corresponde a la frecuencia de un cierto valor de la variable. Esta representación es conveniente cuando el número de sectores es pequeño y sus áreas están bien diferenciadas.Evaluación del gobierno X
El histograma se utiliza para representar una tabla de frecuencias de intervalos de clase.
Sobre el eje horizontal se representan los intervalos de clase y sobre el eje vertica, las frecuencias de los intervalos.
El gráfico consiste en un conjunto de rectángulos adyacentes cuya base representa un intervalo de clase y cuya altura representa la frecuencia del intervalo.
El polígono de frecuencias se construye uniendo los puntos medios de los lados opuestos de las bases de cada rectángulo. Si se quiere cerrar el rectángulo, se agregan dos intervalos: uno anterior y otro posterior al último y se prolonga el polígono hasta los puntos medios de estos intervalos.
Las curvas se utilizan generalmente para representar la variación de una variable a través del tiempo (años, meses, horas, etc.). Sobre el eje horizontal figuran los períodos de tiempo.
Variación del valor de las importaciones y exportaciones de la Argentina en millones de dólares
Estas son sólo algunas de las formas posibles de graficación y las que encontrarñás con más frecuencia.
c) Análisis y medición de datos
Para describir un conjunto de datos, se calculan algunas medidas que resumen la información y que permiten realizar comparaciones.
Medidas de posición: se utilizan para encontrar un valor que represente a todos los datos. Las más importantes son: la media aritmética, la moda y la mediana.
Diego |
61,7 |
61,7 |
62,3 |
62,9 |
63,1 |
Tomás |
61,5 |
62,9 |
62,9 |
63,7 |
63,7 |
Sergio |
60,7 |
62,4 |
62,7 |
62,7 |
63,2 |
Para poder decidir, calcula las medidas de posición de cada uno.
promedio |
moda |
mediana |
|
Diego |
62,34 |
61,7 |
62,3 |
Tomás |
|||
Sergio |
En promedio, los nadadores más rápidos son ................................ y ................................., pero esto no significa que hayan tenido el mismo rendimiento; por eso necesitamos las otras medidas de posición: de ellos dos, tanto la moda como la mediana indican que ................................ fue más veloz. Sin embargo, para elegir el nadador adecuado, no basta con considerar las medidas de posición, ya que también es necesario que su rendimiento sea parejo, es decir, que los tiempos de sus 100 m libres no tengan mucha dispersión.
Medidas de dispersión: nos informan cómo están distribuidos los datos. La más importante es el desvío estándar (s ), que mide la dispersión de los datos conrespecto al promedio. Cuanto menor es el desvío estándar, menos dispersos están los datos con respecto al promedio.
Para calcular el desvío estándar, seguimos los siguientes pasos:
Calcula los desvíos estándares de los tiempos de los nadadores:
Tiempos de Diego
xi |
(xi - x) |
(xi - x)2 |
61,7 |
-0,64 |
|
61,7 |
-0,64 |
|
62,3 |
-0,04 |
|
62,9 |
0,56 |
|
63,1 |
0,76 |
|
total |
Entonces:
Tiempos de Sergio
xi |
(xi - x) |
(xi - x)2 |
total |
Podemos ver que el desvío estándar de ................................... es menor que el de ................................., lo cual indica que el promedio representa mejor los datos de ................................., porque sus tiempos fueron menos dispersos.
Entonces, aunque cinco datos son muy pocos para hacer estadística, si con esa información hay que elegir un nadador de ese equipo para la próxima competencia, conviene que sea .......................................
Aún no hay comentarios para este recurso.
Monografias, Exámenes, Universidades, Terciarios, Carreras, Cursos, Donde Estudiar, Que Estudiar y más: Desde 1999 brindamos a los estudiantes y docentes un lugar para publicar contenido educativo y nutrirse del conocimiento.
Contacto »