Teórico 12_05

ORGANIZACIÓN Y REPRESENTACIÓN
GRÁFICA DE LOS DATOS
Licenciatura en Gestión Ambiental 2015
Organización de los datos

Una vez que se ha
realizado
la
recolección de los
datos, se obtienen
datos en bruto, los
cuales rara vez son
significativos sin una
organización
y
tabulación.
Organización de los datos
Organización de los datos
Planillas u hojas de cálculo
Calc (Open
(Open--Office)
Organización de los datos
 Las hojas de cálculo son el principal medio para ingresar y
almacenar información con miras a realizar cualquier
análisis de datos.
 El funcionamiento de Excel y Calc es idéntico:
• Tienen estructura de una matriz de filas y columnas.
• Existe una larga lista de funciones y gráficos predefinidos.
• Ambos tienen la posibilidad de automatizar acciones
recurrentes a través de programación.
• El resultado del trabajo se puede salvar en numerosos
formatos de salida, algunos de los cuales pueden ser input
de programas de estadística.
Organización de los datos
•
En las hojas de cálculo y en los programas estadísticos, cada
columna es una variable y cada fila es un individuo u objeto.
Los datos se ingresan a
través del teclado o
importando el archivo de
datos (en general *.txt o
*.dat)
La matriz de datos debe
estar completamente llena
Organización de los datos

Formas de organizar los datos:


Un arreglo: es la forma más sencilla de organizar los datos en
bruto. Consiste en colocar las observaciones en orden según su
magnitud: ascendente o descendente.
Poco práctica cuando se tiene una gran cantidad de datos.
Organización de los datos


Al ordenar datos muy numerosos, es usual agruparlos en
clases o categorías. Al determinar cuántos pertenecen a
cada clase, establecemos la frecuencia. Construimos así
una tabla de datos llamada tabla de frecuencias
frecuencias.
Para qué se construye una tabla de frecuencias:
Ordenar
 Agrupar
 Resumir información

Organización de los datos
Ejemplo: forma de las vasijas reconstruidas
Forma
Cantidad
Cuenco
4
Escudilla
10
Olla
5
Plato
6
Organización de los datos
TIPOS DE FRECUENCIAS
a) Frecuencia o Frecuencia Absoluta: Es el número de veces que
se presenta un valor o categoría de una variable. Se
representa por fi.
b) Frecuencia Relativa: La frecuencia relativa se puede
expresar en términos de porcentaje o de proporción y se
representa por fr. (Es la razón entre la frecuencia absoluta y
el total de datos)
Organización de los datos
Forma
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia Relativa
Porcentual (%)
Cuenco
4
0,16
16
Escudilla
10
0,4
40
Olla
5
0,2
20
Plato
6
0,24
24
TOTAL
25
1
100
Organización de los datos
Datos agrupados
agrupados::
Cuando se trabaja con gran cantidad de datos suele ser
útil agruparlos y trabajar con tablas y distribuciones de
frecuencias con clases.
Una distribución de frecuencias es un arreglo de los datos
que permite expresar la frecuencia de ocurrencias de las
observaciones en cada una de las clases, mostrando el
patrón de la distribución de manera más significativa
Clase
Pto.
Medio
fi
Fi
fri
FRi
Organización de los datos
Definiciones::
Definiciones
•Rango: Diferencia entre el máximo y el mínimo valor de una
variable.
•Marca de clase: Representante de un intervalo, y corresponde
al promedio entre los extremos de éste.
•Tamaño de un intervalo: Es el cociente entre el valor del rango
y la cantidad de intervalos que se desea obtener. Se
recomienda tomar como longitud de los intervalos un valor
entero que sea mayor o igual al cociente obtenido.
Organización de los datos
La Distribución de Frecuencias:





Se recomienda su uso cuando se tienen grandes cantidades
de datos (n).
Su construcción requiere, en primer lugar, la selección de
los límites de los intervalos de clase.
La cantidad de clases no puede ser tan pequeña o tan
grande, que la verdadera naturaleza de la distribución
sea imposible de visualizar.
La amplitud de todas las clases suele ser la misma.
Los límites de las clases deben tener una cifra significativa
más que los datos en bruto.
Organización de los datos
Número de intervalos
intervalos:
Criterio de Sturges: k= 1+3.322(log10n)
Ancho de los intervalos
intervalos::
R
h
k
Estos criterios son guías (y no reglas fijas) para decidir k y h.
Es recomendable probar varios de ellos para asegurarse que la
forma del histograma resultante no cambia mucho según el
criterio escogido para escoger k y h.
Organización de los datos
Ejemplo:: espesor de la base de las vasijas
Ejemplo
1,7
0,93
0,9
0,71
1,52
1,35
0,89
0,91
0,73
1,42
1,12
0,89
0,92
0,63
1,43
1,62
0,63
0,88
0,72
1,22
1,51
0,83
0,93
0,74
1,42
N = 25
R = 1,7-0,36 = 1,7
k = 1+3.322 (log25)
= 1+3.322 (1.3979)
= 5,65 ≈ 6
h = 1,7/6 = 0,18 ≈ 2
Organización de los datos
Tabla de distribuci
distribució
ón de frecuencias resultante
resultante::
Frecuencia
Intervalos
Frecuencia Frecuencia
Frecuencia
Relativa
de Clase
Acumulada Relativa
Acumulada
0,6-0,8
0,8-1
1-1,2
1,2-1,4
1,4-1,6
1,6-1,8
6
9
1
2
5
2
6
15
16
18
23
25
0,24
0,36
0,04
0,08
0,2
0,08
0,24
0,6
0,64
0,72
0,92
1
Representación gráfica de los datos
Para hacer más clara y evidente la información que nos dan las
tablas se utilizan los gráficos
gráficos.
Entre las funciones que cumplen los diagramas o gráficos se pueden señalar
las siguientes:

Hacen más visibles los datos, sistemas y procesos

Ponen de manifiesto sus variaciones y su evolución histórica o espacial.




Pueden evidenciar las relaciones entre los diversos elementos de un
sistema o de un proceso y representar la correlación entre dos o más
variables.
Sistematizan y sintetizan los datos, sistemas y procesos.
Aclaran y complementan las tablas y las exposiciones teóricas o
cuantitativas.
El estudio de su disposición y de las relaciones que muestran pueden
sugerir hipótesis nuevas.
Representación gráfica de los datos
Existen múltiples tipos de gráficos, pero aquí se mostrarán
los usados más frecuentemente.: gráfico de barras, gráfico
de sectores o circular, histograma, polígono de frecuencias,
ojiva (polígono de frecuencias relativas).

Para datos cualitativos y cuantitativos discretos se
usan principalmente:
 Barras
 Sectores
 Líneas
o Curvas
Representación gráfica de los datos
12
Frecuencia absoluta (n)
Diagrama de barras
barras::
Se usa fundamentalmente para
representar distribuciones de
frecuencias de una variable
cualitativa o cuantitativa discreta
y,
ocasionalmente,
en
la
representación
de
series
cronológicas o históricas. Uno de
los ejes sirve para inscribir las
frecuencias, ya sean absolutas o
relativas (%), y el otro para la
escala de clasificación utilizada.
10
8
6
4
2
0
Cuenco Escudilla Olla
Plato
Formas de vasijas
Representación gráfica de los datos
Diagrama de barras
barras::
Representación gráfica de los datos
Gráfico de sectores, circular o de torta
torta:: Se usa, fundamentalmente, para
representar distribuciones de frecuencias relativas (%) de una variable
cualitativa o cuantitativa discreta. En este gráfico se hace corresponder
la medida del ángulo de cada sector con la frecuencia correspondiente
a la clase en cuestión.
Plato
24%
Olla
20%
Cuenco
16%
Escudilla
40%
Representación gráfica de los datos
Gráficos líneas o curvas
curvas::
está formado por líneas rectas o curvas, que resultan de la
representación, en un eje de coordenadas, de distribuciones de
frecuencias. Se construye colocando en el eje x los valores
correspondientes a la variable y en el eje de las ordenadas (y) el valor
correspondiente a la frecuencia para este valor.
Representación gráfica de los datos

Para datos cuantitativos agrupados en clases, comúnmente
se utilizan tres gráficos:



Histogramas.
Polígono de frecuencias.
Polígono de frecuencias acumuladas.
Representación gráfica de los datos
Histograma
Histograma:
Está formado por rectángulos, cuyas bases corresponden con los
intervalos de clase y sus Áreas son iguales o proporcionales a sus
frecuencias. Este gráfico se usa para representar una distribución de
frecuencias de una variable cuantitativa continua. Habitualmente se
representa la frecuencia observada en el eje Y, y en el eje X la variable
Clase
0,6-0,8
0,8-1
1-1,2
1,2-1,4
1,4-1,6
1,6-1,8
Frecuencia
6
9
1
2
5
2
Representación gráfica de los datos
Para comparar gráficamente muestras de distinto tamaño, es necesario
utilizar histogramas de frecuencias relativas (proporción de valores en
cada intervalo de clase).
n1=60
n2= 266
150
100
50
0
Frecuencia Rel.
Frecuencia Abs.
200
0.700
0.600
0.500
0.400
0.300
0.200
0.100
0.000
0.070 0.838 1.607 2.375 3.143 3.912 4.680 5.448
0.070 0.838 1.607 2.375 3.143 3.912 4.680 5.448
Diámetro
Diámetro
Dos distribuciones que parecían diferentes en escala absoluta (tamaños
de muestra muy diferentes), son en realidad muy similares en sus
frecuencias relativas.
Representación gráfica de los datos
Polígono de Frecuencias
Frecuencias::
Es una línea poligonal que une los
vértices superiores de las barras de un
diagrama de barras, o los puntos medios
de las bases superiores de los
rectángulos de un histograma. Se utiliza,
al igual que el histograma, para
representar distribuciones de frecuencias
de variables cuantitativas continuas, pero
como no se utilizan barras en su
confección sino segmentos de recta, de
ahí
el
nombre
de
polígono.
Habitualmente se usa cuando se quiere
mostrar en el mismo gráfico más de una
distribución.
Representación gráfica de los datos
Ojiva o Polígono de Frecuencias
Acumuladas::
Acumuladas
En este tipo de gráfico, al igual que
en el histograma y el polígono de
frecuencias,
el
objetivo
es
representar
distribuciones
de
frecuencias
de
variables
cuantitativas continuas, pero sólo
para frecuencias acumuladas.
Se representan los valores de los
datos en dos ejes cartesianos
ortogonales entre sí. Se pueden
usar para representar más de una
serie de datos.
Representación gráfica de los datos
Gráficos Combinados
Combinados::
Clase
10-19
20-29
30-39
40-49
50-59
60-69
70-79
y mayor...
Frecuencia
5
19
10
13
4
4
2
0
% acumulado
8,77%
42,11%
59,65%
82,46%
89,47%
96,49%
100,00%
100,00%
Representación gráfica de los datos

Los datos cuantitativos continuos sin agrupar también se
pueden graficar mediante gráficos de barras, líneas, etc.
También podemos expresar gráficamente la relación entre
distintas variables mediante gráficos de dispersión.
3000
2500
Volumen (cm3)
Espesor de borde (cm)
1,5
1
0,5
0,5
1
1,5
Espesor de base (cm)
2
2000
1500
1000
500
0
0,5
1
1,5
Espesor de base (cm)
2
Referencias:






Daniel, W.W. 1993. Bioestadística. Base para el análisis de las ciencias de la salud. Ed.
Limusa, México.
Guzmán, E. 2011. Conceptos Básicos y Estadística Descriptiva. Universidad de Los
Andes, Venezuela. http://webdelprofesor.ula.ve/ingenieria/eliana/estad.
Inchausti, P. 2011. Técnicas de Análisis Cuantitativo. Material del curso dictado en
CURE-Maldonado.
Marangunich, L. 2004. Estadística descriptiva. Red de Helmintología de FAO para
América Latina y el Caribe. http://cnia.inta.gov.ar/helminto
Orellana, L. 2001. Estadística Descriptiva. Apuntes del Curso de Estadística. UBA.
http://cms.dm.uba.ar/academico/materias/2docuat2011/ estadisticaQ/
Universidad de Chile. 2008. Nociones Básicas de Estadística Utilizadas en Educación.
Departamento de Evaluación, Medición y Registro Educacional.