ORGANIZACIÓN Y REPRESENTACIÓN GRÁFICA DE LOS DATOS Licenciatura en Gestión Ambiental 2015 Organización de los datos Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación. Organización de los datos Organización de los datos Planillas u hojas de cálculo Calc (Open (Open--Office) Organización de los datos Las hojas de cálculo son el principal medio para ingresar y almacenar información con miras a realizar cualquier análisis de datos. El funcionamiento de Excel y Calc es idéntico: • Tienen estructura de una matriz de filas y columnas. • Existe una larga lista de funciones y gráficos predefinidos. • Ambos tienen la posibilidad de automatizar acciones recurrentes a través de programación. • El resultado del trabajo se puede salvar en numerosos formatos de salida, algunos de los cuales pueden ser input de programas de estadística. Organización de los datos • En las hojas de cálculo y en los programas estadísticos, cada columna es una variable y cada fila es un individuo u objeto. Los datos se ingresan a través del teclado o importando el archivo de datos (en general *.txt o *.dat) La matriz de datos debe estar completamente llena Organización de los datos Formas de organizar los datos: Un arreglo: es la forma más sencilla de organizar los datos en bruto. Consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente. Poco práctica cuando se tiene una gran cantidad de datos. Organización de los datos Al ordenar datos muy numerosos, es usual agruparlos en clases o categorías. Al determinar cuántos pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de datos llamada tabla de frecuencias frecuencias. Para qué se construye una tabla de frecuencias: Ordenar Agrupar Resumir información Organización de los datos Ejemplo: forma de las vasijas reconstruidas Forma Cantidad Cuenco 4 Escudilla 10 Olla 5 Plato 6 Organización de los datos TIPOS DE FRECUENCIAS a) Frecuencia o Frecuencia Absoluta: Es el número de veces que se presenta un valor o categoría de una variable. Se representa por fi. b) Frecuencia Relativa: La frecuencia relativa se puede expresar en términos de porcentaje o de proporción y se representa por fr. (Es la razón entre la frecuencia absoluta y el total de datos) Organización de los datos Forma Frecuencia Absoluta Frecuencia Relativa Frecuencia Relativa Porcentual (%) Cuenco 4 0,16 16 Escudilla 10 0,4 40 Olla 5 0,2 20 Plato 6 0,24 24 TOTAL 25 1 100 Organización de los datos Datos agrupados agrupados:: Cuando se trabaja con gran cantidad de datos suele ser útil agruparlos y trabajar con tablas y distribuciones de frecuencias con clases. Una distribución de frecuencias es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa Clase Pto. Medio fi Fi fri FRi Organización de los datos Definiciones:: Definiciones •Rango: Diferencia entre el máximo y el mínimo valor de una variable. •Marca de clase: Representante de un intervalo, y corresponde al promedio entre los extremos de éste. •Tamaño de un intervalo: Es el cociente entre el valor del rango y la cantidad de intervalos que se desea obtener. Se recomienda tomar como longitud de los intervalos un valor entero que sea mayor o igual al cociente obtenido. Organización de los datos La Distribución de Frecuencias: Se recomienda su uso cuando se tienen grandes cantidades de datos (n). Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase. La cantidad de clases no puede ser tan pequeña o tan grande, que la verdadera naturaleza de la distribución sea imposible de visualizar. La amplitud de todas las clases suele ser la misma. Los límites de las clases deben tener una cifra significativa más que los datos en bruto. Organización de los datos Número de intervalos intervalos: Criterio de Sturges: k= 1+3.322(log10n) Ancho de los intervalos intervalos:: R h k Estos criterios son guías (y no reglas fijas) para decidir k y h. Es recomendable probar varios de ellos para asegurarse que la forma del histograma resultante no cambia mucho según el criterio escogido para escoger k y h. Organización de los datos Ejemplo:: espesor de la base de las vasijas Ejemplo 1,7 0,93 0,9 0,71 1,52 1,35 0,89 0,91 0,73 1,42 1,12 0,89 0,92 0,63 1,43 1,62 0,63 0,88 0,72 1,22 1,51 0,83 0,93 0,74 1,42 N = 25 R = 1,7-0,36 = 1,7 k = 1+3.322 (log25) = 1+3.322 (1.3979) = 5,65 ≈ 6 h = 1,7/6 = 0,18 ≈ 2 Organización de los datos Tabla de distribuci distribució ón de frecuencias resultante resultante:: Frecuencia Intervalos Frecuencia Frecuencia Frecuencia Relativa de Clase Acumulada Relativa Acumulada 0,6-0,8 0,8-1 1-1,2 1,2-1,4 1,4-1,6 1,6-1,8 6 9 1 2 5 2 6 15 16 18 23 25 0,24 0,36 0,04 0,08 0,2 0,08 0,24 0,6 0,64 0,72 0,92 1 Representación gráfica de los datos Para hacer más clara y evidente la información que nos dan las tablas se utilizan los gráficos gráficos. Entre las funciones que cumplen los diagramas o gráficos se pueden señalar las siguientes: Hacen más visibles los datos, sistemas y procesos Ponen de manifiesto sus variaciones y su evolución histórica o espacial. Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y representar la correlación entre dos o más variables. Sistematizan y sintetizan los datos, sistemas y procesos. Aclaran y complementan las tablas y las exposiciones teóricas o cuantitativas. El estudio de su disposición y de las relaciones que muestran pueden sugerir hipótesis nuevas. Representación gráfica de los datos Existen múltiples tipos de gráficos, pero aquí se mostrarán los usados más frecuentemente.: gráfico de barras, gráfico de sectores o circular, histograma, polígono de frecuencias, ojiva (polígono de frecuencias relativas). Para datos cualitativos y cuantitativos discretos se usan principalmente: Barras Sectores Líneas o Curvas Representación gráfica de los datos 12 Frecuencia absoluta (n) Diagrama de barras barras:: Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de series cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o relativas (%), y el otro para la escala de clasificación utilizada. 10 8 6 4 2 0 Cuenco Escudilla Olla Plato Formas de vasijas Representación gráfica de los datos Diagrama de barras barras:: Representación gráfica de los datos Gráfico de sectores, circular o de torta torta:: Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a la clase en cuestión. Plato 24% Olla 20% Cuenco 16% Escudilla 40% Representación gráfica de los datos Gráficos líneas o curvas curvas:: está formado por líneas rectas o curvas, que resultan de la representación, en un eje de coordenadas, de distribuciones de frecuencias. Se construye colocando en el eje x los valores correspondientes a la variable y en el eje de las ordenadas (y) el valor correspondiente a la frecuencia para este valor. Representación gráfica de los datos Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos: Histogramas. Polígono de frecuencias. Polígono de frecuencias acumuladas. Representación gráfica de los datos Histograma Histograma: Está formado por rectángulos, cuyas bases corresponden con los intervalos de clase y sus Áreas son iguales o proporcionales a sus frecuencias. Este gráfico se usa para representar una distribución de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable Clase 0,6-0,8 0,8-1 1-1,2 1,2-1,4 1,4-1,6 1,6-1,8 Frecuencia 6 9 1 2 5 2 Representación gráfica de los datos Para comparar gráficamente muestras de distinto tamaño, es necesario utilizar histogramas de frecuencias relativas (proporción de valores en cada intervalo de clase). n1=60 n2= 266 150 100 50 0 Frecuencia Rel. Frecuencia Abs. 200 0.700 0.600 0.500 0.400 0.300 0.200 0.100 0.000 0.070 0.838 1.607 2.375 3.143 3.912 4.680 5.448 0.070 0.838 1.607 2.375 3.143 3.912 4.680 5.448 Diámetro Diámetro Dos distribuciones que parecían diferentes en escala absoluta (tamaños de muestra muy diferentes), son en realidad muy similares en sus frecuencias relativas. Representación gráfica de los datos Polígono de Frecuencias Frecuencias:: Es una línea poligonal que une los vértices superiores de las barras de un diagrama de barras, o los puntos medios de las bases superiores de los rectángulos de un histograma. Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere mostrar en el mismo gráfico más de una distribución. Representación gráfica de los datos Ojiva o Polígono de Frecuencias Acumuladas:: Acumuladas En este tipo de gráfico, al igual que en el histograma y el polígono de frecuencias, el objetivo es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas. Se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Se pueden usar para representar más de una serie de datos. Representación gráfica de los datos Gráficos Combinados Combinados:: Clase 10-19 20-29 30-39 40-49 50-59 60-69 70-79 y mayor... Frecuencia 5 19 10 13 4 4 2 0 % acumulado 8,77% 42,11% 59,65% 82,46% 89,47% 96,49% 100,00% 100,00% Representación gráfica de los datos Los datos cuantitativos continuos sin agrupar también se pueden graficar mediante gráficos de barras, líneas, etc. También podemos expresar gráficamente la relación entre distintas variables mediante gráficos de dispersión. 3000 2500 Volumen (cm3) Espesor de borde (cm) 1,5 1 0,5 0,5 1 1,5 Espesor de base (cm) 2 2000 1500 1000 500 0 0,5 1 1,5 Espesor de base (cm) 2 Referencias: Daniel, W.W. 1993. Bioestadística. Base para el análisis de las ciencias de la salud. Ed. Limusa, México. Guzmán, E. 2011. Conceptos Básicos y Estadística Descriptiva. Universidad de Los Andes, Venezuela. http://webdelprofesor.ula.ve/ingenieria/eliana/estad. Inchausti, P. 2011. Técnicas de Análisis Cuantitativo. Material del curso dictado en CURE-Maldonado. Marangunich, L. 2004. Estadística descriptiva. Red de Helmintología de FAO para América Latina y el Caribe. http://cnia.inta.gov.ar/helminto Orellana, L. 2001. Estadística Descriptiva. Apuntes del Curso de Estadística. UBA. http://cms.dm.uba.ar/academico/materias/2docuat2011/ estadisticaQ/ Universidad de Chile. 2008. Nociones Básicas de Estadística Utilizadas en Educación. Departamento de Evaluación, Medición y Registro Educacional.
© Copyright 2024