miércoles, 25 de mayo de 2011

Cómo usar la hoja de cálculo para analizar datos y obtener estadísticas

Aunque existe software especializado en estadística como spss, statgraphics o minitab, no todos los usuarios necesitan la potencia de estos paquetes. las hojas de cálculo actuales cuentan con un elevado número de funciones y otras herramientas de análisis que le ayudarán a afrontar algunos cálculos estadísticos sencillos como, por ejemplo, contrastar hipótesis o predecir resultados. siguiendo la filosofía de esta sección, no pretendemos otra cosa que ofrecer al lector soluciones tipo how-to, quedando fuera de nuestro alcance la definición de los términos estadísticos que aquí utilizamos.

Cómo calcular estadísticas descriptivas básicas
Suponga que disponemos del número de visitas diarias en el mes de diciembre a la página web de PC World y a la de iWorld. Nuestro objetivo es compararlas y sacar algunas conclusiones, pero para ello es insuficiente realizar una media de visitas de ambas páginas. Piense que el promedio es muy sensible a los valores extremos y podríamos llegar a conclusiones erróneas. Lo más aconsejable es realizar una estadística descriptiva básica que nos informe, mediante resúmenes numéricos, de cómo se distribuyen estos datos respecto al centro y de su dispersión.
Dichos resúmenes pueden ser los que se ven en la tabla adjunta, en la que se supone que los datos sobre la página de PC World están en las celdas A3:A33 y las de iWorld en B3:B33.
En el resumen numérico podemos ver, por ejemplo, que la dispersión de datos es un poco mayor en las visitas de iWorld (tiene una desviación típica mayor) y que en el 75% de los días se concentran más visitas en PC World (2.787) que en iWorld (2.490).
Si utiliza Excel, es importante que active Herramientas para análisis en el menú Herramientas » Complementos para disponer de acceso a un paquete de funciones más completo y tener habilitado el menú Análisis de datos.
Además de las funciones vistas, Excel y Quattro Pro generan automáticamente un resumen descriptivo más completo seleccionando en el menú Herramientas » Análisis de datos » Estadística descriptiva y Herramientas Numéricas » Herramientas de análisis » Estadística descriptiva, respectivamente. En la figura adjunta puede ver el análisis de datos realizado por Excel (el de Quattro Pro es muy similar). Tenga en cuenta que Excel utiliza en el análisis de datos la cuasivarianza y la cuasidesviación típica, pero para el cálculo de la varianza y la desviación típica se deben utilizar las funciones VARP y DESVESTP.

Cómo dibujar un diagrama de cajas o boxplot en Excel
Una de las funciones comentadas anteriormente es Cuartil, que permite obtener los cinco números resumen de una distribución: mínimo, cuartil primero, la mediana (o cuartil segundo), cuartil tercero y el máximo. Recuerde que el mínimo se puede calcular como =cuartil(datos;0) y el máximo como =cuartil(datos;4).
Para representar gráficamente estos cinco números se utiliza el diagrama de cajas o boxplot. OpenOffice y Star­Office disponen de un tipo de gráfico similar denominado Diagrama de curso y la hoja de cálculo Quattro Pro cuenta con el de Máximos y mínimos. Desafortunadamente, no ocurre lo mismo con Excel.
En este truco aprenderá a crear un diagrama de cajas en Excel a partir de uno de líneas y para ello utilizaremos los datos del ejemplo presentado en el truco anterior. Tenga en cuenta que, para hacer el gráfico, es imprescindible que los cálculos estén situados en este orden: Cuartil primero, Mínimo, Cuartil segundo, Máximo y Cuartil tercero. Es decir, igual que aparece en la tabla adjunta.
Seleccione los datos a representar incluyendo los nombres de las funciones y los títulos de las columnas y elija en el menú Insertar » Gráfico. En el asistente actúe como con cualquier otro gráfico pero eligiendo el tipo Líneas y el cuarto subtipo (por defecto) e indicando que las series son en Filas (segundo paso del asistente).
Una vez generado el gráfico de líneas hágale estas modificaciones para transformarlo en un diagrama de cajas:
1. Con el objetivo de eliminar las líneas que unen los puntos de la misma serie, realice un doble clic en una línea (por ejemplo la del cuartil primero) y, en la solapa Tramas, seleccione la opción Ninguna del grupo Línea.
2. Repita la operación anterior con las series restantes hasta eliminar las cinco líneas.
3. Haga nuevamente doble clic en un punto cualquiera de las series para acceder al cuadro de diálogo Formato de la serie de datos, seleccione la solapa Opciones y marque las casillas Líneas de máximos y mínimos y Barras ascendentes o descendentes.

Cómo generar histogramas
Disponemos del tiempo de conexión en minutos de una muestra de cincuenta y cinco usuarios que navegaron por la página web de PC World y nos interesa conocer la distribución de las frecuencias. Por ejemplo, para averiguar qué porcentaje de la muestra estuvo conectado a la página treinta minutos como máximo.
Para ello generaremos automáticamente un histograma de frecuencias absolutas y frecuencias absolutas acumuladas junto con un gráfico que represente ambas. Previamente teclearemos en celdas contiguas los intervalos que queremos considerar. Por ejemplo si son de diez minutos y hasta 60 escribiremos: 10, 20, 30, 40, 50, 60, de tal manera que el histograma nos indicará cuántos usuarios se conectaron de 0 a 9 minutos, cuántos de 10 a 19, etc.





UTILIDAD DE LA HOJA DE CALCULO

IMPORTANCIA DE UNA HOJA DE CALCULO

En la actualidad los sistemas educativos de todo el mundo se enfrentan al desafío de utilizar las tecnologías de la información y la comunicación para proveer a sus alumnos con las herramientas y conocimientos necesarios que se requieren entre ellos destacan los procesadores de textos y las hojas de cálculo a los cuales les daré un breve comentario según el punto de vista de diferentes autores
La Microsoft dueña de estos dos programas de su actual propietario Bill gates y Paúl Allen proponen que un procesador de textos es una herramienta de suma importancia hoy en día ya que es utilizada para la elaboración de todo tipo de documentos  ya que nos  permite insertar en un documento textos, imágenes, gráficos, formulas; así como también cambiarle el formato al texto, modificar las imágenes, etc.

Adentrándose en la utilización de Excel, el lector podrá reconocer las distintas partes que conforman un ordenador y las aplicaciones del software. Asimismo comprenderá cómo utilizar las opciones con el fin de rellenar los rangos de celda de forma sencilla.
Sostienen que las hojas de cálculo es un programa que nos permite manipular datos numéricos y alfanuméricos, y nos ayuda a realizar cálculos complejos en base de funciones y formulas y dibujar distintos tipos de gráficos   

MANEJO DE DATOS DE LA HOJA DE CALCULO

El manejo de datos es una de las principales utilidades de una hoja de cálculo en el estudio estadístico. En general los programas de estadística no suelen tener un sistema de entrada de datos tan versatil como el que proporciona una hoja de cálculo como Open Calc. En el caso de R y R-Commander esta situación es actualmente bastante aguda, la entrada de datos es muy poco eficaz.

Introducción de datos

De forma predeterminada los datos pueden ser introducidos en columnas de modo que al terminar de escribir cada dato se pulsa alguna de las teclas Enter, Return o Intro disponibles en el teclado. El ratón y las flechas del teclado permiten desplazarse rápidamente a través de todo el teclado para intoducir los datos en el orden en que se desee. Finalmente una de las más importantes ventajas es la posibilidad de introducir resultados con la mayor rapidez. Hagamos un ejercicio de este último uso.
Descarguemos el conjunto de datos Iris que se encuentra en R y en los conjuntos de datos para demostraciones de otros muchos paquetes estadísticos. Estos datos fueron recogidos por Edgar Anderson en 1935 y analizados por Fisher en 1936 corresponden a las medidas en centımetros de la longitud y ancho del sepalo y de la longitud y ancho del petalo para 50 flores de cada una de tres especies de lirios.
La pantalla tendrá un aspecto parecido al siguiente:
VER MAS

TABLA DINAMICA DE EXCEL

VER MAS
Las tablas dinámicas proporcionan un modo de resumir y analizar fácilmente grandes volúmenes de datos. Se llaman tablas dinámicas porque se puede cambiar su disposición reordenando o cambiando de posición los encabezados de fila y columna, rápida y fácilmente.Las tablas dinámicas se utilizan para resumir, consolidar, analizar, filtrar e informar:
  • Resumir de datos grandes: se pueden utilizar las tablas dinámicas para resumir grandes cantidades de datos que pueden estar en una hoja de o en una de datos externa.
  • Preparar datos para su representación gráfica: Los gráficos basados en tablas dinámicas cambiarán automáticamente cuando cambie la tabla dinámica. Muchos problemas vienen disponiendo los datos de un modo que permita crear gráficos, las tablas dinámicas son ideales para este propósito.
  • Análisis de datos adecuado: Se analizarán de forma adecuada las bases de datos mediante las tablas dinámicas, buscando , excepciones y problemas. Se puede organizar rápidamente el modo en que se resumen y presentan los datos y acceder a un mayor nivel de detalle cuando se desee.
  • Crear Informes: Es uno de los usos más habituales de Excel, ya que se puede interactuar en la pantalla o imprimir.

PARA QUE SIRVE UNA HOJA DE CALCULO

Una hoja de cálculo en Excel (o cualquier otro programa que cumple funciones similares), sirve para trabajar con números de forma fácil e intuitiva. Es una hoja de cálculo avanzada que te permite realizar fácilmente tareas financieras y administrativas.

Una hoja de cálculo Excel es una cuadrícula donde cada celda que conforma esa cuadrícula puede contener números, letras, fórmulas o gráficos.

Más información:
* Para qué sirve Excel
* Para qué sirve una hoja de cálculo
VER MASUna hoja de cálculo es un programa que permite manipular datos numéricos y alfanuméricos dispuestos en forma de tablas (la cual es la unión de filas y columnas). Habitualmente es posible realizar cálculos complejos con fórmulas y funciones y dibujar distintos tipos de gráficas

DIAGRAMAS


Un diagrama o gráfico es un tipo de esquema de información que representa datos numéricos tabulados.
Dibujo o representación gráfica que sirve para resolver un problema, o para mostrar la disposición interior de una cosa o las variaciones de un fenómeno.
Los diagramas son representaciones gráficas de la información recolectada en una tabla de frecuencias.
En ellos, se puede apreciar, de una manera muy clara, la información relacionada con los datos de una tabla de frecuencias. Los diagramas son el medio más efectivo de presentar la información
Diagrama Circular
En este tipo de gráfico, se distribuye la información en sectores proporcionales dentro de una circunferencia. También son llamados diagramas de pastel, pues en algunos casos, la información se grafica es una especie de cilindro, parecido a un pastel.

Gráfico de Barras Es la representación grafica, en ejes cartesianos, de la información dada en una tabla de frecuencias. Sobre el eje x, se anota la característica que se estudia, por ejemplo, edad, color, sexo, nota, marca de carro, entre otras. Sobre el eje y, se registran las frecuencia. jlp

Diagramas de Tallo y Hojas

Una técnica de recuento y ordenación de datos la constituye los diagramas de Tallos y Hojas.
Supongamos la siguiente distribución de frecuencias


36 25 37 24 39 20 36 45 31 31


39 24 29 23 41 40 33 24 34 40


que representan la edad de un colectivo de N = 20 personas y que vamos a representar mediante un diagrama de Tallos y Hojas.
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.
A continuación efectuamos un recuento y vamos «añadiendo» cada hoja a su tallo
diagrama de arbol muestra combinaciones cosas posibles que se pueden hacer con comida ropa etcetera