lunes, 8 de junio de 2015




Tratamiento de Datos y Azar.


¿ Que es Tratamiento de Datos y Azar?
Es la ciencia formal y una herramienta que estudia el uso y análisis de una muestra representativa de datos que busca explicar las correlaciones y dependencias de un fenómeno físico o natural de ocurrencias en forma aleatoria o condicional. y se encuentra dividida en dos unidades programáticas que se enfocan a la adquisición de competencias necesarias para llevar a cabo la interpretación de información, interpretación de eventos aleatorios.

  1.  En la primera unidad se agrupan y grafican conjuntos de datos cualitativos y cuantitativos a partir de la distribución de frecuencias para su interpretación, y se calcula y gráfica las medidas de tendencia central y dispersión de un conjunto de datos, mediante fórmulas estadísticas.
  1. la segunda unidad, como su nombre lo indica, se aboca a la interpretación de eventos aleatorios aplicando las técnicas de conteo y fórmulas relacionadas. 
  1. naturaleza de la estadística.
  1. estadística descriptiva.
  1. estadística inferencial.
  1. población.
  1. muestra.
  1. parámetro o estadística muestral.
  1. estimación.
  1. datos.
  1. distribución de frecuencias.
la estadística es la ciencia formal de herramientas que estudia el uso el análisis de de una muestra representativa de datos que busca explicar las correlaciones y dependencia de un fenómeno físico o natural.
Estadística inferecial
se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. estas inferencias pueden tomar la forma de respuestas a preguntas si/no (pruebas de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modela miento de relaciones entre variables (análisis de regresión).
Frecuencia acumulada
Frecuencia relativa acumulada
Distribución de frecuencias agrupadas
Agrupación y la representación gráfica  de datos cualitativos y cuantitativos con base en su distribución de frecuencia.
este se divide en varios temas como seria:


Naturaleza de la estadística.

sin embargo la estadística es mas una herramienta fundamental que permite llevar a cabo el proceso relacionados con la investigación científica. esta se amplia en varias disciplinas, desde la física hasta las ciencias sociales desde las ciencias de la salud hasta el control de calidad en una empresa o compañía.


Estadística descriptiva.

se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. los datos pueden ser resumidos numérica o gráficamente.
ejemplo básicos de parámetros estadísticos son: la media y la desviación estándar. 
algunos ejemplos gráficos son: histograma, pirámide población, gráfica circular.


Población
Población estadística, en estadística, también llamada universo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. También es el conjunto sobre el que estamos interesados en obtener conclusiones (inferir). Normalmente es demasiado grande para poder abarcarla, motivo por el cual se puede hacer necesaria la extracción de una muestra de ésta.

Muestra
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados.

Parámetro o Estadístico muestral
Un parámetro estadístico o simplemente un estadístico muestral es cualquier valor calculado a partir de la muestra, como por ejemplo la mediavarianza o una proporción, que describe a una población y puede ser estimado a partir de una muestra. Un estadístico muestral es un tipo de variable aleatoria, y que como tal, tiene una distribución de probabilidad concreta, frecuentemente caracterizada por un conjunto finito de parámetros.
Estimación
Una estimación es cualquier técnica para conocer un valor aproximado de un parámetro referido a la población, a partir de los estadísticos muestrales calculados a partir de los elementos de la muestra. Si se estima el suficiente número de parámetros puede aproximarse de manera razonable la distribución de probabilidad de la población para ciertas variables aleatorias.
Datos
Un dato es una representación simbólica (numérica, alfabética, algorítmica, espacial, etc) de un atributo o variable cuantitativa o cualitativa. Los datos describen hechos empíricos, sucesos y entidades. Es un valor o referente que recibe el computador por diferentes medios, los datos representan la información que el programador manipula en la construcción de una solución o en el desarrollo de un algoritmo.

Distribución de frecuencias 

Distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.
Frecuencia absoluta
Frecuencia relativa
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por ni. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1, siempre y cuando no sea igual que 7 o por debajo de los 7 primeros números sucesivos.
Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N).
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. La frecuencia acumulada es la frecuencia estadística F(X≤Xr) con que el valor de un variable aleatoria (X) es menor que o igual a un valor de referencia (Xr). La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breveFc(Xr)
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento. Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
Construcción de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1.   Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2.   Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos que queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.

Gráfico lineal: los valores en dos ejes cartesianos ortogonales entre sí. Las gráficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores máximos y mínimos; también se utilizan para varias muestras en un diagrama.
Gráfico de barras: se usa cuando se pretende resaltar la representación de porcentajes de datos que componen un total. Una gráfica de barras contiene barras verticales que representan valores numéricos, generalmente usando una hoja de cálculo. Las gráficas de barras son una manera de representar frecuencias; las frecuencias están asociadas con categorías. Una gráfica de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. La gráfica de barras sirve para comparar y tener una representación gráfica de la diferencia de frecuencias o de intensidad de la característica numérica de interés.
Histograma: se emplea para ilustrar muestras agrupadas en intervalos. Está formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los límites de los intervalos y el centro de cada intervalo es la marca de clase que representamos en el eje de las abscisas. La altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo.
Gráfico circular: permite ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar.
Pictograma: Son imágenes que sirven para representar el comportamiento o la distribución de los datos cuantitativos de una población, utilizando símbolos de tamaño proporcional al dato representado. Una posibilidad es que el gráfico sea analógico por ejemplo, la representación de los resultados de las elecciones con colores sobre un hemiciclo.








































No hay comentarios.:

Publicar un comentario