Tratamiento de Datos y Azar.
¿ Que es Tratamiento de Datos y Azar?
Es la ciencia formal y una herramienta que estudia el uso y análisis de una muestra representativa de datos que busca explicar las correlaciones y dependencias de un fenómeno físico o natural de ocurrencias en forma aleatoria o condicional. y se encuentra dividida en dos unidades programáticas que se enfocan a la
adquisición de competencias necesarias para llevar a cabo la interpretación de información, interpretación de eventos aleatorios.
- En la primera unidad se agrupan y grafican conjuntos de datos cualitativos y cuantitativos a partir de la distribución de frecuencias para su interpretación, y se calcula y gráfica las medidas de tendencia central y dispersión de un conjunto de datos, mediante fórmulas estadísticas.
- la segunda unidad, como su nombre lo indica, se aboca a la interpretación de eventos aleatorios aplicando las técnicas de conteo y fórmulas relacionadas.
- naturaleza de la estadística.
- estadística descriptiva.
- estadística inferencial.
- población.
- muestra.
- parámetro o estadística muestral.
- estimación.
- datos.
- distribución de frecuencias.
Estadística inferecial
se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. estas inferencias pueden tomar la forma de respuestas a preguntas si/no (pruebas de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modela miento de relaciones entre variables (análisis de regresión).
Frecuencia acumulada
Frecuencia relativa acumulada
Distribución de frecuencias agrupadas
Agrupación y la representación gráfica de datos cualitativos y cuantitativos con base en su distribución de frecuencia.
este se divide en varios temas como seria:
Naturaleza de la estadística.
sin embargo la estadística es mas una herramienta fundamental que permite llevar a cabo el proceso relacionados con la investigación científica. esta se amplia en varias disciplinas, desde la física hasta las ciencias sociales desde las ciencias de la salud hasta el control de calidad en una empresa o compañía.
Estadística descriptiva.
se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. los datos pueden ser resumidos numérica o gráficamente.
ejemplo básicos de parámetros estadísticos son: la media y la desviación estándar.
algunos ejemplos gráficos son: histograma, pirámide población, gráfica circular.
Población
Población estadística, en estadística, también llamada universo, es el
conjunto de elementos de referencia sobre el que se realizan las observaciones.
También es el conjunto sobre el que estamos interesados en obtener conclusiones
(inferir). Normalmente es demasiado grande para poder abarcarla, motivo por el
cual se puede hacer necesaria la extracción de una muestra de ésta.
Muestra
Las
muestras se obtienen con la intención de inferir propiedades de la totalidad de
la población, para lo cual deben ser representativas de la misma. Para cumplir
esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos,
puede obtenerse una información similar a la de un estudio exhaustivo con mayor
rapidez y menor coste (véanse las ventajas de la elección de una muestra, más
abajo el muestreo puede ser más exacto que el estudio de toda la población
porque el manejo de un menor número de datos provoca también menos errores en
su manipulación. En cualquier caso, el conjunto de individuos de la muestra son
los sujetos realmente estudiados.
Parámetro o
Estadístico muestral
Un parámetro estadístico o simplemente un estadístico muestral es cualquier valor calculado
a partir de la muestra, como por ejemplo la media, varianza o
una proporción, que describe a una población y puede ser estimado
a partir de una muestra. Un estadístico muestral es un tipo de variable aleatoria, y que como tal, tiene
una distribución de probabilidad concreta,
frecuentemente caracterizada por un conjunto finito de parámetros.
Estimación
Una estimación es
cualquier técnica para conocer un valor aproximado de un parámetro referido a
la población, a partir de los estadísticos muestrales calculados a partir de
los elementos de la muestra. Si se estima el suficiente número de parámetros
puede aproximarse de manera razonable la distribución de probabilidad de la
población para ciertas variables aleatorias.
Datos
Un dato es una representación simbólica (numérica, alfabética,
algorítmica, espacial, etc) de un atributo o variable cuantitativa o
cualitativa. Los datos describen hechos empíricos, sucesos y entidades. Es un
valor o referente que recibe el computador por diferentes medios, los datos
representan la información que el programador manipula en la construcción de
una solución o en el desarrollo de un algoritmo.
Distribución de frecuencias
Distribución de frecuencias a la
agrupación de datos en categorías mutuamente excluyentes que indican el número
de observaciones en cada categoría. Esto proporciona un valor añadido a la
agrupación de datos. La distribución de frecuencias presenta las observaciones
clasificadas de modo que se pueda ver el número existente en cada clase.
Frecuencia absoluta
Frecuencia relativa
Frecuencia relativa
La
frecuencia absoluta es el número de veces que aparece un determinado valor en
un estudio estadístico. Se representa por ni. La suma de las frecuencias absolutas
es igual al número total de datos, que se representa por N. Para indicar
resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se
lee suma o sumatoria.
La
frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos. Se puede expresar en tantos por
ciento y se representa por fi. La suma de las frecuencias relativas es igual a
1, siempre y cuando no sea igual que 7 o por debajo de los 7 primeros números sucesivos.
Frecuencia
relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la
muestra (N).
La
frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado. La frecuencia acumulada es
la frecuencia estadística F(X≤Xr) con que el valor de un variable aleatoria (X)
es menor que o igual a un valor de referencia (Xr). La frecuencia acumulada
relativa se deja escribir como Fc(X≤Xr), o en breveFc(Xr)
La
frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de
un determinado valor y el número total de datos. Se puede expresar en tantos
por ciento. Ejemplo:
Durante
el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32,
31, 28, 29, 33, 32, 31, 30, 31, 31, 27
La
distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si
las variables toman un número grande de valores o la variable es continua. Se
agrupan los valores en intervalos que tengan la misma amplitud denominados
clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la
clase. Cada clase está delimitada por el límite inferior de la clase y el
límite superior de la clase.
La
amplitud de la clase es la diferencia entre el límite superior e inferior de la
clase. La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros.
Construcción
de una tabla de datos agrupados:
3,
15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31,
26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1.
Se
localizan los valores menor y mayor de la distribución. En este caso son 3 y
48.
2.
Se
restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos que queramos establecer.
Es
conveniente que el número de intervalos oscile entre 6 y 15.
En
este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10
intervalos.
Gráfico lineal: los valores en dos ejes cartesianos ortogonales
entre sí. Las gráficas lineales se recomiendan para representar series en el
tiempo, y es donde se muestran valores máximos y mínimos; también se utilizan
para varias muestras en un diagrama.
Gráfico de barras: se usa cuando se pretende resaltar la representación de porcentajes
de datos que componen un total. Una gráfica de barras contiene barras
verticales que representan valores numéricos, generalmente usando una hoja de
cálculo. Las gráficas de barras son una manera de representar frecuencias; las
frecuencias están asociadas con categorías. Una gráfica de barras se presenta
de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo
(alto si es horizontal) igual a la frecuencia. La gráfica de barras sirve para
comparar y tener una representación gráfica de la diferencia de frecuencias o
de intensidad de la característica numérica de interés.
Histograma: se emplea para ilustrar muestras agrupadas en intervalos. Está
formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con
los límites de los intervalos y el centro de cada intervalo es la marca de
clase que representamos en el eje de las abscisas. La altura de cada rectángulo
es proporcional a la frecuencia del intervalo respectivo.
Gráfico circular: permite ver la distribución interna de los datos que representan un
hecho, en forma de porcentajes sobre un total. Se suele separar el sector
correspondiente al mayor o menor valor, según lo que se desee destacar.
Pictograma: Son imágenes que
sirven para representar el comportamiento o la distribución de los datos
cuantitativos de una población, utilizando símbolos de tamaño
proporcional al dato representado. Una posibilidad es que el gráfico sea analógico por ejemplo, la
representación de los resultados de las elecciones con colores sobre un
hemiciclo.