viernes, 9 de noviembre de 2018

Probabilidad y Laplace


Regla de Laplace

Si realizamos un experimento aleatorio en el que hay n sucesos elementales, todos igualmente probables, equiprobables, entonces si A es un suceso, la probabilidad de que ocurra el suceso A es:
Laplace

Ejemplos

1Hallar la probabilidad de que al lanzar dos monedas al aire salgan dos caras.
Casos posibles: {cc, cx, xc, xx}.
Casos favorables: 1.
cartas
2En una baraja de 40 cartas, hallar la P (as) y P (copas).
Casos posibles: 40.
Casos favorables de ases: 4.
cartas
Casos favorables de copas: 10.
cartas
3Calcular la probabilidad de que al echar un dado al aire, salga:
1 Un número par.
Casos posibles: {1, 2, 3, 4, 5, 6}.
Casos favorables: {2, 4, 6}.
solución
2 Un múltiplo de tres.
Casos favorables: {3, 6}.
solución
3 Mayor que 4.
Casos favorables: {5, 6}.
solución

viernes, 12 de octubre de 2018

tipos de variables, que es una tabla de frecuencias,tipos de frecuencias,tabla de frecuencia con datos agrupados.....

Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población.

Tipos de variable estadísticas

Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden.
Ejemplo: 
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden.
Ejemplos: 
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta

Una variable discreta es aquella que solo puede tomar un número finito de valores entre dos valores cualesquiera de una caraterística.
Ejemplo: 
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua

Una variable continua es aquella que puede tomar un número infinito de valores entre dos valores cualesquiera de una caraterística.
Ejemplos: 
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.
https://www.vitutor.com/estadistica/descriptiva/a_2.html


Distribución de frecuencias

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencias

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
igualdad
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
igualdad

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
frecuencia relativa
La suma de las frecuencias relativas es igual a 1.

Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por Fi.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Ejemplo: 
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xiRecuentofiFiniNi
27I110.0320.032
28II230.0650.097
29recuento690.1940.290
30recuento7160.2260.516
31elrecuento8240.2580.774
32III3270.0970.871
33III3300.0970.968
34I1310.0321
  31 1 
https://www.vitutor.com/estadistica/descriptiva/a_3.html


Distintos Tipos de Frecuencia:
Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. Estos números se denominan frecuencias: Así tenemos los siguientes tipos de frecuencia:
  1. Frecuencia absoluta
  2. Frecuencia relativa
  3. Porcentaje
  4. Frecuencia absoluta acumulada
  5. Frecuencia relativa acumulada
  6. Porcentaje acumulado
  7. Ejemplo

Frecuencia absoluta:
La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni
Frecuencia relativa:
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi
Donde N = Tamaño de la muestra


Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar siempre en términos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.
Frecuencia Absoluta Acunulada:
Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por Ni.
 
 

Frecuencia Relativa Acunulada:
Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por Fi
Porcentaje Acumulado:
Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada por 100.


 
Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas activas.
Personas Activas
Número Familias
Xi
ni
Fi
pi
Ni
Fi
Pi
1
16
16/50
32%
16
16/50
32%
2
20
20/50
40%
36
36/50
72%
3
9
9/50
18%
45
45/50
90%
4
5
5/50
10%
50
50/50
100%
Total
50


En este ejemplo se puede ver fácilmente como se calculan estas frecuencias.

http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt14.html#HEAD

Un diagrama de barras, también conocido como gráfico de barras o diagrama de columnas, es una forma de representar gráficamente un conjunto de datos o valores, y está conformado por barras rectangulares de longitudes proporcionales a los valores representados. }
1- Tablas de frecuencias con datos agrupados
 
Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o clases para así realizar un mejor análisis e interpretación de ellos. 
 
• Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos, se debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando la cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan las frecuencias relativas y acumuladas, si es pertinente.
 
• Si no se conocen los intervalos, se pueden determinar de la siguiente manera: (recuerda que los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es continua).
 
- Se busca el valor máximo de la variable y el valor mínimo. Con estos datos se  determina el rango
 
 - Se divide el rango en la cantidad de intervalos que se desea tener,(por lo general se determinan 5 intervalos de lo contrario es ideal que sea un numero impar por ejemplo 5, 7, 9)  obteniéndose así la amplitud o tamaño  de cada intervalo. 
 
 - Comenzando por el mínimo valor de la variable, que será el extremo inferior del primer intervalo, se suma a este valor la amplitud para obtener el extremo superior  y así sucesivamente.
 
• Otra forma de calcular la cantidad de intervalos es aplicando los siguientes metodos:
 
Método Sturges:  k =  1 +  3,332 log n  
 
donde:
k= número de clases
n= tamaño muestral
 
Debemos tener en cuenta 2 cosas. Primero que el número de intervalos me tiene que dar impar, segundo que el resultado se redondea generalmente a la baja. Si al redondear a la baja nos da como resultado un número par debemos redondear al alza. Este es el método que tiene mayor precisión.
 
Método Empírico: este método depende del criterio del evaluador de los datos, por lo tanto es arbitrario. Dice lo siguiente.
 
         5 ≥ k  ≥ 20
 
 
Veamos como se resuelve el siguiente ejercicio del libro Santillana 8:
 
En un centro comercial, se consultó la edad a todas las personas que entraban entre las 12:00 h y 12:30 h. Los resultados obtenidos fueron los siguientes:
 
tablas_de_frecuencias_datos_agrupados.jpg (416×149)
 
Construye una tabla de frecuencias cuyos datos estén agrupados en ocho intervalos.
 
1°Para poder construir la tabla de frecuencias lo primero que debemos hacer es calcular el rango.
 
El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato menor al dato mayor.
 
El dato mayor y el menor lo hemos destacado con color rojo:
 
Dato mayor - dato menor =  73 - 1 =  72
Por lo tanto; Rango = 72

2° En el problema nos dicen que debemos agruparlo en 8 intervalos o clases, con este dato podemos calcular la amplitud o tamaño de cada intervalo, dividiendo el valor del rango por la cantidad de intervalos que se desean obtener (en este caso son 8).
Amplitud: La amplitud de un intervalo es la diferencia entre el límite superior y el límite inferior. La amplitud(A) de los intervalos puede calcularse mediante la expresión:
tablas_de_frecuencias_datos_agrupados_amplitud.jpg (273×97)
72 / 8 = 9

Por lo tanto la amplitud de cada intervalo será de 9
- El valor de la amplitud se redondea al número inmediato superior de acuerdo a la cantidad de decimales que tienen los datos o según la precisión con que se desea trabajar.
- Puede haber intervalos con distinta amplitud.
- Puede haber intervalos con amplitud indefinida (intervalos abiertos)
3° Ahora podemos comenzar a construir la tabla de frecuencias:
Hay distintas formas de construir los intervalos dependiendo del tipo de variable que estemos trabajando.
a) Variables cuantitativas discretas solo pueden tomar un número finito de valores. Siendo por lo general estos valores los números naturales 1, 2, 3...Un ejemplo son el número de hijos, el número de habitaciones de una vivienda, el número de matrimonios de una persona. Cuando categorizamos variables discretas los límites de clase son idénticos a los límites reales. Por ejemplo, el número de personas que viven en una familia podemos agruparlo, De 1 hasta 2 (0 es imposible no hay ninguna familia sin ningún miembro) De 3 hasta 4, De 5 hasta 7.
b) Variables cuantitativas continuas: Las variables continuas, por el contrario, pueden, tomar un número infinito de valores en cualquier intervalo dado. En este caso los valores se agrupan en intervalos cuyos límites inferior y superior serían los siguientes:
Inferior : Li
Superior: Lsi-1
 
Habitualmente, los intervalos se consideran cerrados a la izquierda y abiertos a la derecha, es decir que el extremo inferior está incluido en el intervalo, pero el extremo superior no.
Es importante mencionar que las clases o intervalos para las variables continuas pueden ser de tres tipos:
abiertas: clases abiertas tienen límites determinados (a,b), pero los valores que la contienen comprenden valores muy cercanos a estos límites sin comprenderlos a ellos mismos, esto se representa con un intervalo definido entre paréntesis (). Esto quiere decir que esta clase contiene valores desde a hasta b pero no contiene exactamente a ni b solo valores muy cercanos.
cerradas: las clases cerradas, además de los valores que están entre a y b, los contiene a ellos, y se representa con corchetes [a,b].
semiabiertas: pueden contener a o b más los valores que están entre ellos, y se puede representar con un corchete y un paréntesis, por ejemplo, (a,b], en este caso no contiene el valor a y si los valores de  b, además de los valores que están entre estos.

C) Registro discreto de variables continuas: Cuando la variable considerada es continua pero ocurre que la precisión del instrumento de medida se limita a un número finito de datos, existe la opción de construir los intervalos de tal forma que ambos extremos estén incluidos en él. 
 
Ej 50 a 52, 53 a 55, 56 a 58, 59 al 61 y 62 al 64
 
Estos serían los límites aparentes de los intervalos.
 
 Con esta información construiremos la tabla en esta ocasión con el último método explicado.
 
 
tablas_de_frecuencias_datos_agrupados_2.jpg (624×288)
- Marca clase o centro de la clase: es la semisuma de los límites de cada clase. Representa a todos los datos que están contenidos en una clase.

Responder las siguientes preguntas:
a) Del total de personas encuestadas, ¿cuántas personas tienen entre 31 y 40 años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:

tablas_de_frecuencias_datos_agrupados_3.jpg (624×27)
El dato lo obtenemos de la columna de la frecuencia absoluta.
Recuerda que:
Frecuencia absoluta Corresponde a la cantidad de veces que se repite un dato. Denotamos este valor por fi.
Por lo tanto la respuesta es 6 personas.

b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o menos años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:
tablas_de_frecuencias_datos_agrupados_4.jpg (624×27)

El dato lo obtenemos de la columna de frecuencia absoluta acumulada.

Recuerda que:
Frecuencia absoluta acumulada es la suma de las frecuencias absolutas observadas hasta el intervalo i.
En este caso es el intervalo 6. Por lo tanto la respuesta es 36 personas tienen 60 o menos años.

c) ¿Cuál es la probabilidad de, que al elegir al azar a un persona consultada, esta tenga entre 11 y 20 años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:
tablas_de_frecuencias_datos_agrupados_5.jpg (554×27)

El dato lo obtenemos de la columna de frecuencia relativa.
Recuerda que:
Frecuencia relativa Corresponde a la probabilidad de pertenecer a cierta categoría. Se puede expresar en tantos por ciento.
En este caso es el intervalo 2,  ya que es ahí donde se encuentran las edades entre 11 y 20 años.
Entonces la respuesta es: La probabilidad es  14%.
 
 
Por último vamos a repasar el concepto de:
 
Frecuencia relativa acumulada (Hi), Es la probabilidad de observar un valor menor o igual al valor que toma la variable en estudio en ese intervalo.
 
Se calcula dividiendo Fi por el número total de datos. También puedes calcularlo Sumando la frecuencia relativa de cada grupo con la frecuencia relativa acumulada del grupo anterior. 
 
Si haces correctamente estos cálculos, el último grupo tendrá una frecuencia acumulada de 1, o muy cerca de 1, permitiendo redondear el error.
Recuerda que este valor se puede expresar como porcentaje, para esto solo debes multiplicar el valor obtenido por 100 y listo!!!
 
Este calculo te sirve en el caso de que te pregunten:
 
d) Si le preguntas a una persona cualquiera ¿Cuál es la probabilidad de que tenga 50 años o menos?
 
tablas_de_frecuencias_datos_agrupados_6.jpg (651×27)
 
 
Respuesta: La probabilidad es de un 76%

https://www.portaleducativo.net/octavo-basico/791/Tablas-de-frecuencias-con-datos-agrupados



La marca de clase es el punto medio de cada intervalo.
La marca de clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros como la media artmética o la desviación típica.
Se representa por cxi.

Ejemplo

 xifixi · fixi2 · fi
[10, 20)15115225
[20, 30)2582005000
[30,40)351035012 250
[40, 50)45940518 225
[50, 60)55844024 200
[60,70)65426016 900
[70, 80)75215011 250
  421 82088 050
media
desvición típica

Los límites reales: son valores que unen a las clases y se forman únicamente de números enteros, estos se obtienen al restar 0.5 a los limites de la izquierda y sumar 0.5 a los limites de la derecha; cuando las clases tengan un decimal, habrá que restar 0.05 a los limites de la izquierda y sumar 0.05 limites de la derecha y así sucesivamente
https://helper02.es.tl/Limites-reales-.-.htm

Amplitud de clase

Se considera la amplitud que deben tener las clases consideradas para realizar un estudio estadístico. Para n datos con k clases se determina que la amplitud de clase es igual a k/A.


https://glosarios.servidor-alicante.com/terminos-estadistica/amplitud-de-clase


La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la clase.
https://es.wikipedia.org/wiki/Distribución_de_frecuencias