martes, 24 de marzo de 2009

Tablas de Doble entrada

Tablas de doble entrada:

Tablas de doble entrada: También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla. Para la tabulación de un material agrupado de observaciones simultaneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.
Este tipo de tablas brindan información estadística de dos eventos relacionados entre sí, es útil en casos en los cuales los experimentos son dependientes de otro experimento, mas adelante aparecen mas aplicaciones del análisis estadístico bivariable.
Ej:
T1/T2 SI NO

SI 12 4

NO 10 2

Tablas de doble entrada
Los estudios estadísticos que se centran en el análisis de una sola variable se llaman unidimensionales. Sin embargo, en las situaciones reales es corriente que se tenga que investigar la combinación de dos variables estadísticas, en lo que se conoce por distribución bidimensional. En este campo, se utilizan presentaciones de los datos en tablas de doble entrada, con gráficas de nube de puntos que interrelacionan las variables.
Distribuciones bidimensionales
Cuando se realizan estudios estadísticos de dos variables, el modelo resultante recibe el nombre de distribución bidimensional. Algunos ejemplos de este tipo de distribución son las tablas de altura-peso de un colectivo de población, la relación pulso-temperatura de un grupo de enfermos y la gráfica de ingresos y gastos de una empresa.
En estas distribuciones se manejan variables estadísticas bidimensionales, que constituyen pares de valores de cada una de las variables elementales que intervienen, denotados por (xi, yj).


Medidas de forma

Hemos visto ya:
MT: Medidas de tendencia Central.
MP: Medidas de Posicion.
MD: Medidas de Dispersion.
MF: Medidas de Forma.
Medidas de Forma:
Hay 2 y son:
1) Sesgo
2) K= Curtosis.
Sesgo:En estadística y epidemiología, un sesgo es un error que aparece en los resultados de un estudio debido a factores que dependen de la recolección, análisis, interpretación, publicación o revisión de los datos que pueden conducir a conclusiones que son sistemáticamente diferentes de la verdad o incorrectas acerca de los objetivos de una investigación. Este error puede ser sistemático o no, y es diferente al error aleatorio.
En el diseño y elaboración de un estudio de investigación en clínica, puede haber distintos tipos de sesgos
Sesgo de selección: Grupos no comparables debido a cómo se eligieron los pacientes o sujetos.
Sesgo de Información: Grupos no comparables debido a cómo se obtuvieron los datos.
Sesgo de confusión: Existe una mezcla de efectos debido a una tercera variable (
variable de confusión).
Sesgo retrospectivo.
Para determinar el sesgo y curtosis necesitamos algunas medidas.
Curtosis:
En teoría de la probabilidad y estadística, la curtosis es una medida de lo "picudo" (concentrado en torno al pico máximo) de la distribución de probabilidad de una variable aleatoria de número real.
La curtosis mde o cuantifica la agudeza de la distribucion o del fenomeno. Y estala
Lepto curtica
Meso Curtica
Plato Curtica. 100pre y cuando sea normal.
Formula de sesgo:
Si solo hay 1 moda uamos esta formula. Sg= La media- la mediana
________________
S
a) mayor que O= asimetricamente +
b) = 0= normal
c) menor que 0 = asimetricamente -.
Formula de Curtosis:
K=menor que 0.263=Plato
K= 0.263= Meso
K= mayor que 0.263= Lepto
K= 1/2 (Q3-Q1)
_________
P90 -P10

Percentiles o Centiles

Los percentiles son , tal vez las medidas mas utilizadas para propositos de ubicacion o clasificacion de la personas cuando atienden caracteristicas tales como peso, estatutra, etc.
Los percentiles son ciertos numeros que dividen la sucecion de datos ordenados en cien partes porcentuales iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles ( P1, P2....P99), leido primer percentil,..., P99.


Ejemplo:
1% 30% 49% 100%
_________________________________________________________
C50 C100


Quintiles:Un quintil es la quinta parte de una población estadística ordenada de menor a mayor en alguna característica de esta. Corresponde a dos deciles, o a veinte percentiles.
El término es bastante utilizado en
Economía para caracterizar la distribución del ingreso de una población humana.
El quintil de ingreso, se calcula ordenando la población (de una región, país, etc.) desde el individuo más pobre al más adinerado, para luego dividirla en 5 partes de igual número de individuos; con esto se obtienen 5 quintiles ordenados por sus ingresos, donde el primer quintil (ó Q1, I quintil) representa la porción de la población más pobre; el segundo quintil (Q2, II quintil), el siguiente nivel y así sucesivamente hasta el quinto quintil (Q5, V quintil), representante de la población más rica.
Proviene del
latín, quintus, que significa quinto.
Ejemplo:


20% 40% 60% 80% 100%
___________________________________

K1 K2 K3 K4 K5

1/20.

Cuartiles y Deciles

Los cuatiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentuales iguales. Ejemplo:

25% 50% 75% 100%
Q _________________________________________________K= 1 2 3 4
Q1 Q2 Q3 Q4

Quartiles 1/4.


Deciles: Los deciles son ciertos numeros que dividen la sucesion de datos ordenados en diez partes porcentuales iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambien un caso particular de los percentiles. Los deciles se denotan D1, D2,........D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartliles, son ampliamente utilizados para fijar el aprovehamiento academico. Ejemplo

100% 20% 50% 90% 100%
D _____________________________________________________ K=1 2 3 ....9 10
D1 D2 D3 D4 D5 D9 D10


Deciles 1/100.

Medidas de tendencia Central

Media: La media aritmética o promedio, de una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. Es uno de los principales estadísticos muestrales.

Mediana: En Estadística, una mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra.

Moda: En Estadística, la moda es el valor que cuenta con una mayor frecuencia en una distribución de datos.

Media Armonica: La media armónica , representada H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, ... , an.

Media Cuadratica: La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos.

Media Geometrica: La media geométrica de una cantidad finita de números (digamos 'n' números) es la raíz n-ésima del producto de todos los números.

Diagrama de tallos y Hojas

Un diagrama donde cada valor de datos es dividido en una¨Hoja¨ (normalmente el ultimo digito) y un ¨Tallo¨ (los otros digitos) por ejemplo ¨35¨ seria dividido en ¨3¨ (tallo) y ¨5¨ (hoja).

Los valores del tallo se escriben hacia abajo y los valores de la hoja va a la derecha.
Ejemplo:
15,16,21,23,23,26,26,30,32,41.
Tallo Hoja
1 5 6
2 1 3 3 6 6
3 0 2
4 1

Muestra

Hablavamos en clase hacerca de lo que es muestra:
Muestra: es una parte de la poblacion.
Tipos de Muestra:
Muestreo Delideredo: Esta es la menos indicado.
Muestreo Conglomerado: Es un subconjunto de la muestra.
Estratificado: Ya sea cuando solo escojemos a varones o mujeres o ya se niños.
Aleatorio (Azar): Este es el mas recomendado y es el que se convina con los anteriores.
Ejemplo:
tenemos a la poblacion y sacamos subconjuntos de la muestra este seria el conglomerado, luego dividirlos x mujeres y varones seria el estratificado y por ultimo practicamos el aleatorio .

Medidas de dispercion

Media o Promedio
Mediana
Moda
Desviacion tipica o estandar
Varianza.
Trabajamos tablas calculando todas estas medidas de dispercion.
Como saber cuando la media es robusta:
Cuando se mantiene en medio.