viernes, 22 de mayo de 2009

CORRELACION

Correlacion es la forma de cuantificar.

Correlacion: la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos grados de correlacion
gggggdos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad.

GRADOS DE CORRELACION
La correlacion puede presentar los siguientes grados:

1) PERFECTA: Que puede ser positiva o negativa.

2) IMPERFECTA: Que puede ser exelente, aceptable, regular o minima.

3) NULA:
Correlacion perfecta: Es cuando al crecer o descrecer una variable, crece o decrece la otra y es perfecta cuando los valores de una variable y la otra aumentan o disminuyen en la misma cantidad. Decimos que es negativa cuando al crecer una variable decrece la otra y viceversa.
Correlacion Imperfecta: Se determina cuando los puntos dados por par de valores de las variables, no caen sobreb la diagonal sino q se acercan a el.
Correlacion Nula: es cuando entre las dos variables no hay ninguna relacion y los puntos se distribuyen desordenadamenta sobre too el plano.

Algunos ejemplos:



La 1era grafica es positiva, la 2da es negativa, y las otras nulas.

jueves, 21 de mayo de 2009

REGRESION



El primer tema de clase en el 2do bimestre fue? '' REGRESION''
El análisis de regresión estudia de la relación entre dos grupos de datos desarrollando una ecuación matemática que la describe. La ecuación nos permitirá predecir el valor de la variable dependiente Y basándonos en el valor de la variable independiente X. La técnica usada para desarrollar la ecuación para la línea de tendencia y hacer esta predicción es llamada análisis de regresión.

formula punto pendiente:


Y2-Y1= m (X2-X1)


CLASES DE REGRESION

Ejemplo de una grafica de relacion lineal negativa y postiva:



La primera es lineal negativa.

La segunda lineal positiva





OTROS EJEMPLOS DE GRAFICAS:



Podemos ver que las 1eras dos son lineales positivas. La 3ra es cuadratica bueno a mi criterio conforme a lo que nos explico el prof en clase. Las 1era de abajo es lineal negativa, la 2da es cuadratica negativa, y la ultima es relacon nula.
DIAGRAMA DE DISPERSION:
Este nos ayuda a determinar si es lineal o cuadratica.

viernes, 8 de mayo de 2009

REGRESION

Origen del concepto

El término regresión fue introducido por Francis Galton en su libro Natural inheritance (1889) y fue confirmada por su amigo Karl Pearson. Su trabajo se centró en la descripción de los rasgos físicos de los descendientes (variable A) a partir de los de sus padres (variable B). Estudiando la altura de padres e hijos a partir de más de mil registros de grupos familiares, se llegó a la conclusión de que los padres muy altos tenían una tendencia a tener hijos que heredaban parte de esta altura, pero que revelaban también una tendencia a regresar a la media. Galton generalizó esta tendencia bajo la "ley de la regresión universal": «Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor.»

REGRESION: La regresión estadística o regresión a la media es la tendencia de una medición extrema a presentarse más cercana a la media en una segunda medición. La regresión se utiliza para predecir una medida basándonos en el conocimiento de otra.

Modelos de regresión

Regresión lineal

Artículo principal: Regresión lineal
  • Regresión lineal simple

Dadas dos variables (Y: variable dependiente; X: independiente) se trata de encontrar una función simple (lineal) de X que nos permita aproximar Y mediante: Ŷ = a + bX

a (ordenada en el origen, constante)
b (pendiente de la recta)
A la cantidad e=Y-Ŷ se le denomina residuo o error residual.

Así, en el ejemplo de Pearson: Ŷ = 85 cm + 0,5X

Donde Ŷ es la altura predicha del hijo y X la altura del padre: En media, el hijo gana 0,5 cm por cada cm del padre.
  • Regresión lineal múltiple

Regresión no lineal

Artículo principal: Regresión no lineal

Regresión Exponencial.

- CRECIENTE
- DECRECIENTE
- CUADRATICA




Segundo Bimestre






SEGUNDO BIMESTRE
ESTADISK

martes, 24 de marzo de 2009

Tablas de Doble entrada

Tablas de doble entrada:

Tablas de doble entrada: También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla. Para la tabulación de un material agrupado de observaciones simultaneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.
Este tipo de tablas brindan información estadística de dos eventos relacionados entre sí, es útil en casos en los cuales los experimentos son dependientes de otro experimento, mas adelante aparecen mas aplicaciones del análisis estadístico bivariable.
Ej:
T1/T2 SI NO

SI 12 4

NO 10 2

Tablas de doble entrada
Los estudios estadísticos que se centran en el análisis de una sola variable se llaman unidimensionales. Sin embargo, en las situaciones reales es corriente que se tenga que investigar la combinación de dos variables estadísticas, en lo que se conoce por distribución bidimensional. En este campo, se utilizan presentaciones de los datos en tablas de doble entrada, con gráficas de nube de puntos que interrelacionan las variables.
Distribuciones bidimensionales
Cuando se realizan estudios estadísticos de dos variables, el modelo resultante recibe el nombre de distribución bidimensional. Algunos ejemplos de este tipo de distribución son las tablas de altura-peso de un colectivo de población, la relación pulso-temperatura de un grupo de enfermos y la gráfica de ingresos y gastos de una empresa.
En estas distribuciones se manejan variables estadísticas bidimensionales, que constituyen pares de valores de cada una de las variables elementales que intervienen, denotados por (xi, yj).


Medidas de forma

Hemos visto ya:
MT: Medidas de tendencia Central.
MP: Medidas de Posicion.
MD: Medidas de Dispersion.
MF: Medidas de Forma.
Medidas de Forma:
Hay 2 y son:
1) Sesgo
2) K= Curtosis.
Sesgo:En estadística y epidemiología, un sesgo es un error que aparece en los resultados de un estudio debido a factores que dependen de la recolección, análisis, interpretación, publicación o revisión de los datos que pueden conducir a conclusiones que son sistemáticamente diferentes de la verdad o incorrectas acerca de los objetivos de una investigación. Este error puede ser sistemático o no, y es diferente al error aleatorio.
En el diseño y elaboración de un estudio de investigación en clínica, puede haber distintos tipos de sesgos
Sesgo de selección: Grupos no comparables debido a cómo se eligieron los pacientes o sujetos.
Sesgo de Información: Grupos no comparables debido a cómo se obtuvieron los datos.
Sesgo de confusión: Existe una mezcla de efectos debido a una tercera variable (
variable de confusión).
Sesgo retrospectivo.
Para determinar el sesgo y curtosis necesitamos algunas medidas.
Curtosis:
En teoría de la probabilidad y estadística, la curtosis es una medida de lo "picudo" (concentrado en torno al pico máximo) de la distribución de probabilidad de una variable aleatoria de número real.
La curtosis mde o cuantifica la agudeza de la distribucion o del fenomeno. Y estala
Lepto curtica
Meso Curtica
Plato Curtica. 100pre y cuando sea normal.
Formula de sesgo:
Si solo hay 1 moda uamos esta formula. Sg= La media- la mediana
________________
S
a) mayor que O= asimetricamente +
b) = 0= normal
c) menor que 0 = asimetricamente -.
Formula de Curtosis:
K=menor que 0.263=Plato
K= 0.263= Meso
K= mayor que 0.263= Lepto
K= 1/2 (Q3-Q1)
_________
P90 -P10

Percentiles o Centiles

Los percentiles son , tal vez las medidas mas utilizadas para propositos de ubicacion o clasificacion de la personas cuando atienden caracteristicas tales como peso, estatutra, etc.
Los percentiles son ciertos numeros que dividen la sucecion de datos ordenados en cien partes porcentuales iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles ( P1, P2....P99), leido primer percentil,..., P99.


Ejemplo:
1% 30% 49% 100%
_________________________________________________________
C50 C100


Quintiles:Un quintil es la quinta parte de una población estadística ordenada de menor a mayor en alguna característica de esta. Corresponde a dos deciles, o a veinte percentiles.
El término es bastante utilizado en
Economía para caracterizar la distribución del ingreso de una población humana.
El quintil de ingreso, se calcula ordenando la población (de una región, país, etc.) desde el individuo más pobre al más adinerado, para luego dividirla en 5 partes de igual número de individuos; con esto se obtienen 5 quintiles ordenados por sus ingresos, donde el primer quintil (ó Q1, I quintil) representa la porción de la población más pobre; el segundo quintil (Q2, II quintil), el siguiente nivel y así sucesivamente hasta el quinto quintil (Q5, V quintil), representante de la población más rica.
Proviene del
latín, quintus, que significa quinto.
Ejemplo:


20% 40% 60% 80% 100%
___________________________________

K1 K2 K3 K4 K5

1/20.