jueves, 31 de mayo de 2018

TEMA 12: CONCORDANCIA Y CORRELACIÓN Correlación paramétrica: Pearson. Correlación no paramétrica: Spearman


Reflexión sobre lo aprendido semana del 7 de mayo

El termino regresión fue introducido por Galton en su libro “Natural inheritance” (1889) refiriéndose a la “ley de la regresión universal”.  Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable). Hoy en día el sentido de regresión es el de predicción de una medida basándonos en el conocimiento de otra.

Los datos obtenidos de dos variables en varios individuos de una muestra pueden ser representadas en un diagrama de dispersión. En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables. Ejemplo:


RELACION ENTRE VARIABLES


  • Incorreción: para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares.









  • Relación directa: Para valores de X mayores que la media le corresponde valores de Y mayores también.  Para los valores de X menores que la media le corresponden valores de Y menores también.




  • Relación inversa: para valores de X mayores que la media le corresponde valores de Y menores. 

Posteriormente dimos el análisis de correlación que se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables.

  • Coeficiente de Correlación r de Pearson (r), (Rxy): Es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde –1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta.

El coeficiente de Correlación por Rango de o rho de Spearman es una medida de asociación que requiere que ambas variables en estudio sean medidas por lo menos en una escala ordinal.


Por último se explicó la regresión lineal simple que trata de estudiar la asociación lineal entre dos variables cuantitativas
.

Para construir un modelo de regresión lineal hace falta conocer: Punto de intersección con el eje de coordenadas=β0 y la Pendiente de la recta a = β1

Y = β1· x + β0

Como calcular β0 y β1











Coeficiente de correlación (Pearson y Spearman): Número adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación lineal entre dos variables.

r= β1 • sx/sy

Coeficiente de determinación: número adimensional (entre 0 y 1) que dá idea de la relación entre las variables relacionadas linealmente. Es r2

A continuación presento un ejercicio para aplicar lo explicado anteriormente.

Un grupo de investigadores se plantea una investigación para saber si, en un grupo de pacientes de una unidad médica de hospitalización, las cifras de urea plasmática tienen algún tipo de relación con los valores de la hemoglobina. Para ello, se estudiaron ambos parámetros en una muestra de 8 pacientes de esta unidad, obteniéndose los siguientes valores:


Plantear la hipótesis adecuada y realizar el modelo que mejor explique el tipo de relación existente entre ambos variables, realizando el test de hipótesis más pertinente.

El profesor también nos facilitó la siguiente tabla para los cálculos correspondientes.

Valores de urea
plasmática (mg/dl)
(xi-)
(xi-)2
Valores de
hemoglobina en
sangre (g/dl)
(yi-)
(xi-) · (yi-)
38,0
10,3
106,5
20,5
-4,4
-45,1
33,5
5,8
33,9
41,0
16,1
93,9
43,5
15,8
250,3
11,5
-13,4
-211,5
14,0
-13,7
187,1
28,0
3,1
-42,8
24,0
-3,7
13,5
28,0
3,1
-11,5
38,0
10,3
106,5
3,5
-21,4
-220,5
24,0
-3,7
13,5
35,5
10,6
-39,1
6,5
-21,2
448,6
31,0
6,1
-129,8
= 27,68 mg/dl
sx = 12,87 mg/dl

Σ (xi-)2 = 1160
= 24,87 g/dl
sy = 12,45 g/dl

Σ(xi-) · (yi-) =
-606,6


Primero se crea la nube de dispersión de la urea y la hemoglobina para visualizar mejor los datos, planteamos las hipótesis, detectamos la variable dependiente/ independiente y formulamos la formula correspondiente.

Ho: no hay relación entre las cifras de urea plasmática y los valores de la hemoglobina.

Hi: hay relación entre las cifras de urea plasmática y los valores de la hemoglobina.

VI = x (urea)

VD = y (orina)

Hb = β1 x urea + β0

Ahora se procede a calcular β1 y β0 con la ayuda de la tabla que nos ha proporcionado el profesor.


 a medida que va aumentado la urea baja la hemoglobina.

β0 = - β1 x = 24,87 x (-0,52) x 27,68 = 39,26

Hb = (-0,52) U + 39,26

Posteriormente se podría dar dos valores a Hb para calcular x y así poder dibujar una recta para una interpretación más correcta, pero en este caso no lo voy a representar.
Ahora calculamos el coeficiente de correlación con los respectivos datos que nos da la tabla.

Sx= 12,8

Sy = 12,4

r = - 0,52 * 12,8/12,4 = -0,53 nos indica que la relación lineal es negativa y intermedia porque esta entre -1 y 1.

Por ultimo calculamos el coeficiente de determinación.

r2  = 0,28 por lo que el 28% de la Hb depende de la urea.


No hay comentarios:

Publicar un comentario