class: front .pull-left-wide[ # Estadística Correlacional] .pull-right-narrow[![:scale 85%](img/logo-correlacional-transp.png)] ## Inferencia, asociación y reporte ---- .pull-left[ ## Juan Carlos Castillo ## Sociología FACSO - UChile ## 2do Sem 2024 ## [.orange[correlacional.netlify.app]](https:/correlacional.netlify.app) ] .pull-right-narrow[ .center[ .content-block-gray[ ## .gray[Sesión 8:] ## .curso[Asociación y covarianza]] ] ] --- layout: true class: animated, fadeIn --- class: middle .pull-left[ .content-box-red[ ## Hasta ahora (Unidad 1) - Probabilidad, teorema central del límite, error estándar, hipótesis, **diferencias entre grupos** ] ] -- .pull-right[ .content-box-green[ ## Ahora (Unidad 2) - Asociación: ¿en qué medida dos fenómenos (sociales) se encuentran **vinculados**? ] ] --- class: inverse middle center # ¿Por qué es importante estudiar **.yellow[asociación]** en ciencias sociales? --- # Ejemplo: ranking y privados en la educación superior <br> ## [https://observablehq.com/@elaval/perfil-de-carreras-segun-origen-escolar](https://observablehq.com/@elaval/perfil-de-carreras-segun-origen-escolar) --- class: roja ## Objetivos de la sesión de hoy <br> ### 1. Comprender los conceptos de covarianza y correlación ### 2. Aprender el cálculo de ambos coeficientes y su interpretación ### 3. Entender las limitaciones del coeficiente y su consideración en el cálculo e interpretación --- class: middle center # Lectura: Moore 97-131 Análisis de relaciones --- # Ejemplo minimalista: educación e ingreso - simulamos datos para - 8 casos - 8 niveles de .red[educación] (ej: desde basica incompleta=1 hasta postgrado=8) - 12 niveles de rangos de .red[ingreso] (ej: desde menos de 100.000=1 hasta más de 10.000.000=12) --- # Generación de datos para el ejemplo .pull-left[ ``` r educ <-c(2,3,4,4,5,7,8,8) ing <-c(1,3,3,5,4,7,9,11) data <-data.frame(educ,ing) ``` ] .pull-right[ .small[ ``` r kableExtra::kbl(data) ``` <table> <thead> <tr> <th style="text-align:right;"> educ </th> <th style="text-align:right;"> ing </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 3 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 3 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 4 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 7 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 9 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 11 </td> </tr> </tbody> </table> ] ] --- class: middle center ![](img/educ-ing1.png) --- class: inverse middle center ## Midiendo dispersión: <br> #### `$$Varianza=\sigma^{2}={\sum_{i=1}^{N}(x_{i}-\bar{x})^{2}\over {N - 1}}$$` --- .pull-left-narrow[ <br> <br> <br> <br> <br> `$$\sigma^{2}={\sum_{i=1}^{N}(x_{i}-\bar{x})^{2}\over {N - 1}}$$` ] .pull-right-wide[ ![:scale 100%](img/varianza2.png) ] --- .pull-left-narrow[ <br> <br> <br> <br> <br> `$$\sigma^{2}={\sum_{i=1}^{N}(x_{i}-\bar{x})^{2}\over {N - 1}}$$` ] .pull-right-wide[ ![:scale 100%](img/varianza3.png) ] --- ![](08-bivariada1_files/figure-html/unnamed-chunk-3-1.png)<!-- --> --- .pull-left[ # Varianza educación `$$Varianza=\sigma^{2}={\sum_{i=1}^{N}(x_{i}-\bar{x})^{2}\over {N - 1}}$$` .small[ ``` r mean(data$educ) ``` ``` [1] 5.125 ``` ``` r data$mean_educ <- mean(data$educ) data$dif_m_educ <- data$educ-data$mean_educ data$dif_m_educ2 <- (data$dif_m_educ)^2 ``` ]] -- .pull-right[ .small[ ``` r kbl(data, digits = 2) %>% scroll_box(width = "500px", height = "450px") ``` <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:450px; overflow-x: scroll; width:500px; "><table> <thead> <tr> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> id </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> educ </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> ing </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> mean_educ </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> dif_m_educ </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> dif_m_educ2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -3.12 </td> <td style="text-align:right;"> 9.77 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -2.12 </td> <td style="text-align:right;"> 4.52 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -1.12 </td> <td style="text-align:right;"> 1.27 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -1.12 </td> <td style="text-align:right;"> 1.27 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -0.12 </td> <td style="text-align:right;"> 0.02 </td> </tr> <tr> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> 1.88 </td> <td style="text-align:right;"> 3.52 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 9 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> 2.88 </td> <td style="text-align:right;"> 8.27 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 11 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> 2.88 </td> <td style="text-align:right;"> 8.27 </td> </tr> </tbody> </table></div> ] ] --- .pull-left[ .small[ <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:450px; overflow-x: scroll; width:500px; "><table> <thead> <tr> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> id </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> educ </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> ing </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> mean_educ </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> dif_m_educ </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> dif_m_educ2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -3.12 </td> <td style="text-align:right;"> 9.77 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -2.12 </td> <td style="text-align:right;"> 4.52 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -1.12 </td> <td style="text-align:right;"> 1.27 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -1.12 </td> <td style="text-align:right;"> 1.27 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> -0.12 </td> <td style="text-align:right;"> 0.02 </td> </tr> <tr> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> 1.88 </td> <td style="text-align:right;"> 3.52 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 9 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> 2.88 </td> <td style="text-align:right;"> 8.27 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 11 </td> <td style="text-align:right;"> 5.12 </td> <td style="text-align:right;"> 2.88 </td> <td style="text-align:right;"> 8.27 </td> </tr> </tbody> </table></div> ] .medium[ ``` r sum(data$dif_m_educ2) ``` ``` [1] 36.875 ``` ] ] -- .pull-right[ # Varianza educación `\begin{align*} Varianza =\sigma^{2} &={\sum_{i=1}^{N}(x_{i}-\bar{x})^{2}\over {N - 1}}\\ \sigma^{2} &={(36,875)\over {8 - 1}}\\ \sigma^{2} &= 5,267\\ \end{align*}` .small[ ``` r var(data$educ) ``` ``` [1] 5.267857 ``` ] ] --- # Varianza ingreso .pull-left[ .small[ ``` r mean(data$ing) ``` ``` [1] 5.375 ``` ``` r data$mean_ing <- mean(data$ing) data$dif_m_ing <- data$ing-data$mean_ing data$dif_m_ing2 <- (data$dif_m_ing)^2 sum(data$dif_m_ing2) ``` ``` [1] 79.875 ``` ]] .pull-right[ `\begin{align*} Varianza =\sigma^{2} &={\sum_{i=1}^{N}(x_{i}-\bar{x})^{2}\over {N - 1}}\\ \sigma^{2} &={(79,875)\over {8 - 1}}\\ \sigma^{2} &= 11.41071\\ \end{align*}` .medium[ ``` r var(data$ing) ``` ``` [1] 11.41071 ``` ] ] --- class: inverse ## ¿Por qué es importante la varianza? <br> .content-box-gray[ ###- .black[Indica la dispersion (variabilidad) de los datos en torno al promedio] ###- .black[Permite cuantificar relaciones entre variables:] .red[covarianza] ] --- # Asociación .pull-left-narrow[ .small[ <br> <table> <thead> <tr> <th style="text-align:right;"> id </th> <th style="text-align:right;"> educ </th> <th style="text-align:right;"> ing </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 3 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 3 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 4 </td> </tr> <tr> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 7 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 9 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 11 </td> </tr> </tbody> </table> ] ] .pull-right-wide[ .center[ ![:scale 80%](img/educ-ing5.png) ] ] --- .pull-left-narrow[ .medium[ ``` r plot1 <- ggplot(data, aes(x=educ, y=ing)) + geom_point( colour = "red", size = 5) + theme(text = element_text(size = 20)) ``` Nube de puntos: ]] .pull-right-wide[ ![](08-bivariada1_files/figure-html/unnamed-chunk-15-1.png)<!-- --> ] --- class: inverse middle center ## La **nube de puntos** o scatterplot es una representación gráfica de la asociación de dos variables, donde cada punto representa el valor de cada caso en cada una de las variables --- .pull-left-wide[ ![](08-bivariada1_files/figure-html/unnamed-chunk-16-1.png)<!-- --> ] .pull-right-narrow[ <br> <br> <br> <br> .content-box-red[ ¿Cómo expresar matemáticamente este patrón de asociación?] ] --- ## Hacia la covarianza .pull-left[ ![](08-bivariada1_files/figure-html/unnamed-chunk-17-1.png)<!-- --> .center[ ### Educación ] ] .pull-right[ ![](08-bivariada1_files/figure-html/unnamed-chunk-18-1.png)<!-- --> .center[ ### Ingreso ] ] --- # Covarianza .pull-left[ .center[ ### Varianza educación (x) `$$\sigma_{edu}^{2}={\sum_{i=1}^{N}(x_{i}-\bar{x})^{2}\over {N - 1}}$$` `$$\sigma_{edu}^{2}={\sum_{i=1}^{N}(x_{i}-\bar{x})(x_{i}-\bar{x})\over {N - 1}}$$` ] ] .pull-right[ .center[ ### Varianza ingreso (y) `$$\sigma_{ing}^{2}={\sum_{i=1}^{N}(y_{i}-\bar{y})^{2}\over {N - 1}}$$` `$$\sigma_{ing}^{2}={\sum_{i=1}^{N}(y_{i}-\bar{y})(y_{i}-\bar{y})\over {N - 1}}$$` ] ] -- .content-box-red[ `$$Covarianza=cov(x,y) = \frac{\sum_{i=1}^{N}(x_i - \bar{x})(y_i - \bar{y})} {N-1}$$` ] --- # Cálculo covarianza .pull-left-narrow[ .small[ ``` r data$dif_xy <- data$dif_m_educ* data$dif_m_ing ``` ``` r data %>% select(educ,ing, dif_m_educ, dif_m_ing, dif_xy) %>% kbl ``` ] ] -- .pull-right-wide[ .small[ <table> <thead> <tr> <th style="text-align:right;"> educ </th> <th style="text-align:right;"> ing </th> <th style="text-align:right;"> dif_m_educ </th> <th style="text-align:right;"> dif_m_ing </th> <th style="text-align:right;"> dif_xy </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> -3.125 </td> <td style="text-align:right;"> -4.375 </td> <td style="text-align:right;"> 13.671875 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> -2.125 </td> <td style="text-align:right;"> -2.375 </td> <td style="text-align:right;"> 5.046875 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> -1.125 </td> <td style="text-align:right;"> -2.375 </td> <td style="text-align:right;"> 2.671875 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> -1.125 </td> <td style="text-align:right;"> -0.375 </td> <td style="text-align:right;"> 0.421875 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> -0.125 </td> <td style="text-align:right;"> -1.375 </td> <td style="text-align:right;"> 0.171875 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 1.875 </td> <td style="text-align:right;"> 1.625 </td> <td style="text-align:right;"> 3.046875 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 9 </td> <td style="text-align:right;"> 2.875 </td> <td style="text-align:right;"> 3.625 </td> <td style="text-align:right;"> 10.421875 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 11 </td> <td style="text-align:right;"> 2.875 </td> <td style="text-align:right;"> 5.625 </td> <td style="text-align:right;"> 16.171875 </td> </tr> </tbody> </table> ``` r sum(data$dif_xy) ``` ``` [1] 51.625 ``` ] ] --- # Covarianza `\begin{align*} Covarianza=cov(x,y) &= \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {N-1} \\ &= \frac{51.625} {8-1} \\ &=7.375 \end{align*}` ``` r cov(data$educ,data$ing) ``` ``` [1] 7.375 ``` --- class: inverse center #### La .roja[covarianza] es una medida de asociación entre variables basada en la variabilidad de cada una de ellas -- #### La distancia del promedio del valor de una variable (residuo): ¿tiene relación con el residuo de otra variable? -- #### Expresa la medida en que los valores de cada variable se distancian respectivamente de su promedio -- #### .yellow[Su valor no es interpretable directamente] --- # Correlación producto-momento de Pearson .pull-left-narrow[ ![](img/pearson.png) ] .pull-right-wide[ <br> - Medida estandarizada de covarianza - Basada en los trabajos de Galton y de Bravais - Desarrollada por Karl Pearson (1857-1936): físico, matemático, estadístico y germanista. Y eugenista ... ] --- # Correlación producto-momento (Pearson): _r_ `\begin{align*} Covarianza = cov(x,y) &= \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {n-1}\\ \\ Correlación=r &= \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {(n-1)\sigma_x \sigma_y }\\ \\ &= \frac{\sum(x-\bar{x})(y-\bar{y})}{\sqrt{\sum(x-\bar{x})^{2} \sum(y-\bar{y})^{2}}} \end{align*}` --- ## Cálculo correlación r de Pearson .pull-left[ .small[ <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:450px; overflow-x: scroll; width:500px; "><table> <thead> <tr> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> educ </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> ing </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> dif_m_educ2 </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> dif_m_ing2 </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> dif_xy </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 9.77 </td> <td style="text-align:right;"> 19.14 </td> <td style="text-align:right;"> 13.67 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 4.52 </td> <td style="text-align:right;"> 5.64 </td> <td style="text-align:right;"> 5.05 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 1.27 </td> <td style="text-align:right;"> 5.64 </td> <td style="text-align:right;"> 2.67 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 1.27 </td> <td style="text-align:right;"> 0.14 </td> <td style="text-align:right;"> 0.42 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 0.02 </td> <td style="text-align:right;"> 1.89 </td> <td style="text-align:right;"> 0.17 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 3.52 </td> <td style="text-align:right;"> 2.64 </td> <td style="text-align:right;"> 3.05 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 9 </td> <td style="text-align:right;"> 8.27 </td> <td style="text-align:right;"> 13.14 </td> <td style="text-align:right;"> 10.42 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 11 </td> <td style="text-align:right;"> 8.27 </td> <td style="text-align:right;"> 31.64 </td> <td style="text-align:right;"> 16.17 </td> </tr> </tbody> </table></div> ] ] .pull-right[ `$$r=\frac{\sum(x-\bar{x})(y-\bar{y})}{\sqrt{\sum(x-\bar{x})^{2} \sum(y-\bar{y})^{2}}}$$` ``` r sum(data$dif_xy); sum(data$dif_m_educ2);sum(data$dif_m_ing2) ``` ``` [1] 51.625 ``` ``` [1] 36.875 ``` ``` [1] 79.875 ``` ] --- ## Cálculo correlación .pull-left[ `\begin{align*} r &= \frac{\sum(x-\bar{x})(y-\bar{y})}{\sqrt{\sum(x-\bar{x})^{2} \sum(y-\bar{y})^{2}}} \\ \\ &= \frac{51.625}{ \sqrt{36.875*79.875}} \\ \\ &= \frac{51.625}{54.271} \\ \\ &= 0.951 \end{align*}` ] -- .pull-right[ ``` r cor(data$educ,data$ing) ``` ``` [1] 0.9512367 ``` ] --- class: roja ## Interpretación - El coeficiente de correlación (de Pearson) es una medida de asociación lineal entre variables, que indica el sentido y la fuerza de la asociación -- - Varía entre +1 y -1, donde - valores .black[positivos] indican relación directa (aumenta una, aumenta la otra) - valores .black[negativos] indican relación inversa (aumenta una, disminuye la otra) --- # Nubes de puntos (scatterplot) .center[ ![](img/scatters.png)] --- # Nubes de puntos (scatterplot) .center[ ![](img/scatters2.png) ] --- # Nubes de puntos (scatterplot) .center[ ![](img/scatters3.png) ] --- class: middle center ## Adivine la correlación: # [guessthecorrelation.com](https://www.guessthecorrelation.com) --- # Nubes de puntos (scatterplot) .center[ ![](img/scatters4.png) ] --- # Limitaciones correlación - medida de asociación .roja[lineal] entre variables -- - no captura apropiadamente asociaciones no lineales -- - posee supuestos distribucionales de x e y (distribución normal) -- - sensible a valores extremos -- - un mismo coeficiente puede reflejar distintas distribuciones bivariadas --- .center[ ![:scale 80%](img/anscombe.png) ] --- class: inverse #Resumen ### - Asociación, explicación y ciencias sociales ### - Varianza y covarianza ### - Pearson: asociación en un número en rango fijo --- class: middle # Recomendación .pull-left[ ![](img/Alice_Lee.jpg) ] .pull-right[ <br> [Alice Lee: Correlación, inteligencia y tamaño del cráneo en hombres y mujeres](https://es.wikipedia.org/wiki/Alice_Lee) ] --- class: front .pull-left-wide[ # Estadística Correlacional] .pull-right-narrow[![:scale 85%](img/logo-correlacional-transp.png)] ## inferencia, asociación y reporte ---- .pull-left[ ## Juan Carlos Castillo ## Sociología FACSO - UChile ## 2do Sem 2024 ## [.orange[correlacional.netlify.com]](https://encuestas-sociales.netlify.com) ]