+ - 0:00:00
Notes for current slide
Notes for next slide

Estadística Correlacional

Inferencia, asociación y reporte


Juan Carlos Castillo

Sociología FACSO - UChile

2do Sem 2024

correlacional.netlify.com

Inferencia 1:

Datos, probabilidad y distribuciones muestrales

1 / 45

Objetivos de la sesión de hoy


1. Recordar y nivelar aprendizajes previos a este curso, fundamentalmente respecto al manejo de datos, medición y varianza

2. Introducción a probablidad, distribuciones muestrales e inferencia

2 / 45

Contenidos



Bases

Probabilidad e inferencia

3 / 45

Contenidos



Bases

Probabilidad e inferencia

4 / 45

Datos

  • Los datos son una expresión numérica de la medición de al menos una característica de a lo menos una unidad en a lo menos un punto en el tiempo
5 / 45

Datos

  • Los datos son una expresión numérica de la medición de al menos una característica de a lo menos una unidad en a lo menos un punto en el tiempo

    • Ejemplo: La esperanza de vida en Chile el 2017 fue de 79,9 años
    • Característica (variable) : esperanza de vida

    • Unidad: Años

    • Punto en el tiempo: 2017

5 / 45

Medir

  • “asignar números, símbolos o valores a las propiedades de objetos o eventos de acuerdo con reglas” (Stevens, 1951)

  • Vincula conceptos abstractos con indicadores empíricos

6 / 45

Medir: requisitos básicos


  • Exhaustividad: el mayor número de categorías significativas.

    • Ej: ¿Qué categorías se deben considerar para población migrante?
  • Exclusividad: atributos mutuamente excluyentes

7 / 45

Ejemplos de estudios / bases de datos

  1. Encuesta Centro de Estudios Públicos

  2. Encuesta CASEN

  3. Encuesta Lapop

  4. ELSOC

8 / 45

Variables

  • Una variable representa cualquier cosa o propiedad que varia y a la cuál se le asigna un valor. Es decir:

  • VariableConstanteVariableConstante

  • Pueden ser visibles o no visibles/latentes. (Ej: peso / inteligencia)

9 / 45

Variables

  • discretas (Rango finito de valores):

    • Dicotómicas
    • Politómicas
  • continuas:

    • Rango (teóricamente) infinito de valores.
10 / 45

Tendencia Central

Descripción básica de una variable:

  • Moda: valor que ocurre más frecuentemente

  • Mediana: valor medio de la distribución ordenada. Si N es par, entonces es el promedio de los valores medios

  • Media o promedio aritmético: suma de los valores dividido por el total de casos

11 / 45

Pregunta de tendencia central:

¿Puede la mayoría ganar menos ingresos que el promedio?

12 / 45

Dispersión:

Varianza

13 / 45

Dispersión:

Varianza

14 / 45

Dispersión:

Varianza

15 / 45

Dispersión:

16 / 45

La VARIANZA equivale al promedio de la suma de las diferencias del promedio al cuadrado

17 / 45

Desviación Estándar


  • Raiz Cuadrada de la varianza.
  • Expresada en la mismas unidades que los puntajes de la escala original
18 / 45

Contenidos



Bases

Probabilidad e inferencia

19 / 45

Inferencia: la otra parte del análisis

Cuando se analizan datos, 2 cosas principales

  • cálculo del estadístico:

    • promedio

    • desviación estándar

    • correlación

    • ...

  • inferencia: ¿existe este estadístico en la población?

    • probabilidad

    • error

    • significación

20 / 45

21 / 45

Inferencia

¿En qué medida se pueden relacionar resultados que se encuentran en un (sub)conjunto de unidades con lo que ocurre en general?

22 / 45

Inferencia

¿En qué medida se pueden relacionar resultados que se encuentran en un (sub)conjunto de unidades con lo que ocurre en general?

Ej: si en un subconjunto de la población encuentro que el promedio de matemáticas es mayor en mujeres que en hombres ¿es esto un reflejo de lo que ocurre en general, o se debe solo al azar? ¿se puede extrapolar a la poblacion?

22 / 45

mapa y territorio, Borges lidiando con el caos y la incertidumbre la domesticación de la casualidad error

En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el mapa de una sola Provincia ocupaba toda una Ciudad, y el mapa del Imperio, toda una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el tamaño del Imperio y coincidía puntualmente con él.

Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y los Inviernos. En los desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas.

Suárez Miranda, Viajes de Varones Prudentes, Libro Cuarto, Cap. XLV, Lérida, 1658.

23 / 45

En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el mapa de una sola Provincia ocupaba toda una Ciudad, y el mapa del Imperio, toda una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el tamaño del Imperio y coincidía puntualmente con él.

Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y los Inviernos. En los desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas.

Suárez Miranda, Viajes de Varones Prudentes, Libro Cuarto, Cap. XLV, Lérida, 1658.

Borges - Del Rigor de la Ciencia

23 / 45

Conceptos claves de inferencia

  • La inferencia en estadística se refiere a la relación que existe entre los resultados obtenidos basados en nuestra muestra y la población
24 / 45

Conceptos claves de inferencia

  • La inferencia en estadística se refiere a la relación que existe entre los resultados obtenidos basados en nuestra muestra y la población
  • ¿En qué medida podemos hacer inferencias desde nuestra muestra a la población?
24 / 45

Conceptos claves de inferencia

  • La inferencia en estadística se refiere a la relación que existe entre los resultados obtenidos basados en nuestra muestra y la población
  • ¿En qué medida podemos hacer inferencias desde nuestra muestra a la población?
  • Un concepto central es la probabilidad de ERROR
24 / 45

Parámetros y estadísticos


Población (parámetro) Muestra (estadístico)
Promedio μμ ˉx¯x
Varianza σ²σ² s²s²
Desviación estándar σσ ss
Correlación ρρ rr
25 / 45

Muestreo y variabilidad

¿Cómo es posible que la media x̄ obtenida a partir de una muestra de unos pocos hogares de todos los del país, pueda ser una estimación precisa de µ?

Una segunda muestra aleatoria obtenida en el mismo momento estaría formada por hogares distintos y, sin duda, daría un valor distinto de x̄

26 / 45

Muestreo y variabilidad

Variabilidad muestral: el valor de un estadístico varía en un muestreo aleatorio repetido

¿Cuánto varía?

¿En qué rangos?

¿Qué tan probable es el rango de variación?

¿Es un rango aceptable en términos de investigación social?

27 / 45

28 / 45

Aleatoriedad y probabilidad


Llamamos a un fenómeno aleatorio si los resultados individuales son inciertos y, sin embargo, existe una distribución regular de los resultados después de un gran número de repeticiones.

29 / 45

Aleatoriedad y probabilidad


Llamamos a un fenómeno aleatorio si los resultados individuales son inciertos y, sin embargo, existe una distribución regular de los resultados después de un gran número de repeticiones.

La probabilidad de cualquier resultado de un fenómeno aleatorio es la proporción de veces que el resultado se da después de una larga serie de repeticiones

29 / 45

Azar y repetición

El comportamiento del azar es impredecible con pocas repeticiones pero presenta un comportamiento regular y predecible con muchas repeticiones.

30 / 45

(Dato freak)

Cerca del año 1900, el estadístico inglés Karl Pearson lanzó al aire una moneda 24.000 veces. El resultado: 12.012 caras, una proporción de 0,5005.

31 / 45

Dados

Tenemos 1 dado, cuál es la probabilidad de que salga 3 al lanzarlo?

  • Espacio muestral S= conjunto de todos los resultados posibles

S={1,2,3,4,5,6}S={1,2,3,4,5,6}

  • N del espacio muestral= 6 sucesos posibles

  • Probabilidad de que salga 3 al tirar el dado= 16=0.16616=0.166

32 / 45

Un modelo de probabilidad para un fenómeno aleatorio consiste en un espacio muestral S y una asignación de probabilidades P.

33 / 45

Un modelo de probabilidad para un fenómeno aleatorio consiste en un espacio muestral S y una asignación de probabilidades P.

El espacio muestral S es el conjunto de todos los resultados posibles de un fenómeno aleatorio.

33 / 45

Un modelo de probabilidad para un fenómeno aleatorio consiste en un espacio muestral S y una asignación de probabilidades P.

El espacio muestral S es el conjunto de todos los resultados posibles de un fenómeno aleatorio.

Un suceso es un conjunto de resultados. P asigna un número P(A) a un suceso A como su probabilidad.

33 / 45

Reglas modelo de probabilidad

34 / 45

Dados, probabilidades y distribuciones


Ejercicio:

  • probar lanzando 1 dado repetidas veces

  • probar con 2 dados

  • ... y con 6

-> link

35 / 45

Dados, probabilidades y áreas

36 / 45

Dados, probabilidades y áreas

37 / 45

Dados, probabilidades y áreas

38 / 45

Dados, probabilidades y áreas


Eventos posibles (espacio muestral S) = 6 = (1,2,3,4,5,6)

P(x)4=P(4)+P(5)+P(6)=0.1¯6+0.1¯6+0.1¯6=0.5

39 / 45

Sucesos con distinta probabilidad

Ej: suma de 2 dados al azar repetidos

40 / 45

Distribución muestral del promedio

  • si extraemos repetidamente 2 dados, y obtenemos su promedio, el gráfico de frecuencias tenderá a una forma acampanada

  • esto ocurre simplemente porque la probabilidad de valores extremos (como promedio 1 o promedio 6) es mucho menor que la de obtener valores centrales

  • por lo tanto, podemos aproximarnos al promedio de la población mediante el promedio de los promedios de muchas muestras

41 / 45

ahora ...

¿Cómo estimar el promedio de los promedios con una sola muestra?

🤔

42 / 45

Próxima clase

-> Error estándar y distribución normal ... o cómo estimar el promedio de los promedios con una sola muestra

43 / 45

Y tarea:

# Generar todas las combinaciones posibles de dos dados
dado1 <- rep(1:6, each = 6)
dado2 <- rep(1:6, times = 6)
# Calcular la suma y el promedio para cada combinación
suma <- dado1 + dado2
promedio <- suma / 2
# Crear un data frame con los resultados
resultados <- data.frame(dado1, dado2, suma, promedio)
# Mostrar el data frame
print(resultados)
# Cargar la librería para gráficos
library(ggplot2)
# Gráfico de frecuencias para la suma
ggplot(resultados, aes(x = suma)) +
geom_bar() +
labs(title = "Gráfico de Frecuencias de la Suma", x = "Suma", y = "Frecuencia")
# Gráfico de frecuencias para los promedios
ggplot(resultados, aes(x = promedio)) +
geom_bar() +
labs(title = "Gráfico de Frecuencias de los Promedios", x = "Promedio", y = "Frecuencia")
44 / 45

Estadística Correlacional

Inferencia, asociación y reporte


Juan Carlos Castillo

Sociología FACSO - UChile

2do Sem 2024

correlacional.netlify.com

45 / 45

Objetivos de la sesión de hoy


1. Recordar y nivelar aprendizajes previos a este curso, fundamentalmente respecto al manejo de datos, medición y varianza

2. Introducción a probablidad, distribuciones muestrales e inferencia

2 / 45
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
oTile View: Overview of Slides
sToggle scribble toolbox
Esc Back to slideshow