Los datos son una expresión numérica de la medición de al menos una característica de a lo menos una unidad en a lo menos un punto en el tiempo
Característica (variable) : esperanza de vida
Unidad: Años
Punto en el tiempo: 2017
“asignar números, símbolos o valores a las propiedades de objetos o eventos de acuerdo con reglas” (Stevens, 1951)
Vincula conceptos abstractos con indicadores empíricos
Exhaustividad: el mayor número de categorías significativas.
Exclusividad: atributos mutuamente excluyentes
Una variable representa cualquier cosa o propiedad que varia y a la cuál se le asigna un valor. Es decir:
Variable≠ConstanteVariable≠Constante
Pueden ser visibles o no visibles/latentes. (Ej: peso / inteligencia)
discretas (Rango finito de valores):
continuas:
Descripción básica de una variable:
Moda: valor que ocurre más frecuentemente
Mediana: valor medio de la distribución ordenada. Si N es par, entonces es el promedio de los valores medios
Media o promedio aritmético: suma de los valores dividido por el total de casos
Pregunta de tendencia central:
Cuando se analizan datos, 2 cosas principales
cálculo del estadístico:
promedio
desviación estándar
correlación
...
inferencia: ¿existe este estadístico en la población?
probabilidad
error
significación
¿En qué medida se pueden relacionar resultados que se encuentran en un (sub)conjunto de unidades con lo que ocurre en general?
¿En qué medida se pueden relacionar resultados que se encuentran en un (sub)conjunto de unidades con lo que ocurre en general?
Ej: si en un subconjunto de la población encuentro que el promedio de matemáticas es mayor en mujeres que en hombres ¿es esto un reflejo de lo que ocurre en general, o se debe solo al azar? ¿se puede extrapolar a la poblacion?
mapa y territorio, Borges lidiando con el caos y la incertidumbre la domesticación de la casualidad error
En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el mapa de una sola Provincia ocupaba toda una Ciudad, y el mapa del Imperio, toda una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el tamaño del Imperio y coincidía puntualmente con él.
Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y los Inviernos. En los desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas.
Suárez Miranda, Viajes de Varones Prudentes, Libro Cuarto, Cap. XLV, Lérida, 1658.
En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el mapa de una sola Provincia ocupaba toda una Ciudad, y el mapa del Imperio, toda una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el tamaño del Imperio y coincidía puntualmente con él.
Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y los Inviernos. En los desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas.
Suárez Miranda, Viajes de Varones Prudentes, Libro Cuarto, Cap. XLV, Lérida, 1658.
Borges - Del Rigor de la Ciencia
Población (parámetro) | Muestra (estadístico) | |
---|---|---|
Promedio | μμ | ˉx¯x |
Varianza | σ²σ² | s²s² |
Desviación estándar | σσ | ss |
Correlación | ρρ | rr |
¿Cómo es posible que la media x̄ obtenida a partir de una muestra de unos pocos hogares de todos los del país, pueda ser una estimación precisa de µ?
Una segunda muestra aleatoria obtenida en el mismo momento estaría formada por hogares distintos y, sin duda, daría un valor distinto de x̄
Variabilidad muestral: el valor de un estadístico varía en un muestreo aleatorio repetido
¿Cuánto varía?
¿En qué rangos?
¿Qué tan probable es el rango de variación?
¿Es un rango aceptable en términos de investigación social?
Llamamos a un fenómeno aleatorio si los resultados individuales son inciertos y, sin embargo, existe una distribución regular de los resultados después de un gran número de repeticiones.
Llamamos a un fenómeno aleatorio si los resultados individuales son inciertos y, sin embargo, existe una distribución regular de los resultados después de un gran número de repeticiones.
La probabilidad de cualquier resultado de un fenómeno aleatorio es la proporción de veces que el resultado se da después de una larga serie de repeticiones
El comportamiento del azar es impredecible con pocas repeticiones pero presenta un comportamiento regular y predecible con muchas repeticiones.
Cerca del año 1900, el estadístico inglés Karl Pearson lanzó al aire una moneda 24.000 veces. El resultado: 12.012 caras, una proporción de 0,5005.
Tenemos 1 dado, cuál es la probabilidad de que salga 3 al lanzarlo?
S={1,2,3,4,5,6}S={1,2,3,4,5,6}
N del espacio muestral= 6 sucesos posibles
Probabilidad de que salga 3 al tirar el dado= 16=0.16616=0.166
Eventos posibles (espacio muestral S) = 6 = (1,2,3,4,5,6)
P(x)≥4=P(4)+P(5)+P(6)=0.1¯6+0.1¯6+0.1¯6=0.5
Ej: suma de 2 dados al azar repetidos
si extraemos repetidamente 2 dados, y obtenemos su promedio, el gráfico de frecuencias tenderá a una forma acampanada
esto ocurre simplemente porque la probabilidad de valores extremos (como promedio 1 o promedio 6) es mucho menor que la de obtener valores centrales
por lo tanto, podemos aproximarnos al promedio de la población mediante el promedio de los promedios de muchas muestras
ahora ...
# Generar todas las combinaciones posibles de dos dadosdado1 <- rep(1:6, each = 6)dado2 <- rep(1:6, times = 6)# Calcular la suma y el promedio para cada combinaciónsuma <- dado1 + dado2promedio <- suma / 2# Crear un data frame con los resultadosresultados <- data.frame(dado1, dado2, suma, promedio)# Mostrar el data frameprint(resultados)# Cargar la librería para gráficoslibrary(ggplot2)# Gráfico de frecuencias para la sumaggplot(resultados, aes(x = suma)) + geom_bar() + labs(title = "Gráfico de Frecuencias de la Suma", x = "Suma", y = "Frecuencia")# Gráfico de frecuencias para los promediosggplot(resultados, aes(x = promedio)) + geom_bar() + labs(title = "Gráfico de Frecuencias de los Promedios", x = "Promedio", y = "Frecuencia")
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
o | Tile View: Overview of Slides |
s | Toggle scribble toolbox |
Esc | Back to slideshow |
Los datos son una expresión numérica de la medición de al menos una característica de a lo menos una unidad en a lo menos un punto en el tiempo
Característica (variable) : esperanza de vida
Unidad: Años
Punto en el tiempo: 2017
“asignar números, símbolos o valores a las propiedades de objetos o eventos de acuerdo con reglas” (Stevens, 1951)
Vincula conceptos abstractos con indicadores empíricos
Exhaustividad: el mayor número de categorías significativas.
Exclusividad: atributos mutuamente excluyentes
Una variable representa cualquier cosa o propiedad que varia y a la cuál se le asigna un valor. Es decir:
Variable≠Constante
Pueden ser visibles o no visibles/latentes. (Ej: peso / inteligencia)
discretas (Rango finito de valores):
continuas:
Descripción básica de una variable:
Moda: valor que ocurre más frecuentemente
Mediana: valor medio de la distribución ordenada. Si N es par, entonces es el promedio de los valores medios
Media o promedio aritmético: suma de los valores dividido por el total de casos
Pregunta de tendencia central:
Cuando se analizan datos, 2 cosas principales
cálculo del estadístico:
promedio
desviación estándar
correlación
...
inferencia: ¿existe este estadístico en la población?
probabilidad
error
significación
¿En qué medida se pueden relacionar resultados que se encuentran en un (sub)conjunto de unidades con lo que ocurre en general?
¿En qué medida se pueden relacionar resultados que se encuentran en un (sub)conjunto de unidades con lo que ocurre en general?
Ej: si en un subconjunto de la población encuentro que el promedio de matemáticas es mayor en mujeres que en hombres ¿es esto un reflejo de lo que ocurre en general, o se debe solo al azar? ¿se puede extrapolar a la poblacion?
mapa y territorio, Borges lidiando con el caos y la incertidumbre la domesticación de la casualidad error
En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el mapa de una sola Provincia ocupaba toda una Ciudad, y el mapa del Imperio, toda una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el tamaño del Imperio y coincidía puntualmente con él.
Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y los Inviernos. En los desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas.
Suárez Miranda, Viajes de Varones Prudentes, Libro Cuarto, Cap. XLV, Lérida, 1658.
En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el mapa de una sola Provincia ocupaba toda una Ciudad, y el mapa del Imperio, toda una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el tamaño del Imperio y coincidía puntualmente con él.
Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y los Inviernos. En los desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas.
Suárez Miranda, Viajes de Varones Prudentes, Libro Cuarto, Cap. XLV, Lérida, 1658.
Borges - Del Rigor de la Ciencia
Población (parámetro) | Muestra (estadístico) | |
---|---|---|
Promedio | μ | ˉx |
Varianza | σ² | s² |
Desviación estándar | σ | s |
Correlación | ρ | r |
¿Cómo es posible que la media x̄ obtenida a partir de una muestra de unos pocos hogares de todos los del país, pueda ser una estimación precisa de µ?
Una segunda muestra aleatoria obtenida en el mismo momento estaría formada por hogares distintos y, sin duda, daría un valor distinto de x̄
Variabilidad muestral: el valor de un estadístico varía en un muestreo aleatorio repetido
¿Cuánto varía?
¿En qué rangos?
¿Qué tan probable es el rango de variación?
¿Es un rango aceptable en términos de investigación social?
Llamamos a un fenómeno aleatorio si los resultados individuales son inciertos y, sin embargo, existe una distribución regular de los resultados después de un gran número de repeticiones.
Llamamos a un fenómeno aleatorio si los resultados individuales son inciertos y, sin embargo, existe una distribución regular de los resultados después de un gran número de repeticiones.
La probabilidad de cualquier resultado de un fenómeno aleatorio es la proporción de veces que el resultado se da después de una larga serie de repeticiones
El comportamiento del azar es impredecible con pocas repeticiones pero presenta un comportamiento regular y predecible con muchas repeticiones.
Cerca del año 1900, el estadístico inglés Karl Pearson lanzó al aire una moneda 24.000 veces. El resultado: 12.012 caras, una proporción de 0,5005.
Tenemos 1 dado, cuál es la probabilidad de que salga 3 al lanzarlo?
S={1,2,3,4,5,6}
N del espacio muestral= 6 sucesos posibles
Probabilidad de que salga 3 al tirar el dado= 16=0.166
Eventos posibles (espacio muestral S) = 6 = (1,2,3,4,5,6)
P(x)≥4=P(4)+P(5)+P(6)=0.1¯6+0.1¯6+0.1¯6=0.5
Ej: suma de 2 dados al azar repetidos
si extraemos repetidamente 2 dados, y obtenemos su promedio, el gráfico de frecuencias tenderá a una forma acampanada
esto ocurre simplemente porque la probabilidad de valores extremos (como promedio 1 o promedio 6) es mucho menor que la de obtener valores centrales
por lo tanto, podemos aproximarnos al promedio de la población mediante el promedio de los promedios de muchas muestras
ahora ...
# Generar todas las combinaciones posibles de dos dadosdado1 <- rep(1:6, each = 6)dado2 <- rep(1:6, times = 6)# Calcular la suma y el promedio para cada combinaciónsuma <- dado1 + dado2promedio <- suma / 2# Crear un data frame con los resultadosresultados <- data.frame(dado1, dado2, suma, promedio)# Mostrar el data frameprint(resultados)# Cargar la librería para gráficoslibrary(ggplot2)# Gráfico de frecuencias para la sumaggplot(resultados, aes(x = suma)) + geom_bar() + labs(title = "Gráfico de Frecuencias de la Suma", x = "Suma", y = "Frecuencia")# Gráfico de frecuencias para los promediosggplot(resultados, aes(x = promedio)) + geom_bar() + labs(title = "Gráfico de Frecuencias de los Promedios", x = "Promedio", y = "Frecuencia")