HCA: Planes de Análisis Pre-experimentos

class: center, middle, inverse
background-image: url("figs/hca.jpg")
background-position: center
background-size: cover

# Haciendo Ciencia Abierta

## Dia 1
### Ignacio Sarmiento-Barbieri
---

class: middle

### Agenda

- Hoy: 
  
  - [Fernando Hoces de la Guardia](https://www.bitss.org/people/fernando-hoces-de-la-guardia/): `Transparencia en Investigación: Problemas y Soluciones`
  
  - Planes de Análisis Pre-experimentos (PAP)
  
  - El marco MIDA 
    - Ejemplos en `R` con `DeclareDesign`
  
---

# Objetivos de los planes de análisis previo

## Tres Objetivos:

- Establecer (y acordar) intenciones y expectativas ex ante
     
  - Evitar malos análisis de datos ex-post
     
  - Mejorar diseños

---

# Establecer intenciones y expectativas ex-ante

- Un hallazgo de efecto heterogéneo es más creíble cuando se especifica previamente
     
 - Las afirmaciones de que los resultados son "sorprendentes" son más creíbles cuando el PAP documenta la expectativa opuesta
     
 - A veces, los miembros del equipo y los socios no están de acuerdo sobre lo que ''quisimos hacer todo el tiempo'': los PAP son un buen lugar para resolver eso de antemano.

---

# Evitar malos análisis  de datos ex-post

- p-hacking
    
  - Cambio de variables de resultados
    
  - Análisis de subgrupos por conveniencia

---

# Los PAP no son contratos inquebrantables

... eso es probablemente algo bueno

- ¡La gente prerregistra malos análisis!
     
   - Aprendemos sobre nuevos / mejores análisis
  
   -  Los revisores tendrán su opinión

... con lamentables consecuencias

- Incluso con los PAP, la gente hace sus malos análisis ex-post todo el tiempo

---

# El objetivo principal: mejorar los diseños.

- El momento de escribir un plan de preanálisis suele ser la primera vez que pensamos en el diseño en su totalidad.
  
  - Hacer el cambio de "buena idea" a "diseño real" significa ser específico
  
  - Este es el momento de participar en la declaración de diseño

---
# MIDA

---
# MIDA: Cuatro elementos de cualquier diseño de investigación.

- Modelo: conjunto de modelos posibles de como funciona el mundo
  
  - Pregunta (Inquiry): una pregunta formulada en términos del modelo.
  
  - Datos: el conjunto de procedimientos que utilizamos para recopilar información del mundo (muestreo, asignación, medición)
     
  - Respuesta (Answer): cómo resumimos los datos producidos por la estrategia de datos

---
# Mida: Modelo

- Los modelos son abstracciones teóricas que utilizamos para dar sentido al mundo y organizar nuestra comprensión de él. 
    - Desempeñan varios roles críticos en el diseño de la investigación. 
      1. Los modelos describen las unidades, las condiciones y los resultados que definen la pregunta de investigación. Sin modelos bien especificados, no podemos hacer preguntas bien especificadas.
      2. Los modelos proporcionan un marco para evaluar los procedimientos de muestreo, asignación y medición.
      3. Los modelos proporcionan un marco para evaluar las estrategias de respuesta: ¿En qué variables debemos condicionar, en cuáles no? ¿Qué tan flexible o rígido debe ser nuestro procedimiento de estimación?

---
# Mida: Modelo

- Necesitamos imaginar modelos para poder construir y diagnosticar diseños de investigación. 
 
 - Esto puede ser incómodo!
 
    - Para calcular el error cuadrático medio, el sesgo o el poder  de un diseño, necesitamos escribir más de lo que sabemos con certeza en el modelo. 
 
    - Tenemos que describir distribuciones conjuntas de covariables, tratamientos y resultados, lo que implica hacer conjeturas sobre las mismas medias, covarianzas y tamaños de los efectos! 
    
    
---
# Mida: Pregunta (Inquiry)

- Es pregunta que le hacemos al modelo.

- Muchas veces solemos comenzar al revés, primero con los datos, sin ningún objetivo particular

- Momento Eureka!
  
--

- Definimos la pregunta
  
---
# Mida: Pregunta (Inquiry)

- El proceso es al revés

- Es imposible diseñar un proyecto de investigación sin tener una pregunta que nos interesa responder.

- Esto no quiere decir que en el proceso no aprendamos cosas nuevas o inesperadas en el transcurso

---
# Mida: Pregunta (Inquiry)

- En este curso, cuando hablamos de pregunta (inquiry) vamos a referirnos a resúmenes de modelos en un sólo número.

- Las preguntas pueden ser:
  
  - Descriptivas: medias, medias condicionales, correlaciones, etc.
  
  - Causales: ATE, CATE, etc
  
  - Predictivas: BLUP, etc.

---
# Mida: Datos

- Para poder responder la pregunta de nuestro modelo, tenemos que recoger datos

- Dependiendo que queremos hacer vamos a tener que tomar distintas desiciones
  - Formas de obtener muestras, 
  
  - Asignación a tratamientos
  
  - Medición: como convertimos la información sobre las unidades muestreadas en datos.

---
# Mida: Respuesta (Answer)

- La respuesta es lo que vamos a hacer con la información que recogimos en el paso anterior: usamos regresión lineal? Probit?

- En la práctica, a menudo necesitamos seleccionar entre estrategias de respuesta que podrían ser todas apropiadas, pero que tienen diferentes fortalezas y debilidades.

- Por ejemplo, algunos pueden sufrir menos de sesgo, mientras que otros pueden ser más precisos. En otras palabras, qué estrategia de respuesta es la mejor depende de los diagnósticos que le interesen.

- La clase más común de estrategias de respuesta son los estimadores puntuales: la media muestral, diferencia de medias, etc