Integridad Ecosistémica Costera
un enfoque de ciencia abierta
Ciudad de México, 29 mayo 2024
¿Cómo sugerimos hacerlo?
Proposiciones causales
- Los experimentos formales son la regla de oro para resolver una proposición causal.
- Cuando no es posible hacer experimentos aleatorizados ¿qué podemos hacer?.
- Una posibilidad son las redes bayesianas que proponemos para este proyecto
- La revolución causal sin duda es relevante para la investigación observacional.
- Una red bayesiana es un DAG (directed acyclic graph).
Anatomía de un DAG
- Una red bayesiana es un modelo generativo.
- Identifica en forma completa la distribución conjunta tanto de la o las variables respuesta como de las explicativas.
- El DAG está compuesto de un diagrama causal y de un conjunto de tablas de probabilidad condicional.
Terminología básica de un DAG
- Nodo : una variable
- Arista : una relación causal, representada por una flecha
- Variable Explicativa : Es nuestro predictor causal de interés. Aquí es la representada por X . También se le llama variable independiente.
- Respuesta : En el DAG es la representada por Y . También se le llama variable dependiente.
- Ancestros : Nodos que están “aguas arriba” de una variable dada. En este DAG A y C son ancestros de X .
- Descendientes : Nodos que están “aguas abajo” de una variable en particular. En este DAG Y y B son descendientes de X .
Reglas de independencia condicional
Un DAG también describe aspectos clave del “flujo de la asociación” a través de la estructura causal.
Cuando las variables están conectadas, correlacionan, lo que implica que la información puede fluir entre ellas en cualquier dirección.
Hay tres reglas fundamentales sobre como se puede dar esta interconexión, es decir de como se separan o conectan los nodos.
Regla 2 “causa común”
Si una variable A es una causa común de las variables X e Y, y solo hay una ruta entre X e Y, entonces X e Y son condicionalmente independientes cuando se consideran como condicionantes los datos de A .
Regla 3 “colisionador”
Si una variable A es el nodo de colisión entre dos variables X e Y, y solo hay un camino entre X e Y, entonces X e Y son incondicionalmente independientes pero dependen condicionalmente de A así como de cualquier descendiente de A .
Separación-direccional (d-separation)
El flujo de información en una ruta p queda bloqueado por un conjunto de nodos Z si y sólo si:
p contiene una cadena de nodos A → B → C o una horquilla A ← B → C , de tal manera que el nodo medio B proporciona datos como criterio condicional de observación. Es decir si la ruta es del tipo variable intermedia o causa común, el condicionarlas bloquea.
p contiene un colisionador A → B ← C tal que ni el nodo de colisión B , ni ninguno de sus descendientes, son criterio para condicionar las observaciones. Es decir condicionar sobre un colisionador desbloquea .
Co-construir el DAG de Integridad costera…
Lo haremos con ayuda de un tablero Miro, con la siguiente rutina de integración del tablero:
- Los nodos serán notas adhesivas y los arcos conectores que indican la existencia (a veces sólo la sospecha) de interacción causal entre variables.
…Co-construir el DAG de Integridad costera…
- Cada Nodo deberá ser representado por una sola Nota adhesiva (“sticky note”). En este papelito conviene definir operacionalmente la variable, especificar la escala de medición y posible patrón de discretización o conjunto de niveles que puede tomar.
…Co-construir el DAG de Integridad costera…
- Cada nodo deberá tener una etiqueta vinculada, que especifique el nombre de la variable que lo representará en forma única en la base de datos.. Se recomienda usar nombres cortos, sin marcas diacríticas o símbolos, ni espacios. Como separador usar guión bajo.
- La información reunida en Miro será transferida a R y a Netica para su procesamiento formal
Ciencia Abierta y principios FAIR
- La producción de datos abiertos considera los principios FAIR.
- Son un conjunto de recomendaciones para la gestión y cuidado de los datos científicos .
- La sigla FAIR calificar a los datos científicos en virtud de su Findability, Accessibility, Interoperability, and Reuse. Existe el sitio goFAIR que promueve la adopción de estos principios.
Calidad de los datos
- La calidad y apertura práctica de los datos exige mantenerlos en las mejores condiciones posibles, es decir curarlos.
- Consideramos las recomendaciones que ofrece el Digital Curation Center.
- Su lema es suficientemente elocuente: ¡Porque la buena investigación necesita buenos datos!.
¿Qué tan abiertos son nuestros datos?
- De acuerdo con los principio FAIR, los datos pueden estar en distintos niveles de acceso abierto.
- La escalera de estructuración y acceso que se ilustra da ideas de esto y de los procesos involucrados.
Está presentación es de acceso abierto
Fue producida en RStudio con la ayuda de la plataforma Quarto. Nos proponemos integrar el reporte de este proyecto con estas mismas tecnologías. Por lo pronto, pueden acceder a esta presentación en esta liga (también con el QR que sigue):