Modelo automático para la generación de catálogos de sistemas binarios eclipsantesPresentamos el Árbol de Decisión Compuesto (CDT), una herramienta automática para la generación de catálogos de sistemas binarios eclipsantes (EBs). Este modelo de aprendizaje automático supervisado forma parte de un pipeline que tiene como entrada series temporales de EBs y como salida la clasificación de estos sistemas en Detached, Semi-detached y Contact. El entrenamiento del modelo y su evaluación se realizó utilizando un catálogo de 100 EBs del sondeo VISTA Variables in the Vía Láctea Survey (VVV), utilizando la baldosa d040. El rendimiento de CDT para generar catálogos en otras baldosas se probó en la baldosa d078, obteniendo un buen rendimiento de clasificación en los tres tipos de EBs en comparación con la clasificación realizada visualmente. En el proceso, extrajimos características de las curvas de luz con feets (feATURES eXTRACTOR for tIME sERIES, Cabral et al. 2018) añadimos el cálculo de la diferencia de amplitud entre mínimos y los diferentes periodos. Después mediante MUTUAL INFORMATION generamos una lista de puntuaciones para 35 características, la puntuación depende de la correlación entre las características de las curvas de luz y las clases de EBs. Por último, utilizamos 3 modelos (M1, M2 y M3). Estos modelos se componen de árbol de decisión (DT), bosque aleatorio (RF), k-próximo más cercano (KNN) y clasificación por vectores lineales de soporte (LSVC), además de un sistema de votación. La clasificación se realiza mediante un árbol de decisión compuesto. En primer lugar, M1 clasifica las BS C y D. A continuación, en función del resultado, M2 clasifica las BS D y SD o M3 clasifica las BS C y SD. En Automated classification of eclipsing binary systems in the VVV Survey se muestra en detalle el esquema del proceso para determinar el mejor modelo para la clasificación de EBs. Y en el repositorio de vanedaza/CDT, además de una notebook para el uso del modelo CDT incluimos notebooks para la curación y preprocesado de datos, la generación de features, y una notebook se utiliza para generar un reporte en formato .tex que contiene las curvas de luz de los sistemas binarios eclipsantes y una tabla con información sobre el sistema y la clasificación. |
ROGER: Reconstructing Orbits of Galaxies in ExtremeRegions using machine learning techniquesLos cúmulos de galaxias constituyen los ambientes más extremos del Universo para la evolución de las mismas, por lo que las galaxias miembro de cúmulos van a presentar propiedades muy diferentes de las galaxias de campo o miembro de grupos menos masivos. Por otro lado, las técnicas de aprendizaje automático (machine learning) representan un nueva forma de analizar grandes set de datos de forma homogénea y, teniendo en cuenta el volumen de datos generado por los actuales y futuros relevamientos y simulaciones, estos métodos se transformaron en una herramienta fundamental para su análisis. En este trabajo presentamos ROGER (Reconstructing Orbits of Galaxies in Extreme Regions), un código de aprendizaje automático que relaciona la posición de una galaxia en el espacio de fases proyectado con su órbita 3D. Este software estima, para cada galaxia, la probabilidad de pertenecer a cada clase dinámica usando solamente la información 2D del espacio de fase proyectado, es decir, su distancia al centro del cúmulo (normalizada con R200) y su velocidad relativa al centro del cúmulo en la línea de la visual (normalizada con la dispersión de velocidades). Esté código fue entrenado y calibrado usando un catálogo sintético de cúmulos y galaxias construído en base al modelo semi-analítico SAG aplicado en la simulación cosmológica Multidark MDPL2. ROGER es completamente público y gratuito y puede ser utilizado como un páquete de R (para más detalles ver https://github.com/Martindelosrios/ROGER) o a través de una interfaz web online https://mdelosrios.shinyapps.io/roger_shiny/. Este proyecto fue desarrollado por Martín de los Rios, Julián Martínez, Valeria Coenda, Hernán Muriel, Andrés Ruiz, Cristian Vega y Sofia Cora y ha sido aceptado para su publicación en la revista internacional MNRAS. |
MeSsI (Merging Systems Identification)de los rios+16 2016MNRAS.458..226D Los cúmulos de galaxias en fusión proveen evidencia observacional sobre la existencia de la materia oscura, y pueden ser utilizados para estimar sus principales propiedades. Es por esto, que es necesario contar con catálogos de cúmulos en interacción homogéneos para realizar estudios estadísticos. En este trabajo presentamos el código MeSsI (Merging Systems Identification algorithm), un método de aprendizaje automático para la detección automática de cúmulos en fusión. Este software fue entrenado y calibrado utilizando catálogos sintéticos de cúmulos en interacción identificados en simulaciones cosmológicas mediante sus árboles de fusión. El código es completamente público y gratuito y puede ser descargo y utilizado como un paquete de R (https://github.com/Martindelosrios/MeSsI). Este proyecto fue desarrollado por Martín de los Ríos, Mariano Domínguez, Dante Paz y Manuel Merchán. |
Fargo 3D
|
Este proyecto presenta una biblioteca especializada para la astronomía de dominio temporal, que proporciona una colección de diversas características de curvas de luz para describir objetos celestes a través de sus cambios de luminosidad. La biblioteca utiliza algoritmos de aprendizaje automático para la clasificación, ofreciendo una herramienta colaborativa y abierta diseñada para simplificar el análisis universal de bases de datos fotométricos. Sus objetivos incluyen promover la estandarización entre encuestas y mejorar la eficiencia en tareas como modelado, clasificación, limpieza de datos, detección de valores atípicos y análisis general de datos. Más información: feets |