En respuesta a la pandemia de COVID-19, el Instituto Allen de Inteligencia Artificial se ha asociado con los principales grupos de investigación para preparar y distribuir el Conjunto de Datos de Investigación Abierta COVID-19 (CORD-19), un recurso gratuito de más de 29.000 artículos académicos, incluidos más de 13.000 con texto completo, sobre COVID-19 y la familia de virus coronavirus para su uso por la comunidad de investigación mundial.
Este conjunto de datos tiene por objeto movilizar a los investigadores para que apliquen los recientes avances en el procesamiento del lenguaje natural con el fin de generar nuevos conocimientos en apoyo de la lucha contra esta enfermedad infecciosa. El corpus se actualizará semanalmente a medida que se publiquen nuevas investigaciones en publicaciones revisadas por pares y servicios de archivo como bioRxiv, medRxiv y otros.
Kaggle está organizando el COVID-19 Open Research Dataset Challenge, una serie de preguntas importantes diseñadas para inspirar a la comunidad a usar CORD-19 para encontrar nuevos conocimientos sobre la pandemia de COVID-19, incluyendo la historia natural, la transmisión y el diagnóstico del virus, las medidas de gestión en la interfaz humano-animal y las lecciones de estudios epidemiológicos anteriores .
Al descargar este conjunto de datos, usted acepta la Licencia de conjunto de datos. La información de licencia específica para artículos individuales en el conjunto de datos está disponible en el archivo de metadatos.
La última versión contiene documentos hasta 2020-03-13 con más de 13,000 artículos de texto completo.
Para acceder a los documentos pinche Semantic Scholar de AI2