Pistoia Alliance lanza nuevo DataFAIRy: proyecto de bioensayo para hacer más datos legibles por máquina y para

Science

Pistoia Alliance, una alianza global sin fines de lucro que aboga por una mayor colaboración en I + D en ciencias de la vida, lanza hoy la segunda fase de su proyecto DataFAIRy: Bioensayo, que tiene como objetivo convertir datos de bioensayo en formatos legibles por máquina que se adhieran a la Principios rectores FAIR de Localizable, Accesible, Interoperable y Reutilizable. La fase piloto actual ha sido patrocinada por AstraZeneca, Bristol Myers Squib, Novartis y Roche, y ha anotado con éxito 496 ensayos utilizando un modelo de procesamiento del lenguaje natural que se ha creado a medida para reconocer el lenguaje de las ciencias de la vida. Esta segunda fase tiene como objetivo escalar el proceso de anotación de 10 a 100 veces y, finalmente, promover el modelo de datos para que se convierta en el estándar de la industria. Los ensayos biológicos son métodos analíticos que son cruciales para probar los compuestos que se están considerando para nuevos medicamentos, así como para monitorear la toxicidad ambiental. Actualmente existen más de 1.3 millones de protocolos de análisis biológicos que existen en formatos de texto sin formato, como artículos publicados o notas de proveedores. La selección y validación de los ensayos requiere actualmente una búsqueda laboriosa, que lleva a los científicos hasta 12 semanas por ensayo. La adhesión al modelo DataFAIRy reducirá el tiempo que los científicos dedican a buscar y planificar experimentos de ensayo. Además, los metadatos de ensayo son un tipo de datos popular para la minería de datos post-hoc. Pero la mayoría de estos datos y metadatos publicados no están en un formato adecuado para la minería automatizada. Están parcialmente anotados en bancos de datos públicos, pero el volumen, la profundidad y la calidad de estas anotaciones son inadecuados para abordar muchas cuestiones comerciales actuales y futuras. Sin embargo, Gartner predice que el 85 por ciento de los proyectos de inteligencia artificial generarán resultados erróneos debido a problemas de datos, por ejemplo, la información no es legible por máquina. Por lo tanto, proyectos como DataFAIRy son cruciales para que la adopción de la IA tenga éxito en las ciencias de la vida. “Durante toda mi carrera, que ha abarcado los últimos treinta años, los datos no estructurados han sido un problema importante para los científicos. A medida que aumenta el volumen, la variedad y la complejidad de la información de los ensayos, las organizaciones deben gestionar sus datos de manera más eficaz, de modo que los investigadores puedan aprovechar al máximo su tiempo y las organizaciones puedan aprovechar plenamente los beneficios de la transformación digital ”, explica el Dr. Vladimir Makarov. Gerente de Proyecto del Centro de Excelencia de IA y ML de Pistoia Alliance. “El modelo DataFAIRY que hemos desarrollado no solo reducirá el tiempo que los científicos dedicados a la búsqueda de información sobre ensayos. También puede permitirles omitir experimentos que se sabe que han fallado en el pasado. A su vez, esto reducirá los costos para las empresas y acelerará la investigación vital ”. Aunque la digitalización ha hecho que las empresas sean más conscientes de la importancia de una gestión de datos sólida, la falta de estándares de la industria sigue siendo una barrera para la anotación y la gestión de protocolos, incluidos los ensayos . La adopción de los principios FAIR es el primer paso para permitir un mayor intercambio de datos entre organizaciones y ayudar a los científicos a hacer frente al creciente volumen y complejidad de los datos generados. Además, los modelos de datos actuales no están diseñados para reconocer el lenguaje científico, por lo que se debe crear un nuevo modelo para automatizar la anotación de estos valiosos recursos. La segunda etapa del proyecto DataFAIRy desarrollará aún más un modelo de este tipo de manera colaborativa en toda la comunidad. “Las herramientas de procesamiento de IA y lenguaje natural deben construirse teniendo en cuenta la terminología científica para tener éxito”, continúa el Dr. Makarov. “El modelo DataFAIRy que hemos creado automatizará el proceso de anotación para que los ensayos se puedan buscar y reutilizar, lo que acelerará la investigación valiosa. Esperamos que este modelo se convierta en el estándar comunitario para la publicación de nuevos ensayos y para la gestión de ensayos existentes entre proveedores, agencias reguladoras y editores, además de la industria farmacéutica y la biotecnología ”. Si está interesado en respaldar la siguiente etapa de el proyecto DataFAIRy, póngase en contacto con projectteamdatafairy@pistoiaalliance.org. O, si necesita ayuda para adoptar FAIR en su organización, puede descargar el kit de herramientas FAIR gratuito de Pistoia Alliance, que contiene herramientas de métodos, capacitación y casos de uso, lo que permite a las organizaciones aprender de los éxitos de la industria. Ginny Alexander Spark Communications ginny.alexander@sparkcomms.co.uk

“El modelo DataFAIRY que hemos desarrollado no solo reducirá el tiempo que los científicos dedicados a la búsqueda de información sobre ensayos. También puede permitirles omitir experimentos que se sabe que han fallado en el pasado. A su vez, esto disminui“
See all the latest jobs in Science
Volver a las noticias