PacBio colabora con investigadores líderes para establecer un consorcio de frecuencia variable de lectura larg

Science

PacBio (NASDAQ: PACB), un desarrollador líder de soluciones de secuenciación de alta precisión y alta calidad, anunció hoy la creación del Consorcio para la secuenciación de lectura larga (CoLoRS) que tiene como objetivo acelerar la utilidad de los conjuntos de datos del genoma humano de lectura larga. CoLoRS es una coalición abierta de investigadores internacionales centrados en la creación de una base de datos integral de información de frecuencia para todas las clases de variación humana identificadas mediante la secuenciación del genoma completo humano de lectura larga. Los datos de lectura larga de alta calidad pueden caracterizar la variación genética inaccesible para la secuenciación de lectura corta. Como tal, CoLoRS planea complementar de manera crítica las bases de datos existentes, ayudar a mejorar el descubrimiento de la variación patogénica y avanzar en la comprensión de los fundamentos genómicos de las enfermedades raras, donde más de la mitad de los casos permanecen sin explicación incluso después de la secuenciación del genoma de lectura corta. "PacBio se enorgullece de colaborar con estos investigadores innovadores para crear este recurso tan necesario para la comunidad de investigación de la genómica", dijo Edd Lee, director de marketing del segmento de genómica humana de PacBio. âLa frecuencia poblacional es una herramienta clave para interpretar la variación genética. CoLoRS extenderá esta herramienta a la variación detectada únicamente por la secuenciación HiFi, en particular variantes estructurales, repeticiones en tándem y pequeñas variantes en regiones del genoma que son difíciles de secuenciar usando otras tecnologías. Los miembros fundadores de CoLoRS son líderes de investigación altamente respetados. hospitales, universidades y laboratorios de todo el mundo. Los conjuntos de datos preexistentes proporcionados por los miembros del consorcio comprenderán el conjunto inicial de genomas, que se procesarán y catalogarán utilizando canales de análisis estandarizados y confiables. Los datos resultantes se almacenarán y estarán accesibles a través del Laboratorio de Análisis, Visualización e Informática (AnVIL) del Instituto Nacional de Investigación del Genoma Humano (NHGRI), que es una plataforma de análisis e intercambio de datos genómicos basada en la nube. CoLoRS ha recibido fondos de apoyo de la Oficina de Estrategia de Ciencia de Datos de los Institutos Nacionales de Salud y NHGRI para ayudar a financiar llamadas variantes basadas en la nube y para la utilización de la base de datos para iniciativas financiadas por NHGRI como GREGoR y el Programa de Investigación All of Us. Estoy emocionado de ser parte de este consorcio de expertos en variación estructural, genómica e investigación clínica para crear una base de datos que permitirá a los investigadores aprovechar todo el potencial de la tecnología de secuenciación de lectura larga, beneficiando su investigación y la comprensión colectiva de la variación humana. y enfermedad Con esta base de datos, finalmente podremos considerar todos los tipos de variación en todo el genoma humano”, dijo Michael Schatz, profesor distinguido de Bloomberg en la Universidad Johns Hopkins. Publicaciones científicas recientes, incluidas las de investigadores del consorcio Telomere-to-Telomere, han demostrado que la secuenciación de lectura larga puede proporcionar conocimientos únicos para la investigación de enfermedades y genomas al cubrir regiones del genoma inaccesibles para otras tecnologías. La secuenciación del genoma completo de lectura larga puede detectar hasta 15 000 variantes estructurales más y 300 000 variantes más pequeñas, además de proporcionar una resolución significativamente mayor de las regiones repetidas en tándem en comparación con la secuenciación de lectura corta. Las variantes estructurales, en particular, explican la mayoría de las diferencias de pares de bases entre individuos. La base de datos CoLoRS está destinada a ayudar a los investigadores no solo proporcionando frecuencias de tales variantes, sino también ayudando a futuras iniciativas de genotipado de variantes estructurales y repeticiones en tándem. La base de datos está destinada a ser pública, lo que beneficiará a todos los investigadores, y se espera que se llene con los datos iniciales a fines de 2022. Para ampliar aún más el poder de la base de datos, se alienta a los investigadores con conjuntos de datos del genoma humano HiFi sin procesar o de nivel resumido a comunicarse con participar.

“Los datos de lectura larga de alta calidad pueden caracterizar la variación genética inaccesible para la secuenciación de lectura corta“
See all the latest jobs in Science
Volver a las noticias