La complejidad de un organismo emerge de su genoma, que contiene las instrucciones de su ADN para la vida. En este contexto, un grupo de investigación liderado por el Instituto de Biología Integrativa de Sistemas (I2SysBio), ha desarrollado y presentado en la revista Nature Methods una mejora significativa de un programa informático capaz de descubrir nuevos transcritos de ARN a partir de la secuenciación de lectura larga.
La secuenciación de lectura larga, la tercera generación de métodos de secuenciación del genoma, ha revolucionado la forma en que se analizan los genes. En comparación con la lectura de fragmentos cortos, que solo analiza unos 200 nucleótidos, los métodos de lectura larga pueden obtener lecturas hasta 100 veces más largas, lo que proporciona una información más completa del genoma y menos huecos que llenar mediante herramientas bioinformáticas. Por esta razón, Nature Methods la consideró Método del Año 2022.
El programa informático desarrollado por Ana Conesa, llamado SQANTI, y mejorado por su equipo en el I2SysBio, permite analizar los datos obtenidos de la secuenciación de lectura larga de manera más eficiente. Este software puede ser utilizado en los principales sistemas comerciales de secuenciación de lectura larga, como Pacific Biosciences (PacBio) y Oxford Nanopore Technologies (ONT).
Según Conesa, estas técnicas de lectura larga permiten analizar mejor la complejidad de los transcritos y el transcriptoma humano, identificando la porción del genoma que se lee en cada célula para dar lugar a tejidos y órganos. Esto es crucial para comprender enfermedades neurológicas y cáncer, donde la diversidad de transcritos y proteínas juega un papel fundamental.