Hace unos días, una pequeña ave – el Colibrí de Anna – anunciaba en la portada de la revista Nature la publicación de un artículo insignia que contiene 16 genomas de referencia de alta calidad para diferentes animales vertebrados (https://www.nature.com/articles/s41586-021-03451-0). Este es el resultado de cinco años de trabajo en el piloto de la primera fase de uno de los proyectos colaborativos más ambiciosos de la biología: secuenciar al menos un genoma de referencia de alta calidad para cada una de las casi 70.000 especies de vertebrados que actualmente conocemos en el planeta. El Proyecto Genomas de Vertebrados (VGP por sus siglas en inglés) liderado por el profesor Erich Jarvis de la Universidad de Rockefeller, incluye a más de 50 grupos de investigación, con tres laboratorios principales (El Laboratorio de Genomas Vertebrados (VGL) en New York, el Instituto Sanger en el Reino Unido, y el Instituto Max Planck de Biología Celular Molecular y Genética (MPI-CBG) en Alemania) y la colaboración de cientos de científicos de todo el planeta.
Hace 20 años se publicó el primer genoma de un vertebrado: el humano. Este proyecto tardó un poco más de 10 años e involucró a muchos investigadores quienes desarrollaron la tecnología y los métodos para lograrlo. Luego vino el genoma del pollo (Gallus gallus) en el 2004. Fueron proyectos exitosos, pero apenas el comienzo para la genómica de los vertebrados. Secuenciar y analizar genomas es como armar y comparar rompecabezas. En realidad, los genomas que obtuvimos al principio no eran muy buenos: les faltaban fichas (secuenciación incompleta), solamente armábamos pedazos desconectados (ensamblajes incompletos), y había fichas que no estaban en su lugar (errores de asignación en los nucleótidos que forman el ADN). Esta es una tarea complicada porque los genomas de los vertebrados son muy grandes, la mayoría entre mil millones (1 giga o GB) y 100 mil millones (100 GB) de pares de bases. Además, la mayoría son diploides, es decir, son dos rompecabezas muy parecidos con fichas mezcladas que hay que armar al tiempo. Entonces, obtener los genomas de los vertebrados es un asunto de calidad: hay que secuenciarlos lo más completos posibles, ensamblarlos hasta el nivel de los cromosomas, y evitar los errores de asignación de los nucleótidos. Luego de obtenerlos ahí sí podemos hablar de analizar genomas, que es otra historia, porque hay que saber qué fichas en un rompecabezas corresponden a cuáles fichas en el otro (alinear genomas), y hay que saber a qué parte de la imagen del rompecabezas contribuye cada ficha y su ubicación general (saber en dónde están qué genes, que es a lo que nos referimos como anotar los genomas).
Obtener los genomas de los vertebrados también es un asunto de cantidad. Actualmente un humano vive en promedio 79 años, que son 28.835 días. Si pudiéramos obtener un genoma por día nos tomaría dos vidas y media secuenciar el genoma de las casi 70.000 especies de vertebrados. Sin embargo, aún no podemos obtener un genoma de alta calidad por día. Por esto es tan importante que este proyecto sea un esfuerzo colaborativo, se trata de ser como los colibríes: rápidos, precisos y eficientes. El artículo principal publicado por el VGP en Nature presenta los lineamientos y los estándares para lograr esta meta, mientras que otras 20 publicaciones asociadas al proyecto se ocupan de las implicaciones que estos genomas tienen sobre la conservación, la salud, la biología comparativa y la evolución de los vertebrados.
Andrew J. Crawford - Profesor Asociado del Departamento de Ciencias Biológicas
En la Universidad de los Andes trabajamos en genómica de vertebrados desde hace algunos años. El profesor Andrew J. Crawford es uno de los 15 científicos que conforman el consejo directivo del VGP y lidera el comité encargado de los anfibios para el proyecto. Andrew y sus colaboradores trabajan actualmente en la secuenciación de los genomas de tres especies de ranas que se encuentran en Colombia, dos de ellas endémicas. Hace poco, Andrew, Santiago Herrera (egresado de pregrado y maestría de UniAndes, y ahora estudiante doctoral en la Universidad de Chicago) y otros colaboradores publicaron el primer genoma del Chigüiro (Hydrochoerus hydrochaeris) e identificaron regiones genómicas asociadas al gigantismo y a la resistencia al cáncer en estos roedores (https://academic.oup.com/mbe/article/38/5/1715/5970469).
El profesor Daniel Cadena, conmigo y otros colaboradores, obtuvimos el genoma de dos especies de colibríes de Colombia: el Inca Ventridorado (Coeligena bonapartei) y el Inca Ventrivioleta (Coeligena helianthea). Secuenciamos más de 40 individuos provenientes de cuatro subespecies de estos colibríes para aclarar la historia evolutiva del este grupo, y buscar regiones genómicas asociadas a las diferencias en la coloración de su plumaje. Identificamos varias regiones genómicas diferentes entre estas especies, algunas con genes involucrados en coloración y en el desarrollo de las plumas. Encontramos que el color del plumaje no está asociado a las relaciones evolutivas entre las subespecies de estos colibríes, y que tienen una historia evolutiva más compleja de lo que pensábamos, con posible flujo genético entre ellas en diferentes momentos de su historia.
Otras iniciativas para secuenciar genomas están surgiendo en el país. En el marco del proyecto GROW Colombia, el Instituto Humboldt trabaja en la genómica para la conservación del Oso Andino (Tremarctos ornatus) junto con Parques Nacionales Naturales de Colombia, y otras dos instituciones del Reino Unido. El Instituto Humboldt trabaja también en la genómica de la lora común (Amazona ochrocephala), y junto con colaboradores en la Pontificia Universidade Catolica do Rio Grande do Sul trabajan en la genómica del género de los tigrillos (Leopardus). Además, en el proyecto Expediciones BIO: “Alas, cantos y colores”, del que Uniandes también hace parte, van a hacer análisis genómicos de varias especies de aves de Colombia.
Secuenciar los genomas de todas las especies de los vertebrados no es una tarea larga como una maratón, es más bien larga como el Tour de Francia y apenas vamos en la primera etapa. Como está planteado por el VGP este es el principio de la fase 1 del proyecto, en la que se espera generar genomas de referencia de alta calidad para 260 especies, aproximadamente una por cada orden en el grupo Vertebrata. El proyecto implica conseguir y optimizar los recursos y la financiación necesaria, promover mejores tecnologías de secuenciación, desarrollar y mejorar los programas para ensamblar, anotar, alinear, comparar y analizar los genomas, y además resolver preguntas biológicas importantes para diferentes áreas del conocimiento. Se trata de un esfuerzo enorme con una visión impresionante de lo que puede ser el futuro, de disponer de información básica, completa y de libre acceso que nos permitirá identificar y comparar las bases genéticas de la mayoría de las características de los animales vertebrados.
Por Catalina Palacios - PhD
Investigador postdoctoral
Kent State University, Kent, OH, USA
Redes sociales