A mediados del mes de marzo, cuando la pandemia de Covid-19 empezaba a golpear con especial virulencia al norte de Italia y España y se empezaban a conocer los casos de personas menores de 50 años que enfermaban y fallecían, una pregunta empezó a rondar en la cabeza de los genetistas: ¿y si, como pasa con otras enfermedades, el SARS-CoV-2 aprovecha alguna característica genética para atacar a los pacientes que se ponen más graves? Uno de estos científicos, el investigador de la Universidad de Helsinki Andrea Ganna, tiene familia en el norte de Italia y fue el primero en levantar el teléfono y poner de acuerdo a sus colegas. Juntos organizaron la Iniciativa Genética de Covid-19 (COVID-19 host genetics initiative), una plataforma a la que se han sumado más de 90 equipos para compartir información y tratar de dar respuesta a esta pregunta.
“Lo que hicimos fue crear una red en la que la gente pueda compartir información sobre sus estudios genómicos, compartir protocolos y poner en común las cuestiones que quieren resolver”, explica Ganna a Vozpópuli. “Queremos centrarnos en algunas cuestiones claves, como la contribución genética a la gravedad de Covid-19 y para eso todos nos beneficiaremos todos de tener la muestra lo más grande posible”. Uno de los genetistas que participa desde el principio en esta red es el investigador de la Universidad de Stanford Manuel Rivas, que lleva años estudiando la genética de males como la enfermedad de Chron o la diabetes. “Nos dimos cuenta al principio de esta pandemia que en varias ocasiones con enfermedad infecciosas y como el VIH, el descubrimiento de genes o mutaciones que podían dar lugar a hipótesis terapéuticas se ha dado por estudios genéticos”, explica a este medio. “En algunas enfermedades hemos visto factores genéticos que causan que la trayectoria sea más severa que otras personas que tienen los mismos riesgos clínicos. Y este podría ser el caso de la gente joven que se está muriendo por Covid-9”.
“En otras enfermedades hay factores genéticos que causan que la trayectoria sea más severa”
En este esfuerzo colectivo están trabajando decenas de científicos de todo el mundo, tomando muestras en pacientes de los hospitales, comparándola con la almacenada en biobancos y poniendo en marcha las herramientas bioinformáticas que permitan analizarlo. En España varias de estas iniciativas han sido ya aprobadas por el CSIC o el Instituto de Salud Carlos III y otras están en camino. El catedrático Ángel Carracedo, uno de los más reconocidos expertos en genética del país y director del Centro Nacional de Genotipado-ISCIII (CEGEN), coordina junto al doctor Pablo Lapunzina una iniciativa que incluye unos 30 hospitales y centros de investigación para hacer un estudio de asociación del genoma completo (GWAS) de 8000 pacientes y secuenciación de genomas completos en 300 personas con fenotipos extremos. “La idea es buscar genes de predisposición y mala evolución”, explica Carracedo. “De todo el genoma, se analizan alrededor de un millón de polimorfismos de un solo nucleótido (SNPs) y se van comparando grupos, jóvenes asintomáticos y sin patologías previas contra otros que tienen un problema o contra mayores que no tienen nada. Y se ve si hay diferencias entre unos y otros, para tratar de ver si hay genes de riesgo, o marcadores de mala evolución”.
La empresa catalana TellmeGen, que comercializa kits de análisis genético para particulares, va a colaborar con el investigador alemán Hans-Juergen Thiesen, del Instituto de Inmunología de Rostock, para analizar entre 1000 y 5000 muestras de ADN de pacientes de Covid-19 en Alemania para intentar responder a la misma pregunta. “Este catedrático nos contactó hace como 15 días porque buscaban una empresa europea que tuviera acceso a la información genética de muchas personas y con capacidad de hacer tests genéticos rápidos”, explica Ramón Catalá, responsable de TellemeGen. “Lo que hemos pactado es que ellos nos envían las muestras de pacientes de tres grupos: personas que han dado positivo pero son asintomáticos o presentan síntomas leves, positivos solo con ingreso hospitalario y positivos con ingreso en la UCI. Nosotros en diez días les pasamos los datos genéticos crudos, con las más de 750.000 mutaciones que detecta nuestro kit, que es la forma mas barata y más rápida de hacer todo esto”. Como el equipo alemán necesita también un grupo de control, TellmeGen preguntará a sus usuarios si les interesa ceder sus datos para este estudio en concreto y podrá detectar si entre las 75.000 personas que se han hecho el estudio genético con ellos hay positivos en Covid-19 con distintos grados de afectación que permitan comparar los resultados con lo que observe el Thiesen en sus muestras.
Por qué jóvenes acaban en la UCI
Uno de los equipos que aparece en la web de la iniciativa genética global de Covid-19 es el de la investigadora del Institut d'Investigacions Biomèdiques de Barcelona, Anna Planas, quien ha puesto en marcha el proyecto INMUNGEN-CoV2, que ya cuenta con el visto bueno y la financiación del CSIC y ha establecido el sistema para recoger muestras de pacientes de su Hospital Clínic de Barcelona, donde trabaja. “Lo que queremos hacer es muy simple”, explica a Vozpópuli. “Queremos estudiar a 200 pacientes con menos de 60 años y que no tengan enfermedades previas o crónicas graves. Porque queremos estudiar la diferencia entre quienes están bien y los que empeoran y terminan en la UCI”. Su objetivo es descubrir si a nivel genético estos últimos pacientes presentan una susceptibilidad especial, porque en tal caso tendrían un indicador de cuáles son los casos más vulnerables a los que se deberían proteger. “En un caso así, los demás podrían salir porque solo iban a tienen un poco de fiebre (que serían ese 70% o más que tienen infecciones leves) y podríamos proteger a los que -además de los ancianos - tienen posibilidades de presentar síntomas graves de la enfermedad”.
“Podríamos proteger a los que tienen posibilidades de presentar síntomas graves de la enfermedad”
Aunque Anna Planas no trabaja en el ámbito de las enfermedades infecciosas, en su investigación sobre isquemia cerebral había descubierto que en la población que ha sufrido ictus existe al menos un 18 por ciento de pacientes que presentan polimorfismos en el genoma que les “protegen” del daño cerebral. Y que estas pequeñas diferencias tienen que ver precisamente con la virulencia de la repuesta inmune, un factor que parece tener un papel clave en los casos de Covi-19 que se agravan. “En esos pacientes, cuando habían pasado tres meses, la proporción de pacientes que habían evolucionado mejor era más grande”, explica Planas. Viendo que en su propio hospital había pacientes que, sin patologías previas, se ponían mucho más graves que otros, empezó a tirar del hilo y a contactar con otros equipos con los que ahora colabora. “Así empezó la cosa, estuve hablando con inmunólogos del hospital y empecé a estudiar lo que se había hecho antes para las infecciones anteriores como SARS y MERS. Y encontré alguna documentación que sí decía que algunos de estos polimorfismos podrían aumentar la susceptibilidad a la respuesta. Es decir, se podrían infectar igual, pero algunos con menos capacidad de hacer frente a la infección, por lo que pensamos que esto estaría bien poderlo estudiar de manera más extensa y con las herramientas actuales”.
El proyecto INMUNGEN-CoV2 ya ha echado a andar en colaboración con otros equipos, como el de Jordi Perez Tur en el Institut de Biomedicina de València-CSIC, con quien compararán los resultados. La hipótesis de partida es que la respuesta inmune innata puede tener un papel en los casos graves que pequeñas diferencias genéticas en las expresión de las proteínas permiten al virus poner a pacientes jóvenes contra las cuerdas. Bien podría suceder, reconocen todos los grupos, que en este caso no existieran tales diferencias genéticas que afectaran a la evolución de la Covid-19, pero para resolver el enigma tienen que investigar y deben seguir muchos pasos.
IA contra el coronavirus
Los investigadores que intentan resolver esta cuestión tienen que poner en marcha no solo la recogida de muestras, sino un sistema de análisis que les permita trabajar con los datos anonimizados de los biobancos y correlacionar los datos genéticos con los datos clínicos, un campo en el que el papel de los bioinformáticos será clave. Lara Lloret, del Instituto de Física de Cantabria (IFCA) es una de las especialistas que colabora con el equipo de Planas para analizar la información mediante inteligencia artificial y aprendizaje automático (machine learning). Una vez que reciban los datos genéticos, poblacionales y clínicos de INMUNGEN-CoV2 los someterán a dos estrategias. La primera, la del aprendizaje no supervisado, consistirá en introducir los datos en en el cluster de 40 GPUs que tiene el IFCA para ver si el algoritmo los agrupa por algún factor en común que les pueda dar alguna pista. Después, el equipo entrenará a un algoritmo para que depure esa información sabiendo ya cuáles son los datos de quiénes enferman más y quiénes solo están leves o asintomáticos. “La idea es ponerles etiquetas, para distinguir un diagnóstico complicado de uno leve, y ver si somos capaces de que la máquina aprenda. Se trata de que cuando le metas los datos de un paciente nuevo, el algoritmo te dé una probabilidad de cómo de posible que esa persona vaya a necesitar una UCI o no, lo que te puede servir para ver cuantas UCIs vas a necesitar en una pandemia como esta”.
“Queremos que el algoritmo te dé una probabilidad de cómo de posible que esa persona vaya a necesitar una UCI”
En el hospital Virgen del Rocío de Sevilla, el equipo de Joaquín Dopazo, director del Área de Bioinformática Clínica del Sistema Sanitario Público de Andalucía, ha desarrollado una herramienta que puede servir para analizar estos datos genómicos y cruzarlos con los datos de posibles tratamientos médicos. “Nuestra herramienta te permite analizar los datos de los pacientes de forma mecanística, es decir, determinar cuáles son las causas moleculares de las diferencias entre los pacientes que tienen una repuesta más agresiva y menos y a qué responde”, explica a Vozpópuli. Esta herramienta informática es una adaptación del sistema que ya utilizaba su equipo con enfermedades raras y con cáncer y que permite simular el comportamiento de las distintas proteínas ante fármacos que ya existen, para su posible reutilización. “Así puedes obtener de forma rápida e higiénica una lista de moléculas candidatas a estropear o estorbar la acción de la proteína del virus y por lo tanto con potencial acción antiviral”, explica. En el caso de SARS-CoV-2, su equipo trabaja también en crear un “mapa de la enfermedad” que permita integrar los datos de las variaciones particulares de cada paciente, que llegarán cuando los proyectos de genómica culminen. Esto ayudará a entender mejor cómo interacciona el virus con el sistema inmune y con los posibles medicamentos que se apliquen, un “atajo” para ganar tiempo y enfocar bien los experimentos biológicos.
Coordinación y supercomputadores
Todos estos trabajos, que cada grupo ha iniciado por su cuenta con toda la buena voluntad y el esfuerzo, requerirán un grado de organización y catalogación en el que ya está trabajando el equipo de Alfonso Valencia, director del departamento de Ciencias de la Vida, en el Barcelona Supercomputing Centre (BSC). Por el Mare Nostrum, el superordenador más grande de España y uno de los más grandes del mundo, están corriendo las simulaciones y análisis de centenares de grupos sobre el coronavirus, desde los que prueban posibles tratamientos con medicamentos a los que analizan el genoma del virus y de los pacientes. Aunque no pueden saber cuál es el porcentaje exacto, explica Valencia, sospechan que un porcentaje alto de los recursos está dedicado a estas investigaciones, aunque la capacidad del BSC está lejos de saturarse. Esta movilización, explica, es “el triunfo de la diplomacia científica, que necesita mucho menos para organizarse y funcionar que la de los políticos o de las compañías, porque hay más tradición de colaboración, los contactos son personales, conoces a la gente que está haciendo las cosas porque siempre has trabajado con ellos”.
Por el Mare Nostrum están corriendo las simulaciones y análisis de centenares de grupos sobre el coronavirus
Pero este esfuerzo colectivo sin precedentes necesita un orden y que los datos recogidos sean homologables para hacer estudios comparativos. El rol de los grandes centros como el BSC es organizar todo este caudal de información para que quede centralizada en los repositorios europeos como la base de datos EGA (European Genome Archive) y el EMBL (European Molecular Biology Laboratory). “Hay tres repositorios”, explica Valencia, "el de los virus secuenciados, el de los humanos y la información médica de los humanos. El esfuerzo europeo es que estas cosas existan, estén coordinadas y tengamos los sistemas de análisis para hacerlo”. La dificultad añadida es que los datos del virus son libres, pero los de los genomas de las personas y la información clínica están protegidos y se necesitan permisos especiales para su acceso.
La clave, en todo caso, será entender el problema biológico bien y poder atacarlo en su raíz, según Valencia. “No es lo más inmediato, pero es lo más importante a medio plazo si queremos estar en condiciones de afrontar eventos de este tipo como otros coronavirus”, asegura. “Cualquiera de estos proyectos que manejan grandes cantidades de datos pasan por supercomputación con ordenadores como Mare Nostrum”, concluye. “Nosotros no vamos a curar ninguna enfermedad, pero no parece que se vaya a poder curar ninguna enfermedad que no pase por el tratamiento masivo de estos datos”.