Las proteínas son esenciales para la vida de las células. Realizan tareas complejas y catalizan reacciones químicas. Científicos han intentado elaborar prótidos artificiales que pudieran emprender otras tareas, como tratar enfermedades, capturar carbono o recolectar energía. Pero los resultados no habían sido exitosos. Hoy, la Universidad de Chicago anunció que logró utilizar ‘big-data’ para diseñar nuevas proteínas.
Los investigadores de la Escuela Pritzker de Ingeniería Molecular encontraron reglas de diseño para construir proteínas artificiales. Desarrollaron modelos de aprendizaje automático y pudieron revisar la información de proteínas, obtenida de las bases de datos del genoma, a través de un proceso dirigido por inteligencia artificial.
Cuando el equipo construyó estas proteínas artificiales en el laboratorio, descubrieron que realizaban químicos tan bien que rivalizaban con los que se encuentran en la naturaleza.
“Todos nos hemos preguntado cómo un proceso simple como la evolución, puede conducir a un material de alto rendimiento como una proteína”, dijo Rama Ranganathan, profesor en el Departamento de Bioquímica y Biología Molecular en Pritzker.
“Descubrimos que los datos del genoma contienen enormes cantidades de información sobre las reglas básicas de la estructura y función de las proteínas. Y ahora hemos podido embotellar las reglas de la naturaleza para crear proteínas nosotros mismos”, señaló.
Este avance, que podría tener implicaciones en los sectores de la salud, la agricultura y la energía, fue publicado en la revista Science.
Proteínas artificiales
El informe que recoge la investigación señala que las proteínas están formadas por cientos o miles de aminoácidos, y estas secuencias de aminoácidos especifican la estructura y función de la proteína. Lo que resultó un verdadero desafío fue comprender cómo se pueden construir estas secuencias para crear nuevas proteínas.
Ranganathan y sus colaboradores se dieron cuenta, en los últimos 15 años, de que las bases de datos del genoma contienen enormes cantidades de información sobre las reglas básicas de la estructura y función de las proteínas. Entonces su grupo desarrolló modelos matemáticos basados en estos datos y luego comenzó a usar métodos de aprendizaje automático.
Estudiaron la familia de enzimas metabólicas corismato mutasa, un tipo de proteína que es importante para la vida en muchas bacterias, hongos y plantas. Utilizando modelos de aprendizaje automático, los investigadores pudieron revelar las reglas de diseño simples detrás de estas proteínas.
El modelo muestra que solo la conservación en las posiciones de aminoácidos y las correlaciones en la evolución de los pares de aminoácidos son suficientes para predecir nuevas secuencias artificiales que tendrían las propiedades de la familia de proteínas.
“Por lo general, suponemos que para construir algo, primero se debe comprender profundamente cómo funciona”, dijo Ranganathan. “Pero si tienes suficientes ejemplos de datos puedes usar métodos de aprendizaje profundo para aprender las reglas de diseño. Incluso mientras comprende cómo funciona o por qué está construido de esa manera”.
Luego, Ranganathan y sus colaboradores crearon genes sintéticos para codificar las proteínas, los clonaron en bacterias y observaron cómo las bacterias fabricaban las proteínas sintéticas utilizando su maquinaria celular normal. Descubrieron que las proteínas artificiales tenían la misma función catalítica que las proteínas de corismato mutasa naturales.
De lo sencillo a lo complejo
Debido a que las reglas de diseño son relativamente simples, la cantidad de proteínas artificiales que los investigadores podrían crear con ellas es extremadamente grande.
“Las limitaciones son mucho más pequeñas de lo que imaginamos que serían”, comentó Ranganathan.
Además, sostuvo que “hay una simplicidad en las reglas de diseño de la naturaleza. Y creemos que enfoques similares podrían ayudarnos a buscar modelos para el diseño en otros sistemas complejos en biología, como los ecosistemas o el cerebro”.
Aunque la inteligencia artificial reveló las reglas de diseño, Ranganathan y sus colaboradores aún no entienden completamente por qué funcionan los modelos. A continuación, trabajarán para comprender cómo llegaron los modelos a esta conclusión. “Hay mucho más trabajo por hacer”, indicó.
Lee también: