I + D    Investigación

Consiguen la receta para construir proteínas artificiales con aprendizaje automático

Investigadores de la Universidad de Chicago han empleado el machine learning para analizar los datos del genoma y preparar las reglas de diseño de proteínas artificiales que pueden emplearse en energía, medio ambiente, salud o agricultura

28 JUL. 2020
4 minutos

Las proteínas son esenciales para la vida de las células. Son las responsables de tareas complejas como mantener su integridad o defenderse de ataques externos y catalizan reacciones químicas. Durante años científicos e ingenieros han tratado de diseñar proteínas artificiales para tratar enfermedades, capturar carbono o recolectar energía. Pero hasta el momento los procesos diseñados para crear nuevas proteínas han sido lentos y complejos.

Ahora parece que por fin se ha dado un importante paso adelante que puede tener importantes repercusiones en los sectores como la salud, la agricultura y la energía. Un equipo de investigadores de la Escuela Pritzker de Ingeniería Molecular (PME) de la Universidad de Chicago ha desarrollado un proceso aparentemente sencillo para diseñar la “receta” para elaborar esas deseadas proteínas. La inteligencia artificial y el aprendizaje automático han sido la clave.

Con ayuda del machine learning han revisado la información contenida en el genoma de las proteínas. Y de esta manera han encontrado las reglas de diseño para producir artificialmente esas mismas proteínas. Aseguran que son reglas relativamente sencillas y que los resultados obtenidos rivalizan con los que produce la propia naturaleza.

"Todos nos hemos preguntado cómo un proceso simple como la evolución puede conseguir  un material de alto rendimiento como una proteína", señala Rama Ranganathan, uno de los responsables del trabajo. "Descubrimos que los datos del genoma contienen enormes cantidades de información sobre las reglas básicas de la estructura y función de las proteínas, y ahora hemos podido emplear las reglas de la naturaleza para crear proteínas nosotros mismos".

Estudiar el genoma con ayuda de la IA

Las bases de datos del genoma con que cuentan los científicos contienen enormes cantidades de información sobre las reglas básicas de la estructura y función de las proteínas. Este grupo de la Universidad de Chicago ha desarrollado modelos matemáticos basados ​​en estos datos y con la ayuda de métodos de aprendizaje automático ha descubierto mucha más información sobre las reglas básicas de diseño de las proteínas.

Para esta investigación, estudiaron la familia de enzimas metabólicas corismato mutasa, un tipo de proteína que es importante para la vida en muchas bacterias, hongos y plantas. Crearon genes sintéticos para codificar las proteínas, los clonaron en bacterias y observaron cómo las bacterias fabricaban las proteínas sintéticas utilizando su maquinaria celular normal. Y el resultado mostró que las proteínas artificiales tenían la misma función catalítica que las proteínas de corismato mutasa naturales.

Los resultados de este estudio que se han publicado ya en la revista Science han animado a los investigadores a utilizar esta plataforma para desarrollar proteínas que puedan solucionar  problemas sociales como el cambio climático. De hecho, han creado una empresa llamada Evozyne que comercializará esta tecnología con aplicaciones en energía, medio ambiente, catálisis y agricultura.