IA llega a la secuenciación de proteínas
Modelos de IA como Casanovo e InstaNova emplean redes neuronales profundas para determinar las combinaciones más probables de aminoácidos y acelerar los procesos de secuenciación. La determinación de la secuencia de proteínas ha sido habitualmente un proceso complejo y tedioso, limitado por la diversidad de aminoácidos y la enorme variabilidad estructural que presentan estas moléculas, entre otros factores.
Ahora, la integración de algoritmos de Inteligencia Artificial (IA) en este ámbito ha abierto nuevas posibilidades para acelerar y perfeccionar el análisis de proteínas, un avance que podría ser crucial en diferentes áreas de la biología y la medicina.
La Inteligencia Artificial (IA) está revolucionando la secuenciación de proteínas al permitir su identificación a partir de sus secuencias de aminoácidos: esta tecnología es más rápida que los métodos tradicionales y puede identificar proteínas desconocidas, algo esencial en diagnósticos médicos, estudios ambientales y arqueología, entre otros ámbitos.
Según informa Science, un reciente trabajo científico presentado en la revista Nature Machine Intelligence detalla las características de InstaNova, un sistema de IA que identifica proteínas patógenas en heridas y proteínas desconocidas en muestras de agua de mar.
InstaNova, junto con otros más de 20 sistemas de IA desarrollados en los últimos años, está transformando el campo de la proteómica. Estas herramientas son utilizadas por investigadores en diversas áreas, desde biología evolutiva hasta arqueología, para analizar proteínas que no están representadas en bases de datos tradicionales.
Estos algoritmos pueden aprender patrones sutiles en los datos experimentales, que de otro modo pasarían desapercibidos con métodos convencionales. Así, la IA no solo permite una mayor velocidad en el procesamiento de muestras, sino que también mejora la precisión en la asignación de secuencias proteicas, reseñan Agencias Internacionales.
La identificación de proteínas implicaba fragmentarlas en péptidos, medirlos con espectrometría de masas y compararlos con bases de datos conocidas. Sin embargo, hasta el 70% de los péptidos en las muestras no tienen coincidencias en dichas bases. Este es el punto en el cual destacan las nuevas IA, al calcular los pesos de todos los posibles fragmentos de péptidos y ensamblarlos en proteínas completas.
Los modelos como Casanovo, presentado en 2021, y el más reciente InstaNova, utilizan redes neuronales profundas para aprender las combinaciones más probables de aminoácidos, de manera similar a cómo modelos de lenguaje como ChatGPT aprenden reglas sintácticas. InstaNova, además, incorpora un método específico que otorga mayor precisión a sus resultados, eliminando «ruido» en los datos. En distintas pruebas, este sistema identificó un 42% más de péptidos que su predecesor.
VTV/MQ/CP