folding proteico – ScienceBlog

Nuovo modello di solvente implicito per simulazioni proteiche

Un nuovo studio pubblicato su arXiv (arXiv:2601.05388v1) presenta un avanzamento significativo nel campo della chimica computazionale. Il lavoro introduce un modello implicito di solvente (ISM) basato sulla distillazione della conoscenza da un modello linguistico proteico (ESM3), con l’obiettivo di migliorare l’accuratezza delle simulazioni molecolari, in particolare per il folding delle proteine e il comportamento delle proteine intrinsecamente disordinate.

I modelli impliciti di solvente promettono di eguagliare l’accuratezza delle simulazioni con solvente esplicito, ma con un costo computazionale inferiore. Tuttavia, la loro accuratezza ha rappresentato una sfida per molte applicazioni critiche. La ricerca si concentra sullo sviluppo di un ISM trasferibile e basato sui dati, che superi i limiti delle formule analitiche tradizionali. La strategia innovativa consiste nel distillare le informazioni evolutive apprese da ESM3 in una rete neurale a grafo (GNN), computazionalmente efficiente.

Il modello GNN risultante, addestrato sulle energie effettive derivate da ESM3, si dimostra robusto nel guidare simulazioni di dinamica molecolare su larga scala. Combinato con un termine elettrostatico standard, il modello ibrido riproduce accuratamente i paesaggi di energia libera del folding proteico e prevede gli insiemi strutturali delle proteine intrinsecamente disordinate. Questo approccio fornisce un modello unificato, trasferibile tra stati proteici ripiegati e disordinati, superando i limiti dei modelli ISM convenzionali.

Questo lavoro rappresenta un passo avanti cruciale verso lo sviluppo di strumenti di simulazione predittivi e su larga scala, aprendo nuove prospettive per la ricerca nel campo della biologia strutturale e della chimica computazionale.

Paper: ArXiv.org