Il prezzo del pensiero: un’analisi multilingue del ragionamento, delle prestazioni e del costo della negoziazione nei modelli linguistici di grandi dimensioni

The Price of Thought: A Multilingual Analysis of Reasoning, Performance, and Cost of Negotiation in Large Language Models

Un nuovo studio rivoluzionario, pubblicato su arXiv (https://arxiv.org/abs/2510.08098), esamina l’impatto dell’addestramento al ragionamento esplicito sulle capacità di negoziazione dei modelli linguistici di grandi dimensioni (LLM). La ricerca, che ha coinvolto sia modelli commerciali che open-weight, ha confrontato le loro prestazioni con quelle delle versioni “vanilla” in tre lingue diverse. La negoziazione, una sfida cruciale per l’intelligenza artificiale, richiede la capacità di ragionare strategicamente, modellare gli avversari e bilanciare cooperazione e competizione.

Lo studio ha utilizzato un approccio di self-play in tre diversi giochi di dialogo per analizzare i compromessi tra prestazioni e costi, la coerenza linguistica dei processi di ragionamento e la natura dell’adattamento strategico dei modelli. I risultati hanno rivelato che l’abilitazione del ragionamento, che implica l’aumento delle risorse computazionali durante il test, migliora significativamente i risultati della negoziazione, favorendo la collaborazione e aiutando i modelli a superare le complessità dei compiti. Tuttavia, ciò comporta un costo computazionale notevole: il ragionamento migliora le prestazioni di GPT-5 del 31,4%, ma aumenta i costi di quasi il 400%.

Una scoperta chiave è stata la distinzione significativa nel ragionamento multilingue: i modelli open-weight tendono a passare all’inglese per i loro passaggi di ragionamento interno, anche quando negoziano in tedesco o italiano, mentre un modello commerciale leader mantiene la coerenza linguistica tra il ragionamento e l’output finale. Questo solleva importanti questioni sull’interpretabilità e l’efficienza dei diversi approcci.


Paper: ArXiv.org