Recentemente, i ricercatori hanno pubblicato uno studio focalizzato su VAKRA, un ambiente eseguibile che permette agli agenti di interagire con oltre 8.000 API locali supportate da database reali, coprendo 62 domini diversi. L'obiettivo principale dello studio è stato quello di analizzare le capacità di ragionamento degli agenti, il loro uso degli strumenti e le modalità di fallimento in contesti simili a quelli aziendali. VAKRA è stato progettato come un benchmark eseguibile, radicato sugli strumenti, per valutare l'efficacia degli agenti intelligenti in un ciclo completo di ragionamento. Nonostante l'importanza di questo studio, i dettagli sui risultati specifici e sulle metodologie utilizzate dai ricercatori non sono stati divulgati.