L’introduzione di chatbot che sembrano avere una mente propria ha richiesto del tempo per essere accettata dal grande pubblico. Ora, la prossima evoluzione dell’intelligenza artificiale potrebbe essere il controllo diretto dei nostri computer. Anthropic, uno dei principali concorrenti di OpenAI, ha recentemente annunciato che il suo modello Claude è in grado di eseguire operazioni avanzate su un computer, come la navigazione sul web, l’apertura di applicazioni e persino l’utilizzo di mouse e tastiera.
Jared Kaplan, chief scientist di Anthropic e professore associato presso la Johns Hopkins University, ha sottolineato l’importanza di questa innovazione: “Stiamo entrando in una nuova era in cui i modelli di AI possono utilizzare gli strumenti come fanno gli esseri umani per portare a termine compiti complessi”. Kaplan ha presentato una dimostrazione registrata, in cui Claude pianifica una gita al Golden Gate Bridge. Il modello ha aperto il browser Chrome, ha cercato informazioni sull’orario migliore per ammirare l’alba e ha creato un evento nel calendario per condividerlo con un amico.
In un’altra dimostrazione, Claude ha costruito un semplice sito web utilizzando Visual Studio Code, un noto editor di codice. Senza alcuna istruzione aggiuntiva, l’intelligenza artificiale ha scritto il codice, lanciato un server web e persino risolto un problema di programmazione che era emerso durante il processo.
Claude 3.5: l’AI che potrebbe trasformare l’uso del vostro computer
Mike Krieger, Chief Product Officer di Anthropic, ha commentato le possibilità offerte da questa nuova tecnologia: “Gli agenti di intelligenza artificiale potrebbero automatizzare molte attività di routine, liberando tempo prezioso per altre attività creative e produttive. Immaginate cosa potreste fare se non doveste più passare ore a copiare e incollare testi o svolgere compiti ripetitivi”.
Anthropic ha reso disponibile queste capacità tramite l’API per il suo modello Claude 3.5 Sonnet, e ha annunciato una versione migliorata del modello più leggero, Claude 3.5 Haiku. Nonostante il potenziale di questa tecnologia, farla funzionare senza intoppi nella vita reale rimane una sfida. Attualmente, Claude riesce a eseguire con successo compiti su OSWorld, un benchmark che misura la capacità di un modello di utilizzare un sistema operativo, solo nel 14,9% dei casi, contro il 75% degli esseri umani. Tuttavia, questo risultato è comunque superiore ad altri modelli, tra cui GPT-4 di OpenAI, che raggiunge solo il 7,7%.
Alcune aziende hanno già iniziato a testare Claude. Canva, per esempio, lo sta utilizzando per automatizzare operazioni di design, mentre Replit lo sfrutta per la codifica. Kaplan sottolinea che, nonostante alcuni errori, Claude è già in grado di risolvere problemi autonomamente, come correggere un comando errato per avviare un server web o abilitare popup bloccati durante una sessione di navigazione.
Il futuro degli agenti di intelligenza artificiale si preannuncia promettente, ma anche complesso. Come osserva Ofir Press, ricercatore presso l’Università di Princeton, uno dei principali ostacoli è l’incapacità di pianificare a lungo termine e recuperare dagli errori. “Per dimostrare la loro reale utilità, questi agenti devono essere in grado di affrontare sfide più impegnative e realistiche” afferma Press.
Con giganti come Microsoft e Amazon in corsa per sviluppare i propri agenti di AI, il panorama tecnologico sta rapidamente cambiando. Resta da vedere come queste tecnologie impatteranno la vita quotidiana, ma una cosa è certa: la nuova era dell’intelligenza artificiale è appena iniziata.
Scopri come l’intelligenza artificiale può aiutare anche la tua attività cliccando qui.