Operator si basa su un modello di "Computer-Using Agent" che combina le capacità visive di GPT-4 con un "ragionamento avanzato attraverso l'apprendimento per rinforzo". Questo permette all'agente di interagire con le interfacce grafiche senza richiedere integrazioni API personalizzate.
L'intelligenza artificiale è in grado di autocorreggersi e, in caso di difficoltà, può cedere il controllo all'utente. Operator chiederà l'intervento umano quando un sito web richiede informazioni sensibili come credenziali di accesso e dovrebbe richiedere l'approvazione dell'utente per azioni come l'invio di email.
L'azienda sta collaborando con diverse compagnie come DoorDash, Instacart, OpenTable e Uber per garantire che Operator "risponda alle esigenze del mondo reale rispettando le norme stabilite". Tuttavia, OpenAI avverte che lo strumento potrebbe avere difficoltà con interfacce complesse come la creazione di presentazioni o la gestione di calendari.
In futuro, OpenAI prevede di estendere l'accesso a Operator agli utenti Plus, Team ed Enterprise, integrando queste funzionalità direttamente in ChatGPT.