Gli sviluppatori che puntano ad accelerare il time to value dei modelli di machine learning e delle applicazioni basate sull'intelligenza artificiale possono trovare in Vertex AI un alleato prezioso. La piattaforma di Google offre infatti tutto ciò di cui i professionisti hanno bisogno per creare e utilizzare l'AI generativa in chiave end-to-end: soluzioni avanzate di ricerca e conversazione, oltre 130 modelli di base, e un ambiente di lavoro unificato, espressamente concepito per agevolare i processi collaborativi.
Oltre ad abilitare l'accesso ai modelli multimodali Gemini di Google, infatti, Vertex AI combina e integra flussi di lavoro di data engineering, data science e machine learning engineering, consentendo ai team di cooperare utilizzando set di strumenti condivisi e scalando le applicazioni grazie alle prerogative di Google Cloud. È grazie a questa logica che i modelli possono essere implementati attraverso un processo semplificato. Ma come bisogna adoperare Vertex AI per ottimizzare il deployment e il miglioramento continuo di ciascun prodotto? E in che modo la piattaforma aiuta a massimizzare l'efficienza dell'intera catena del valore?
Le delicate fasi di addestramento e deployment, in particolare, possono essere affrontate facendo leva su un'ampia gamma di strumenti, ciascuno adatto a eseguire con la massima efficacia i vari tipi di task. AutoML, per esempio, è perfetto per chi ha l'esigenza di addestrare dati tabulari, di immagini, testo o video senza scrivere codice o preparare le suddivisioni dei dati. Con AutoML si può creare e addestrare un modello con il minimo sforzo tecnico, sia dando rapidamente vita a prototipi sia esplorando nuovi set di dati prima di investire tempo e risorse nello sviluppo vero e proprio.
L'addestramento personalizzato, d'altra parte, assicura il controllo completo sul processo di addestramento, incluse quindi la scelta del framework ML preferito, la scrittura di codice di training ad hoc e la selezione delle opzioni di ottimizzazione degli iperparametri. Con l'addestramento personalizzato si può, tra le altre cose, costruire un'applicazione ottimizzata per il risultato target, sia utilizzando algoritmi esistenti, sia sviluppando in autonomia funzioni o metriche ritagliate su misura.
Sul piano del deployment, invece, Model Garden consente di preparare, testare, personalizzare ed eseguire agevolmente l'operazione. L'utilizzo di modelli e asset open source conferisce massima libertà agli sviluppatori, che possono declinare le componenti di intelligenza artificiale generativa in molteplici modalità (testo, codice, immagini, parlato). Il che implica la facoltà di ottimizzare gli LLM di Google in base ad esigenze specifiche.
Una volta ultimata la fase di deployment dei modelli, è poi possibile utilizzare gli strumenti MLOps end-to-end di Vertex AI per automatizzare e scalare i progetti durante il ciclo di vita delle applicazioni. La suite MLOps viene eseguita su un'infrastruttura completamente gestita, da personalizzare in base alle esigenze di prestazioni e budget.
Addestramento e deployment sono solo le fasi centrali di un flusso di lavoro molto più complesso: un processo composto da 5 passaggi ben definiti che grazie a Vertex AI possono essere omogeneizzati e migliorati in modo coerente. Vediamoli nel dettaglio.
Rispetto all'ultima fase, nell'ottica di aumentare ulteriormente l'efficienza dei costi, Vertex AI permette infine di impostare una frequenza di campionamento delle richieste di previsione per monitorare un sottoinsieme di input di produzione per un modello. La frequenza di monitoraggio determina l'intervallo di tempo, ovvero le dimensioni della finestra di monitoraggio, dei dati analizzati in ogni esecuzione di screening. Si possono quindi specificare le soglie di avviso per ogni funzionalità da monitorare e ottimizzarle man mano che si perfeziona il modello.