Aiutando le organizzazioni a sfruttare meglio i dati per ottenere informazioni fruibili, l'intelligenza artificiale (IA) promuove l'innovazione. L'adozione delle applicazioni di IA è in rapido aumento, ma lo sviluppo, l'addestramento e la gestione dei carichi di lavoro di IA su vasta scala rappresentano ancora una sfida. Consentendo alle aziende di trasformare i modelli di IA in servizi scalabili, l'approccio Model-as-a-Service (MaaS) aiuta le aziende a superare queste difficoltà.
Cos'è l'approccio Model-as-a-Service (MaaS)?
Models-as-a-Service (MaaS) aiuta le organizzazioni a ottenere più valore e risultati in meno tempo. I servizi MaaS forniscono modelli di IA già addestrati tramite un gateway API su una piattaforma IA di cloud ibrido.
I team interni specializzati possono sviluppare, distribuire e rendere disponibili i sistemi MaaS all'intera organizzazione. Grazie alle API, gli altri team possono accedere ai modelli già addestrati e ottenere così più rapidità ed efficienza e dedicarsi alle attività importanti e strategiche per l'azienda. Se in azienda non è disponibile un team MaaS dedicato, o se è troppo costoso, è possibile acquisire i servizi MaaS da un provider di fiducia. In ogni caso, oltre alla maggiore efficienza e al risparmio sui costi, l'approccio MaaS garantisce un maggior controllo sulla privacy, sui dati e sul loro utilizzo.
Quando è utile un approccio MaaS?
Per gestire le GPU e l'infrastruttura di IA alla base, servono persone competenti e capaci di sviluppare, addestrare e gestire i modelli di IA. Un'azienda può semplicemente offrire l'IA come Infrastructure-as-a-Service (IaaS), oppure impegnare un piccolo numero di esperti competenti in attività di sviluppo, addestramento e distribuzione di modelli di IA, che poi tutti potranno utilizzare.
Per rispondere alle aumentate esigenze di inferenza dei modelli, il framework per il model serving e le GPU alla base dovrà avere una maggiore scalabilità. I fornitori di servizi MaaS gestiscono anche ogni operazione di manutenzione e monitoraggio, inclusi aggiornamenti, prestazioni e sicurezza.
Un altro aspetto da considerare è l'elevato costo delle GPU, che diventa esponenziale se queste non vengono utilizzate in modo inefficiente. Evitando ingenti investimenti in infrastruttura, l'approccio MaaS riduce i costi iniziali per l'azienda.
Il MaaS contribuisce ad accelerare altri due aspetti importanti: il ROI aziendale e il time to value, poiché le attività di sviluppo e addestramento dei modelli richiedono tempo e il Maas offre ai team i modelli necessari già pronti all'uso.
Cos'è il MaaS
Il seguente progetto MaaS è ideato per illustrare l'approccio e i suoi principali componenti, che includono i modelli, una piattaforma di IA scalabile, un sistema di orchestrazione dell'IA e una gestione consolidata delle API.

Rispetto al MaaS, la scelta del modello di IA più adatto allo scenario di utilizzo è solo uno degli aspetti importanti, perché occorre anche considerare, tra l'altro, la raccolta e la verifica dei dati, la gestione delle risorse e l'infrastruttura necessaria per distribuire e monitorare i modelli.
Nel contesto delle applicazioni di IA, queste attività vengono automatizzate tramite operazioni di machine learning (MLOps), che prevedono l'intero ciclo di vita dei progetti di IA e aspetti DevOps, come le responsabilità all'interno di un team interfunzionale. Nel ciclo di vita MaaS, il provider MaaS dispone di un team simile di esperti specializzati e interfunzionali, tra cui data scientist, tecnici di ML e operazioni IT, che collaborano per fornire e gestire i servizi MaaS.
Modelli
Il provider MaaS elabora il catalogo dei modelli in cui sono raccolti modelli proprietari, di terzi e open source. In funzione delle esigenze aziendali, il provider può scegliere di personalizzare i modelli tramite tecniche di fine tuning o di offrire un'esperienza utente avanzata avvalendosi della Retrieval augmented generation (RAG) o della Retrieval augmentation with fine tuning (RAFT). Dopo l'ottimizzazione, il modello viene salvato nel data store e i relativi meta dati archiviati nel registro del modello, pronti per la distribuzione. In alcuni casi, il provider MaaS crea un catalogo di tutti i modelli disponibili e della relativa documentazione, ed espone le API in un portale dedicato agli sviluppatori.
Red Hat OpenShift AI
La base del MaaS è la piattaforma di IA utilizzata per ottimizzare, distribuire e monitorare i modelli, ovvero un sistema configurato dal provider con strumenti di osservabilità adeguati alle attività di controllo.
Il provider deve erogare i modelli in modo efficiente, gestendo più tenant, monitorando e mitigando le minacce alla sicurezza e integrando diverse sorgenti di dati.
Il nostro progetto prevede l'utilizzo di Red Hat OpenShift AI come piattaforma di IA, perché può risolvere le problematiche del MaaS offrendo supporto multitenant, un solido livello di sicurezza per il model serving e l'integrazione con i servizi dati. OpenShift AI semplifica i flussi di lavoro di ingestione dei dati, addestramento e serving dei modelli, garantisce l'osservabilità e favorisce la collaborazione tra i team.

Vantaggi di Red Hat OpenShift AI
OpenShift AI offre numerosi vantaggi a chiunque intenda realizzare un sistema MaaS, tra cui:
- La possibilità di ampliare i servizi su vasta scala per gestire le richieste dei carichi di lavoro di IA di maggiori dimensioni.
- La possibilità di gestire carichi di lavoro di IA nel cloud ibrido e negli ambienti all'edge e isolati.
- Autenticazione integrata e controllo degli accessi basato sui ruoli (RBAC).
- Numerosi controlli per gestire le problematiche di sicurezza e conformità.
La modularità è un fattore essenziale di OpenShift AI, perché permette al team MaaS di creare uno stack di AI/ML personalizzato scegliendo i partner o le tecnologie open source adatte alle singole esigenze.
Orchestrazione dell'IA
Le capacità di orchestrazione dell'IA fornite da Red Hat OpenShift AI permettono ai team MaaS di sperimentare e controllare diverse versioni dello stesso modello o anche modelli differenti per ogni scenario di utilizzo specifico, con l'obiettivo di indirizzare le richieste API all'istanza di modello più adeguata. Questo livello può anche includere i componenti necessari a gestire diverse tecniche di ottimizzazione dei modelli.
Gestione delle API
Un altro componente importante del progetto MaaS è la gestione delle API. I provider devono essere in grado di gestire gli accessi, registrare le applicazioni e fornire analisi e chargeback, consentendo ai propri clienti di gestire e osservare le app in azione e di misurarne il ROI in modo efficace. Il componente di gestione delle API permette di impostare criteri estesi di onboarding e utilizzo, con cui ottenere dati analitici relativi all'utilizzo, all'utilizzo eccessivo, non adeguato e improprio delle API pubblicate.

Fornisce inoltre supporto per l'alta disponibilità, il controllo del traffico, l'autenticazione delle API, l'integrazione con i provider di identità di terze parti, l'analisi, il controllo gli accessi, la monetizzazione e i flussi di lavoro degli sviluppatori.
Applicazioni intelligenti
Il componente finale di questa architettura è costituito dalle applicazioni per i clienti, come le chatbot, le applicazioni mobili o il portale. Le parti coinvolte in questo contesto sono gli sviluppatori che intendono integrare i modelli di IA disponibili nelle proprie applicazioni intelligenti tramite le API pubblicate dal provider MaaS. Dovranno perciò essere in grado di completare l'onboarding delle proprie app utilizzando le funzionalità di gestione delle API tramite un portale a loro dedicato,
attraverso il quale potranno offrire agli utenti finali app intelligenti che si integrano senza difficoltà con i modelli tramite le proprie API. Gli sviluppatori possono così concentrarsi sulla risoluzione dei problemi aziendali utilizzando le API di modelli pronti all'uso e lasciando al provider MaaS il compito di occuparsi dei modelli, delle attività MLOps e dell'infrastruttura alla base.
Conclusioni
Eliminando le complessità dell'infrastruttura e degli aspetti di data science, le aziende possono avvalersi dell'approccio MaaS per fornire soluzioni di IA in modo più rapido ed efficiente, senza perdere il controllo dei costi e delle complessità delle metodologie MLOps.
Considerata la crescente adozione dell'IA, MaaS è un approccio ideale per accelerare lo sviluppo dell'intelligenza artificiale e i tempi di accesso al mercato. Esplora le funzionalità di Red Hat OpenShift AI per scoprire come Red Hat può aiutarti a creare un'offerta MaaS e a ottenere il massimo dai tuoi investimenti in IA.
product trial
Red Hat OpenShift AI (autogestito) | Versione di prova del prodotto
Sull'autore
Muhammad Bilal Ashraf (preferred name: Bilal) is a Senior Architect at Red Hat, where he empowers organizations to harness the transformative potential of open-source innovation. Since joining Red Hat in 2021 as a Cloud Native Architect, Bilal has advanced to his current role, collaborating closely with customers and partners to deliver strategic value through cloud-native solutions, AI/ML, and cutting-edge technologies. His expertise lies in architecting scalable, open-source-driven solutions to accelerate digital transformation, optimize operations, and future-proof businesses in an evolving technological landscape. Bilal’s work bridges the gap between enterprise challenges and open-source opportunities, driving customer success through tailored AI and cloud-native strategies.
Altri risultati simili a questo
Ricerca per canale
Automazione
Novità sull'automazione IT di tecnologie, team e ambienti
Intelligenza artificiale
Aggiornamenti sulle piattaforme che consentono alle aziende di eseguire carichi di lavoro IA ovunque
Hybrid cloud open source
Scopri come affrontare il futuro in modo più agile grazie al cloud ibrido
Sicurezza
Le ultime novità sulle nostre soluzioni per ridurre i rischi nelle tecnologie e negli ambienti
Edge computing
Aggiornamenti sulle piattaforme che semplificano l'operatività edge
Infrastruttura
Le ultime novità sulla piattaforma Linux aziendale leader a livello mondiale
Applicazioni
Approfondimenti sulle nostre soluzioni alle sfide applicative più difficili
Virtualizzazione
Il futuro della virtualizzazione negli ambienti aziendali per i carichi di lavoro on premise o nel cloud