banner
Casa / Notizia / La maggior parte dei dati sull’addestramento dell’IA potrebbero essere sintetici entro il prossimo anno
Notizia

La maggior parte dei dati sull’addestramento dell’IA potrebbero essere sintetici entro il prossimo anno

Jun 09, 2023Jun 09, 2023

I dati sintetici consentono di addestrare i modelli di intelligenza artificiale su un set di dati più ampio di quanto sarebbe possibile con dati puramente organici.

Di Ryan Morrison

La maggior parte dei dati utilizzati per addestrare i modelli di machine learning saranno sintetici e generati automaticamente, prevede un nuovo rapporto di Gartner. Solo l’1% di tutti i dati di addestramento sull’intelligenza artificiale erano sintetici nel 2021, ma gli analisti suggeriscono che potrebbe raggiungere il 60% entro la fine del 2024. La governance e la vigilanza sui pregiudizi sono essenziali per evitare che questi dati subiscano le stesse sfide dei dati organici, ha detto un esperto a Tech Tenere sotto controllo.

I dati sintetici vengono generati dall’intelligenza artificiale per colmare le lacune mancanti nelle informazioni del mondo reale come l’imaging medico o le informazioni su specifici modelli di malattie. In una nuova ricerca sulle tendenze nella scienza dei dati, pubblicata questa settimana, Gartner prevede che entro il 2024 oltre il 60% di tutti i dati di addestramento dei modelli di intelligenza artificiale saranno sintetici, cosa che porterà a sistemi di intelligenza artificiale migliori.

Questo passaggio dai dati di addestramento organici a quelli sintetici fa parte di un passaggio più ampio verso un’intelligenza artificiale incentrata sui dati, come quelli utilizzati per produrre modelli linguistici e di base di grandi dimensioni. “Soluzioni come la gestione dei dati specifica per l’intelligenza artificiale, i dati sintetici e le tecnologie di etichettatura dei dati, mirano a risolvere molte sfide relative ai dati, tra cui accessibilità, volume, privacy, sicurezza, complessità e portata”, afferma il rapporto di Gartner.

Un recente rapporto di GlobalData ha rilevato che le start-up di dati sintetici stavano “ridefinendo il panorama della generazione di dati”. Descrivendola come la “chiave principale per il futuro dell’intelligenza artificiale”, Kiran Raj, responsabile della tecnologia dirompente presso GlobalData, ha affermato che le start-up stanno rompendo le catene della qualità e della regolamentazione dei dati. “Mentre la domanda di dati affidabili, convenienti, efficienti in termini di tempo e che preservano la privacy continua ad accelerare, le start-up immaginano un futuro alimentato da dati sintetici, inaugurando una nuova era di progressi nell’apprendimento automatico”, ha affermato Raj.

Ha il potenziale per avere impatti positivi in ​​una vasta gamma di settori. Nel settore sanitario, viene già utilizzato per aumentare i dati reali dei pazienti per formare i medici, migliorare la scoperta di farmaci e ottimizzare i sistemi. Nel settore dei servizi finanziari, contribuisce a mitigare i rischi e a individuare le frodi. E nel commercio al dettaglio sta migliorando la previsione della domanda, il marketing personalizzato e il rilevamento delle frodi.

Le altre tendenze chiave rilevate da Gartner includono uno spostamento verso l’elaborazione edge per l’intelligenza artificiale. Secondo il rapporto, l’elaborazione dei dati nel momento della creazione aiuterà le organizzazioni a ottenere informazioni in tempo reale e a rilevare nuovi modelli. Renderà inoltre più semplice soddisfare requisiti sempre più rigorosi in materia di privacy dei dati. L’organizzazione prevede che oltre il 55% dell’analisi dei dati da parte delle reti neurali avverrà in un sistema edge entro il 2025.

Gli analisti di Gartner prevedono che ci sarà una maggiore enfasi sull’intelligenza artificiale responsabile. Ciò include garantire che la tecnologia venga utilizzata come forza positiva piuttosto che come minaccia per la società. Ciò include la garanzia che le aziende facciano scelte etiche quando adottano l’intelligenza artificiale che affrontano il valore sociale, il rischio, la fiducia, la responsabilità e la trasparenza. Questi sono i requisiti fondamentali che costituiscono molte delle normative sull’intelligenza artificiale sviluppate in tutto il mondo, compreso il Regno Unito.

Le organizzazioni dovrebbero adottare un “approccio proporzionale al rischio” per gli investimenti e l’implementazione dell’intelligenza artificiale, hanno avvertito gli analisti. Ciò include prestare attenzione quando si applicano soluzioni e modelli e chiedere garanzie ai fornitori per garantire che stiano gestendo i propri rischi e obblighi di conformità. Ciò contribuirà a proteggerli da perdite finanziarie e azioni legali.

Alcuni modelli di fondazione e organizzazioni di IA generativa offrono livelli di indennizzo da questi rischi. Adobe afferma che coprirà i costi associati alle rivendicazioni di copyright derivanti dall’uso del suo modello di immagine AI generativa Firefly. Questo perché l'azienda è convinta che il modello venga addestrato esclusivamente su dati concessi in licenza e autorizzati che non produrranno output sospetti sul copyright.

Peter Krensky, direttore analista di Gartner, ha dichiarato: “Mentre l’adozione del machine learning continua a crescere rapidamente in tutti i settori, i dati si stanno evolvendo dal concentrarsi solo su modelli predittivi, verso una disciplina più democratizzata, dinamica e incentrata sui dati. Ciò è ora alimentato anche dal fervore attorno all’intelligenza artificiale generativa. Mentre stanno emergendo potenziali rischi, lo sono anche le numerose nuove funzionalità e casi d’uso per i data scientist e le loro organizzazioni”.