Apprendimento efficace: il prossimo futuro dell'IA

Pubblicato: 2017-11-09

Queste tecniche di apprendimento efficaci non sono nuove tecniche di apprendimento profondo/apprendimento automatico, ma potenziano le tecniche esistenti come hack

Non c'è dubbio che il futuro ultimo dell'IA sia raggiungere e superare l'intelligenza umana. Ma questa è un'impresa inverosimile da raggiungere. Anche i più ottimisti tra noi scommettono che l'IA a livello umano (AGI o ASI) arriverà fino a 10-15 anni da oggi con gli scettici disposti anche a scommettere che ci vorranno secoli, se possibile. Bene, non è di questo che parla il post.

Qui parleremo di un futuro più tangibile e più vicino e discuteremo degli algoritmi e delle tecniche di IA emergenti e potenti che, a nostro avviso, daranno forma al prossimo futuro dell'IA.

L'IA ha iniziato a migliorare gli esseri umani in alcuni compiti selezionati e specifici. Ad esempio, battere i medici nella diagnosi di cancro della pelle e sconfiggere i giocatori di Go al campionato del mondo. Ma gli stessi sistemi e modelli non riusciranno a svolgere compiti diversi da quelli per cui sono stati addestrati a risolvere. Questo è il motivo per cui, a lungo termine, un sistema generalmente intelligente che esegue una serie di compiti in modo efficiente senza la necessità di una rivalutazione è soprannominato il futuro dell'IA.

Ma, nel prossimo futuro dell'IA, molto prima che esca l'AGI, come faranno gli scienziati a fare in modo che un algoritmo basato sull'IA superi i problemi che devono affrontare oggi per uscire dai laboratori e diventare oggetti di uso quotidiano?

Quando ti guardi intorno, l'IA sta vincendo un castello alla volta (leggi i nostri post su come l'IA sta superando gli umani, prima e seconda parte). Cosa potrebbe mai andare storto in un gioco vincente? Gli esseri umani stanno producendo sempre più dati (che è il foraggio che l'IA consuma) con il tempo e anche le nostre capacità hardware stanno migliorando. Dopotutto, i dati e un calcolo migliore sono i motivi per cui la rivoluzione del Deep Learning è iniziata nel 2012, giusto? La verità è che più veloce della crescita dei dati e del calcolo è la crescita delle aspettative umane. I data scientist dovrebbero pensare a soluzioni al di là di ciò che esiste in questo momento per risolvere i problemi del mondo reale. Ad esempio, la classificazione delle immagini, come la maggior parte delle persone penserebbe, è scientificamente un problema risolto (se resistiamo all'impulso di dire accuratezza del 100% o GTFO).

Possiamo classificare le immagini (diciamo in immagini di gatti o immagini di cani) che corrispondono alla capacità umana usando l'IA. Ma questo può essere già utilizzato per casi d'uso nel mondo reale? L'intelligenza artificiale può fornire una soluzione per problemi più pratici che gli esseri umani devono affrontare? In alcuni casi sì, ma in molti casi non ci siamo ancora.

Ti guideremo attraverso le sfide che sono i principali ostacoli allo sviluppo di una soluzione del mondo reale utilizzando l'IA. Diciamo che vuoi classificare le immagini di cani e gatti. Useremo questo esempio per tutto il post.

Il nostro algoritmo di esempio: Classificare le immagini di cani e gatti

Il grafico seguente riassume le sfide:

Sfide coinvolte nello sviluppo di un'IA del mondo reale

Parliamo di queste sfide in dettaglio:

Imparare con dati minori

I dati di addestramento utilizzati dagli algoritmi di Deep Learning di maggior successo richiedono che siano etichettati in base al contenuto/funzionalità che contiene. Questo processo è chiamato annotazione.
Gli algoritmi non possono utilizzare i dati trovati naturalmente intorno a te. L'annotazione di poche centinaia (o poche migliaia di punti dati) è facile, ma il nostro algoritmo di classificazione delle immagini a livello umano ha impiegato un milione di immagini annotate per imparare bene.
Quindi la domanda è: se è possibile annotare un milione di immagini? In caso negativo, come può l'IA scalare con una quantità minore di dati annotati?

Risolvere diversi problemi del mondo reale

Sebbene i set di dati siano fissi, l'utilizzo nel mondo reale è più vario (ad esempio, l'algoritmo addestrato su immagini a colori potrebbe fallire gravemente su immagini in scala di grigi a differenza degli umani).
Mentre abbiamo migliorato gli algoritmi di Computer Vision per rilevare gli oggetti in modo che corrispondano agli umani. Ma come accennato in precedenza, questi algoritmi risolvono un problema molto specifico rispetto all'intelligenza umana che è molto più generica in molti sensi.
Il nostro esempio di algoritmo di intelligenza artificiale, che classifica cani e gatti, non sarà in grado di identificare una specie di cane rara se non nutrito con immagini di quella specie.

Regolazione dei dati incrementali

Un'altra grande sfida sono i dati incrementali. Nel nostro esempio, se stiamo cercando di riconoscere cani e gatti, potremmo addestrare la nostra intelligenza artificiale per una serie di immagini di cani e gatti di specie diverse durante la prima implementazione. Ma alla scoperta di una nuova specie, dobbiamo addestrare l'algoritmo per riconoscere i "Kotpies" insieme alle specie precedenti.
Mentre la nuova specie potrebbe essere più simile ad altre di quanto pensiamo e possa essere facilmente addestrata per adattare l'algoritmo, ci sono punti in cui ciò è più difficile e richiede un riaddestramento e una rivalutazione completi.
La domanda è: possiamo rendere l'IA almeno adattabile a questi piccoli cambiamenti?

Per rendere l'IA immediatamente utilizzabile, l'idea è di risolvere le suddette sfide con un insieme di approcci chiamati Apprendimento efficace (si noti che non è un termine ufficiale, lo sto solo inventando per evitare di scrivere Meta-Learning, Transfer Learning, Pochi Shot Learning, Adversarial Learning e Multi-Task Learning ogni volta). Noi di ParallelDots stiamo ora utilizzando questi approcci per risolvere problemi ristretti con l'IA, vincendo piccole battaglie mentre ci prepariamo per un'IA più completa per conquistare guerre più grandi. Lascia che ti presentiamo queste tecniche una alla volta.

È evidente che la maggior parte di queste tecniche di apprendimento efficace non sono qualcosa di nuovo. Stanno solo vedendo una rinascita ora. I ricercatori SVM (Support Vector Machines) utilizzano queste tecniche da molto tempo. L'apprendimento contraddittorio, d'altra parte, è qualcosa che è emerso dal recente lavoro di Goodfellow sui GAN e il ragionamento neurale è un nuovo insieme di tecniche per le quali i set di dati sono diventati disponibili molto di recente. Diamo un'occhiata a come queste tecniche aiuteranno a plasmare il futuro dell'IA.

Trasferisci l'apprendimento

Che cos'è?

Come suggerisce il nome, l'apprendimento viene trasferito da un compito all'altro all'interno dello stesso algoritmo in Transfer Learning. Gli algoritmi addestrati su un'attività (attività di origine) con set di dati più grandi possono essere trasferiti con o senza modifiche come parte dell'algoritmo che tenta di apprendere un'attività diversa (attività di destinazione) su un set di dati (relativamente) più piccolo.

Qualche esempio

L'utilizzo dei parametri di un algoritmo di classificazione delle immagini come estrattore di funzionalità in diverse attività come il rilevamento di oggetti è una semplice applicazione di Transfer Learning. Al contrario, può anche essere utilizzato per eseguire compiti complessi. L'algoritmo sviluppato da Google per classificare la retinopatia diabetica meglio dei medici solo qualche tempo fa è stato realizzato utilizzando Transfer Learning. Sorprendentemente, il rilevatore di retinopatia diabetica era in realtà un classificatore di immagini del mondo reale (classificatore di immagini di cane/gatto) Transfer Learning per classificare le scansioni oculari.

Dimmi di più!

Troverai data scientist che chiamano tali parti trasferite di reti neurali dalla sorgente all'attività di destinazione come reti preaddestrate nella letteratura sull'apprendimento profondo. L'ottimizzazione fine si verifica quando gli errori dell'attività di destinazione vengono leggermente propagati nella rete pre-addestrata invece di utilizzare la rete pre-addestrata non modificata. Una buona introduzione tecnica al Transfer Learning in Computer Vision può essere vista qui. Questo semplice concetto di Transfer Learning è molto importante nel nostro insieme di metodologie di Apprendimento Efficace.

Raccomandato per te:

Risorse

Come Metaverse trasformerà l'industria automobilistica indiana

Risorse

Cosa significa la disposizione anti-profitto per le startup indiane?

In che modo le startup Edtech stanno aiutando il potenziamento delle competenze e a rendere la forza lavoro pronta per il futuro

Risorse

In che modo le startup Edtech stanno aiutando la forza lavoro indiana a migliorare le competenze e a diventare pronte per il futuro...

Notizia

Azioni tecnologiche new-age questa settimana: i problemi di Zomato continuano, EaseMyTrip pubblica stro...

Caratteristiche

Le startup indiane prendono scorciatoie alla ricerca di finanziamenti

Secondo quanto riferito, la startup di marketing digitale Logicserve Digital ha raccolto INR 80 Cr in finanziamenti dalla società di gestione patrimoniale alternativa Florintree Advisors.

Notizia

Piattaforma di marketing digitale Logicserve Borse INR 80 Cr Finanziamenti, rinomina come LS Dig...