Apprendimento automatico: guida per disorientati
Erano le prime settimane di confinamento causa COVID-19 e mio figlio, all’epoca di due anni e mezzo, non riusciva a pronunciare correttamente il nome/comando “Alexa”. Il problema – almeno credo – era la lettera “x”, che lo portava a dire cose come “Alecca”, “Alecsia” o “Alesca”. Di fatto, per quanto ci provasse, non era in grado di dare ordini all’intelligenza artificiale forse più diffusa nelle case del mondo occidentale, quella della megamultiextranazionale Amazon. N’empêche, non è che fossi preoccupata, anzi; sapevo benissimo che “x” o non “x” mio figlio, da adulto (o forse anche soltanto adolescente) vivrà una vita in cui l’IA – o AI, se siete anglofili – sarà qualcosa di assolutamente routinario e non, come succede oggi, degno di suscitare sorpresa, ammirazione e curiosità in chiunque abbia quindici, massimo vent’anni più di lui.
E comunque, non è stato necessario aspettare il suo terzo compleanno – o ripiegare sulla nominalmente più accessibile Siri – perché mio figlio imparasse a dosare vibrazioni delle corde vocali, quantità di aria immessa ed emessa e movimenti vari della lingua così da pronunciare il nome/comando “Alexa” con la precisione che la macchina si aspettava per reagire così come le è stato insegnato a fare. Nei suoi 34 mesi di vita, dopotutto, aveva già imparato così tanto che cosa volete che sia, una “x” in più o in meno.
The imitation game
Tutti noi ci siamo passati: prima emettiamo dei suoni, poi c’è la lallazione, e intanto il corpo comincia a muoversi, a rotolare, ad agitarsi, magari a gattonare, e intanto compaiono le prime parole vere e proprie… Ed ecco che nel giro di poco un cucciolo d’uomo si ritrova a correre di qua e di là, con in mano più macchinine / bambole / mattoncini / eccetera di quanto immaginavamo possibile, canticchiando pezzi di canzoni ascoltate chissà dove.
Uno dei modi in cui i bambini apprendono, forse uno dei più importanti, è per imitazione. Pensiamo, per esempio, a come si impara ad allacciarsi le scarpe: tipicamente, osservando gli adulti o i bambini più grandi che lo fanno, e cercando di riprodurne i movimenti. Ma l’espressione “riprodurne i movimenti” che cosa significa? Ripetere pedissequamente ogni singolo gesto, con tutti i dettagli non necessari come l’angolo esatto a cui incrociare le stringhe o la velocità con cui compiere ciascun passaggio? Oppure capire il “succo” dell’azione e cercare di ottenere lo stesso risultato nel modo più semplice ed efficiente? O, ancora, aggiungere elementi che renderanno il nodo ancora più efficace?
Secondo la psicologa esperta di apprendimento Alison Gopnik, una definizione di intelligenza, fra le tante possibili, è legata proprio a queste due cose:
- la capacità di imitare sapendo distinguere qual è il “succo” dell’azione, estrapolandolo dal contesto, e
- la creatività con cui l’uomo è in grado (così come molti animali, mutatis mutandis) di apportare degli elementi migliorativi all’azione stessa – elemento che, se volete, potremmo chiamare “innovazione”.
E le macchine, almeno per ora, non imparano in questo modo. L’apprendimento per imitazione è al di fuori della loro portata. Quello che un bambino di qualche mese di vita sa fare con una certa disinvoltura – emettere dei suoni ispirati a quelli uditi in casa, per esempio – è stato uno degli obiettivi principali della ricerca pubblica e (soprattutto) privata in ambito tecnologico degli ultimi decenni. Come si insegna a una macchina a imparare a parlare? E a “capire” cosa diciamo? E cosa significa “imparare”? E “capire”?
Caspita, quante domande. Troppe, tutte insieme. Sicuramente un post non sarà sufficiente per rispondere, ma da qualche parte bisogna pur incominciare. Procediamo con ordine.
Apprendimento automatico – e non
Esistono due modi per rendere una macchina “intelligente”, che possiamo soprannominare deduttivo e induttivo. In un caso, degli esperti (poniamo, di gatti) insegnano alla macchina tutto quello che sanno sull’argomento (un gatto è un animale quadrupede, con i baffi, la coda – a parte il mio, a cui qualche disgraziato l’ha tagliata quando era cucciolo – e una pelliccia batuffolosa) e stabiliscono delle regole per svolgere determinati compiti (riconoscere deduttivamente, tra milioni di fotografie, quelle che rappresentano un gatto). Nell’altro caso, si progetta una macchina che ha la capacità di apprendere da sola: se la “nutriamo” con dati appropriati (e dietro questo aggettivo si nasconde un oceano di difficoltà, come vedremo – ma per il momento non preoccupiamocene), trova da sola, induttivamente, le regole per svolgere un determinato compito.
Noi essere umani usiamo entrambi gli approcci, integrandoli senza soluzione di continuità; per questo motivo, fatichiamo a distinguerli, io per prima. Pensate a come avete imparato a guidare – se non avete la patente, la bicicletta funziona allo stesso modo. Avete imparato una serie di istruzioni su come funziona il volante, come bilanciare frizione e acceleratore, come usare il freno, come cambiare le marce eccetera; dopodiché, avete messo insieme il tutto per barcamenarvi più o meno bene dal momento in cui accendete il motore fino a quando siete giunti a destinazione. Se, però, un pedone davanti a voi attraversa la strada all’improvviso, per evitarlo è necessario passare dalla modalità deduttiva a quella induttiva: dovete raccogliere velocemente i dati a disposizione (direzione verso cui si muove il pedone, velocità con cui si sposta, altri segnali importanti come un suo evidente stato di ebbrezza o l’essere concentrato sullo schermo del proprio smartphone) ed elaborarli, per determinare le probabilità di vari eventi (si fermerà all’improvviso in mezzo alla strada perché legge una notizia che lo sconvolge?). A questo punto, potete agire di conseguenza.
Una macchina non può fare come noi, e oscillare con disinvoltura tra ragionamento induttivo e deduttivo; diventerà brava a fare una o l’altra cosa, non entrambe. Cervello umano batte Intelligenza Artificiale 1 a 0, almeno per ora.
La storia dell’Intelligenza Artificiale, dagli anni Cinquanta a oggi, è stata caratterizzata da un altalenarsi di questi due approcci. L’apprendimento automatico, che oggi sempre più spesso anche in italiano è chiamato all’inglese, machine learning, è stato per lungo tempo più che altro un quadro di riferimento teorico: l’idea di base – costruire reti neurali artificiali che in qualche modo assomigliassero alla rete di neuroni che, grazie a qualche annetto di evoluzione, operano così egregiamente nel cervello di Homo sapiens – era impossibile da implementare soprattutto per la mancanza di grandi banche dati con cui alimentare le reti durante il processo iniziale di apprendimento, per non parlare poi delle enormi risorse richieste – economiche, energetiche e di calcolo – per farle funzionare. A noi esseri umani bastano 2000 calorie al giorno (un po’ di meno o un po’ di più a seconda del sesso, dell’età e dell’attività fisica – a me per esempio ne bastano suppergiù 50, a vedere la facilità con cui sale l’ago della bilancia). A una rete neurale serve ben altro. Ma anche queste esigenze così esose, negli ultimi anni, per molte ragioni sono state almeno in parte soddisfatte (mai sentito parlare del – o della – cloud?).
Eppure, nel cercare di costruire macchine ispirate al nostro cervello, gli scienziati per il momento non hanno fatto altro che perpetuare un mistero: quello, per l’appunto, di come il nostro cervello funziona. La cosa potrebbe anche non essere un problema insormontabile, dato che dopotutto a noi non serve un’intelligenza artificiale che replichi l’intelligenza umana in tutto e per tutto, perché di quella già disponiamo e sappiamo bene come costruirne esemplari in abbondanza: si chiamano “bambini” – e fabbricarne uno può essere (quasi) altrettanto divertente che programmare.
E comunque. Quello che vogliamo, o se non altro quello che vuole la maggior parte dei ricercatori nel campo del machine learning, è trovare modi di automatizzare dei processi che, una volta “esternalizzati” a un’intelligenza artificiale, ci consentirebbero di avere tempo libero per mettere a frutto (o a riposo) la nostra intelligenza naturale.
La storia, ovviamente, non finisce qui. Nei prossimi post, mi occuperò di esempi di intelligenza artificiale che fanno esattamente ciò che chiediamo loro, con risultati sbalorditivi ma non nel senso che vi aspettereste; parlerò di software che scrivono da soli e della loro controparte, ossia sistemi di riconoscimento vocale così diffusi da essere nelle tasche di noi tutti (pensate a Siri o a Google Assistant); e di Alexa, ovvio. Restate in ascolto.
Immagine di copertina di Sereja Ris via Unsplash