Theory Moonshot

theory moonshot

Il nostro obiettivo è quello di porci le grandi domande e assumerci i grandi rischi che sono necessari per avviare un nuovo ambito di studio nel nostro campo. Con le domande rivoluzionarie che chiamiamo «Theory Moonshot», intendiamo gettare le basi teoriche per un campo di ricerca completamente nuovo. 

Non si tratta di un processo dall’alto verso il basso, ma di un impegno a lungo termine basato su collaborazioni spontanee tra i nostri ricercatori ambiziosi e propensi al rischio. Attraverso processi specifici, spingiamo il nostro team a pensare fuori dagli schemi, offrendo lo spazio e la libertà per farlo. Finora sono emersi i temi seguenti. 

 

Oltre la separazione delle scale temporali: 

Molti degli algoritmi di ottimizzazione online, la teoria dei giochi, l’apprendimento per rinforzo e così via si basano sulla separazione delle scale temporali per stabilire le loro proprietà teoriche. In altre parole, ciò richiede che una parte del processo raggiunga (più o meno) l’equilibrio prima che un’altra parte intervenga; le proprietà di quasi-equilibrio vengono quindi sfruttate, ad esempio, per ricavare condizioni sufficienti alla convergenza del metodo. 

Ci chiediamo se la separazione delle scale temporali sia effettivamente necessaria o se sia una questione di convenienza matematica. Per quali classi di problemi si possono sviluppare algoritmi nuovi e più veloci che non si basano sulla separazione delle scale temporali? Che aspetto hanno questi algoritmi? E per quali classi di problemi possiamo dimostrare teoremi di impossibilità che stabiliscono la separazione delle scale temporali come necessaria? 

 

Controllo con apprendimento permanente:  

I futuri sistemi di controllo opereranno in ambienti in continua evoluzione, in collaborazione con altri complessi sistemi di controllo basati sui dati e con operatori umani. Dovranno costantemente adattarsi a condizioni mutevoli, ad esempio all’invecchiamento degli impianti e all’evoluzione delle strutture di rete. Tali cambiamenti portano a una sostanziale non stazionarietà e a spostamenti della distribuzione, violando l’ipotesi di i.i.d. che è alla base della maggior parte degli approcci di apprendimento automatico. 

Il nostro obiettivo principale è quello di sviluppare una teoria dell’adattabilità del controllo basata sui dati per i sistemi complessi. Ciò richiederà di ripensare il controllo adattivo nell’era dell’apprendimento automatico moderno e di andare oltre le ipotesi di stazionarietà comunemente adottate nell’apprendimento profondo per rinforzo e nel controllo basato sui dati. 

Mentre stiamo già indagando su questo argomento nell’ambito della sfida fondamentale dei «fattori abilitanti dell’automazione», riteniamo che le domande più importanti sul controllo con apprendimento permanente siano ancora da scoprire.