Colonizzatori di dati

Descrizione

Un dibattito su come i dati stanno trasformando la società, il potere e la democrazia, con esperti che analizzano il controllo dei dati e la necessità di regole etiche.

Relatori

Barachini Alberto
Castagna Silvia
Kallinikos Jannis
Trombetti Marco

Edizione

2025 - Rischi e scelte fatali. L’Europa al bivio.

Grazie, benvenuti a tutti in questo appuntamento. La colonna comparable Grazie, benvenuti a tutti in questo appuntamento. si intitola colonizzatori di dati, il che già apre una serie di questioni, ma presento subito e ringrazio gli ospiti, vado in quest'ordine, il sottosegretario della presidenza del consiglio con delega all'informazione e l'editoria, Alberto Baracchini, è stato anche un collega per cui questo vorrei ricordarlo, è un collega sempre, la dottoressa Silvia Castagna che è analista di sociale, esperta di comunicazione soprattutto di innovazione e partecipa alla commissione sull'intelligenza artificiale per l'informazione, quindi sempre presso la presidenza del consiglio dei ministri. A proseguire fondatore e amministratore delegato di translated, dott. Marco Trombetti, quindi informatico, imprenditore, investitore anche, e a terminare solo nella sequenza il professor Jan Escalinikos che adesso è full professor di information system presso la Luisa. Ringrazio tutti, ringrazio nuovamente voi, senatore, sottosegretario, colonizzatore di dati che è il titolo di questo incontro, sottintende, è un'accezione non sempre positiva ovviamente, sottintende la terra perché la colonizzazione è stata fatta sulla terra e sulle persone in passato, quindi il greggio nel senso tradizionale non è più il motore di determinate cose, quindi c'è un nuovo petrolio che è quello dei dati. Dall'altra parte i dati richiedono energia, gestione, ma soprattutto procurano un impatto fortissimo su quello che è la trasformazione sociale e la trasformazione di tutti quei sistemi che abbiamo conosciuto negli ultimi anni. Se posso fare una premessa, quando nel 2020 c'è stato il primo insediamento di Ursula von der Leyen ha espressamente raccontato una visione, cioè la possibilità, l'idea che in realtà si sta lentamente verificando, di trasformare i cittadini in identità digitali e i governi in piattaforme. Ovviamente su questi due pilastri sono relativamente chiari. Il terzo pilastro è quello del parlamento, quindi esiste un parlamento digitale? Se ne discute? Cioè questa non tanto come provocazione, ma come interrogativo profondo che riguarda sia chi fa politica, sia chi si occupa di giornalismo e di informazione, non di comunicazione. La domanda è che influenza hanno i dati da questo punto di vista? Come dobbiamo approcciare per chi si occupa di informazione come lei? Sono tante domande in una. Cominciamo dal titolo, con l'iniziatore di dati identifica un processo di conquista del dato. Allora la prima analisi da fare è se c'è un'egemonia del dato e in quali mani è questa egemonia dei dati. E noi sappiamo che oggi la gran parte dei dati è detenuta da 3-4 grandi società. Prima di parlare di quello che oggi io credo sia un momento di democrazia digitale, cioè noi viviamo in una democrazia digitale ormai che deve tenere presente quindi leggi, regole e norme parallele o diciamo laterali rispetto a quelle che abbiamo sempre vissuto e non c'è bisogno di citare il caso Romania o citare quello che sta avvenendo in Germania con After Pay perché entrambe queste situazioni identificano come il flusso dei dati, la distribuzione del dato modifica radicalmente o può modificare radicalmente la coscienza democratica, la partecipazione democratica delle persone. Io faccio una considerazione. Qualche anno fa parlando con degli esperti digitali mi spiegavano che ormai qualunque supermercato delle nostre città è in grado di sapere qualunque catena di supermercati è in grado di sapere quali prodotti rifornire nei quartieri delle nostre città, cioè hanno perfettamente l'analisi di quello che serve rifornire in più o in meno nei quartieri, ma arrivano a una precisione diciamo veramente di aree piccolissime sui nostri quartieri delle città. Se questo avviene vuol dire che il dato è talmente raffinato, talmente preciso da poter consentire questa logica commerciale. Beh è facile pensare che la stessa cosa può avvenire sulla distribuzione di informazioni e sul tipo di informazioni che si distribuisce su un'area geografica. Quindi io vado a conoscere esattamente quale area di una determinata quartiere può essere sensibile, più o meno sensibile a un tipo di informazione e addirittura un taglio dell'informazione, cioè una selezione ulteriore di quella stessa informazione. Ma la differenza qual è? Che un prodotto commerciale è un prodotto, l'informazione, il giornalismo, la notizia non è un prodotto, è un bene fragile, è un bene che produce un effetto sulla coscienza critica e democratica e quindi deve essere considerato diversamente. Non si tratta di fare un'azione come quella che stiamo facendo con la commissione di deterrenza o di blocco dell'innovazione, si tratta di stabilire quali possono essere dei guardrail etici, dei guardrail normativi per evitare che i dati sensibili, quelli che influiscono appunto sulla coscienza critica, diventino di proprietà di persone che ne fanno un utilizzo non corretto, perché il tema a monte è che i grandi overtop, che poi sono quelli che detengono i dati, stanno facendo gli editori anche se non hanno le stesse responsabilità, gli stessi oneri, le stesse tassazioni, le stessi vincoli, le stesse responsabilità che hanno gli editori tradizionali. Cioè siamo passati da una trasformazione, dal contenuto alla distribuzione del contenuto. Oggi la distribuzione del contenuto è contenuto stesso. Per fare e per tornare un attimo alla riflessione un esempio semplice è sta succedendo con l'informazione esattamente quello che è successo con i grandi alberghi di paesi europei e booking. Booking è diventata proprietaria di alcuni alberghi, di fatto, perché distribuisce gran parte delle camere di quegli alberghi. Non possiamo consentire che i titolari di un'informazione nazionale e quindi anche di un pluralismo informativo diventino soggetti esterni al nostro Paese, a volte governati direttamente da chi controlla autorità politica, perché tutti voi sapete che TikTok non ha una governance chiara, una governance governativa in parte cinese che quindi non sappiamo esattamente chi detiene il dato e come viene utilizzato. Ma Rubo, ancora un secondo, visto che l'Italia ha una tradizione, mi riferisco al Dipartimento che coordina di sostegno all'editoria, spesso, però questo è un mio punto di vista personale, spesso in passato, in direzioni un po' anacronistiche, ecco, però è chiaro, mi sembrerei capire, se un bene fragile riguarda un equilibrio sociale si possa ragionare in questa direzione. Però era un po' un unicum in Europa, sta cambiando qualcosa, cioè gli altri governi come europei mi riferisco, come si sta muovendo. È molto interessante questo argomento, noi siamo stati soggetti sia internamente che esternamente a una polemica continua sulla validità del sostegno pubblico all'informazione, cioè è corretto, non è corretto, è sbagliato, come va organizzato. Chiaramente le norme vanno sempre attuate, rese, come dire, compatibili con la realtà editoriale che cambia, che ora cambia ogni due anni, mentre prima magari cambiavano di cinque con cicli di cinque, dieci anni, oggi tutto sta cambiando molto rapidamente. Ma sta succedendo una cosa molto interessante, quando noi all'inizio del nostro lavoro andavamo ai vertici europei per parlare con gli altre autorità governative che si occupano di informazione, presentavamo il nostro modello di sostegno all'editoria, venivamo vissuti un po' come atipici, un po' come persone che in qualche modo avevano un rapporto non sano con il mondo dell'informazione che in tutto il mondo giustamente è considerato un bene privato e che deve rimanere privato senza come dire connessioni con la politica o con il governo. Intanto è faticoso spiegare che il nostro supporto non è un supporto collegato a realtà specifiche, ma è disteso su tutto il sistema editoriale, cioè noi non sosteniamo i quotidiani che hanno con noi un rapporto di vicinanza, sosteniamo tutti quei quotidiani che hanno degli indici economici, giornalistici, di presenza delle persone corretti, quindi noi facciamo un'azione a larga scala, a largo raggio, non è che scegliamo gli editori a sostenere, primo punto è anche questo è un elemento che va sempre spiegato per far capire anche ai cittadini il senso, ma è successo questo che in Europa, soprattutto mondi come la Germania e la Francia, oggi ci guardano con attenzione perché intanto esistono anche in quei paesi, per esempio la Francia spende quattro volte quello che spendiamo noi per sostenere l'agenzia di stampa francese, la FDP, ma i governi e i parlamenti e i paesi come Francia e Germania si stanno rendendo conto che se non operano un sistema di difesa del sistema integrato dell'informazione nazionale verranno narrati, verranno raccontati da realtà che non sono più quelle interne al paese, questo è da una parte certamente un ulteriore contenuto pluralistico alla narrazione ma è anche un rischio perché se io vengo raccontato da un paese diverso dal mio bisogna vedere con che interesse viene fatto e quali sono le logiche sottostante. Esatto perché possono essere le logiche politiche, possono essere le logiche commerciali, possono essere le logiche internazionali e siccome stiamo vedendo quello che sta avvenendo oggi con la Presidenza Trump dobbiamo capire che questo è un tema perché da una parte c'è tutto il mondo degli overtop degli Stati Uniti, dall'altra c'è a Deep Sea che tutta la Cina, ma io chiudo su un elemento, è del tutto evidente che quello che sta avvenendo in America è questo. Gli overtop sono andati dal presidente Trump e gli hanno detto, ricordatevi che gli overtop poi erano i principali sostenitori di Biden e della Harris cioè del fronte opposto, hanno immediatamente cambiato posizionamento, questo è abbastanza normale però diciamo sono andati da Trump e gli hanno detto se tu non fermi il sistema di regole che l'Europa sta mettendo sull'intelligenza artificiale, sul copyright e come dire sgombri il terreno dal sistema di regole noi non possiamo assicurarti di poter vincere la sfida con i colossi cinesi, quindi hanno messo Trump davanti a una scelta estremamente complessa perché gli hanno detto senza regole noi possiamo vincere, con le regole potresti perdere contro le politiche cinesi, capite che io non sono convinto che sia effettivamente così ma è una narrazione drammaticamente efficace. Possiamo rimanere sempre sul tema editoria e informazione, passerai il microfono a dottoressa Castagna, visto su esperties, se parliamo di editori cioè di produttori di contenuti, c'è l'editore tradizionale quello che ha è presente su varie piattaforme, ci sono i privati che a loro volta producono dei contenuti, di informazione o comunicazione e poi ci sono gli aggregatori di news o di contenuti. In questo momento c'è una sorta di difficile equilibrio ma se ci spostiamo nel 2028, comunque un futuro abbastanza vicino ecco, questo equilibrio come si sposterà? Che cosa può succedere? Buongiorno, grazie, grazie alla domanda interessante, ma una volta si diceva conosci te stesso, ora noi per conoscere noi stessi spesso ci riferiamo all'intelligenza artificiale e se voi vi faceste analizzare dall'intelligenza artificiale scoprireste delle cose di voi che voi stessi non sapete, è successo a me l'altro giorno. Corrette, una visualizzazione importante di una serie di dati che io non sapevo di avere dato alla macchina, qualsiasi sia la macchina, perché a questo punto è un po' difficile capire a chi si sta dando cosa e ovviamente sono rimasta un po' sorpresa e ho cercato di ricondurre questa situazione alle leggi vigenti e al panorama competitivo anche in termini di informazione, visto che faccio parte della commissione mi sono posta il problema. Io vedo tre tipologie di editoria in questo momento, da un lato gli editori puri che ovviamente si sono digitalizzati che hanno un modello di business basato sul costo per notizia, quindi il costo del giornalista insieme a tutto il resto dei costi generali per produrre la notizia. Poi vedo l'opposto, cioè i singoli privati che sono i media loro stessi, quindi content creator di varia natura anche molto piccoli, che hanno un impatto relativo, poi ci sono stati i casi più importanti che tutti conosciamo, che però adesso stanno un po' passando di moda, anche le aziende cominciano a non fidarsi più molto, dei content creator cercano di valutarli meglio. Poi in mezzo c'è la terra di nessuno che sono appunto gli aggregatori. Gli aggregatori hanno un modello di business che non ha a che fare con la produzione della notizia, ma ha a che fare con la vendita pubblicitaria e il dato che siamo noi. Cioè intervenendo, leggendo gratuitamente diamo una serie di accessi di autorizzazione alle privacy, parentesi la formulazione con cui ci viene chiesta l'autorizzazione alla privacy cambia molto e voi lo notate quindi quando l'azienda è molto interessata a profilarvi, la domanda ve la sottopone come una cosa carina, vogliamo fornirti dei servizi molto più belli per te, molto più dettagliati, molto più appropriati in base a chi sei tu e quindi dammi la privacy. In altri casi per esempio la pubblica amministrazione quando voi entrate con lo speed per esempio all'agenzia delle entrate o all'IMPS, avete una griglia di informazione che vi dice sei entrato con lo speed, stai cedendo il tuo codice fiscale, l'indirizzo di casa, il cap, eccetera. E quindi tu sai cosa stai dando e lo sai più volte perché ogni volta te lo dice, mentre nel primo caso tu dai l'ok una volta e poi chissà quanto dura questo ok, magari cambi idea, non riesci più a tornare indietro. Gli aggregatori hanno questa ulteriore peculiarità che non rientrano nel mercato dell'editoria, per cui spesso rientrano nel mercato digitale tecnologico, non accedono ai fondi per l'editoria ma accedono ai fondi per la digitalizzazione, sono un altro capitolo proprio. Però fanno concorrenza agli editori puri o normali rastrellando con i sistemi di crawler sulla web le notizie in tempo reale e modificando nel testo e poi ripubblicandole in funzione di dove devono apparire queste notizie, per cui ci sono testate che hanno una quarantina di testate locali, questa stessa notizia ritrovata su web viene rimasticata, riscritta in maniera diversa a Trento rispetto magari a Palermo, perché il problema non è vendere la notizia ma la visualizzazione, quindi la pubblicità. Contemporaneamente il resto del business viene coperto dalle aziende che investono nell'acquisto di questi dati e quindi poi quando noi ci chiediamo come mai ricevo comunicazioni, mail di qualsiasi tipo, telefonati di qualsiasi tipo, non so perché hanno il mio numero di telefono perché magari tu gliele hai dato attraverso questo giro di informazioni. Quindi è un mercato diverso però concorrenziale perché non dobbiamo guardare alla quota di mercato della notizia, dobbiamo guardare alla quota di mente del lettore. Se il lettore soddisfa il suo bisogno informativo scrollando su TikTok, cosa che ormai i ragazzi puntualmente fanno o su Instagram, ha soddisfatto il suo bisogno informativo e non andrà ad approfondire. Se leggendo la notizia sulla qualsiasi intelligenza artificiale usiate compare il link alla testata e questo dovrebbe portare ad approfondire, certificare la notizia eccetera, tendenzialmente non lo si fa per cui anche gli accordi tra editori e intelligenza artificiale società che forniscono quindi large language model spesso non funzionano perché il desiderato sarebbe quello di far atterrare il lettore poi sul sito dell'editore. In realtà questo non avviene perché il mio bisogno informativo viene soddisfatto già con la sintesi dell'intelligenza artificiale. Volevo solo concludere dicendo che il meccanismo che è in corso ormai da 40 anni, cioè dagli anni 80-90, non è più quello di registrare i dati tra virgolette in modo archivistico ma è quello di produrre dati da un punto di vista cognitivo in maniera da creare mercati, quindi creare il bisogno nella popolazione di una serie di bisogni di mercato di consumo, di lettura, di culture, di sensibilità e di corde che aumentino ulteriormente la dipendenza tecnologica o la spesa su determinati prodotti, servizi e offerte anche in ambito sanitario. Su questo tema vorrei tornare dopo, cioè sul tema dell'intelligenza artificiale, io la chiamo empatica o comunque emozionale che è un aspetto poi che ci riguarderà tantissimo nei prossimi anni, però adesso parlava di questo mercato dei dati che sono i dati del passato, quindi vorrei passare il microfono per chiedere innanzitutto due minuti se posso su translated visto che translated nasce se non sbaglio nel 99, alla fine del 99, quindi è un precursore di quello che è la traduzione, la domanda risposta diciamo, e che poi ha avuto uno sviluppo successivo, per cui credo che lei volevo chiederle due minuti sulla peculiarità di questa tecnologia trasformatore e come l'ha portata adesso a fare una valutazione proprio su quel crinale in cui siamo sulla protezione dei dati, i vecchi dati e i futuri dati, cioè cosa succederà a internet nei prossimi anni, in riferimento ai motori di ricerca, però ecco prima veramente due minuti su come, perché 99 sono 26 anni. Grazie dell'opportunità di vendere qualche traduzione, no allora ho fondato translated insieme a mia moglie Isabel che è qui nel 1999, è stato uno dei premissimi servizi di traduzione a internet e la traduzione è un po' la mamma di tutte le intelligenze artificiali, se pensate che Turing col primo computer l'ha fatto per tradurre enigma, che era una lingua artificiale della guerra, da sempre quindi si dice che essendo la lingua cosa ci distingue tutte le altre specie animali, essendo la migliore manifestazione dell'intelligenza umana quello è il problema più complesso per le macchine da risolvere e quindi molte delle innovazioni che vedete oggi sono nata nel mondo della traduzione. Translator che cosa fa? Crea sistemi di traduzioni simbiotica, cioè crea delle macchine che danno un pre lavorato al traduttore professionista che modifica e correggia l'errore della macchina, correggendo l'errore la macchina migliora e spinge in alto l'umano a far sempre meglio perché man mano che questo pre lavorato è migliore noi ci dobbiamo concentrare più sui aspetti emotivi, culturali di adattamento di questi contenuti da differenti culture, quindi un bel modello simbiotico che ha funzionato e con un po' qualche sistema di sostenibilità che ci siamo inventati, quindi distribuire la ricchezza fra noi e il traduttore man mano che facciamo intelligenza artificiale abbiamo creato le condizioni per cui questi traduttori amassero correggere la macchina perché ne ottengono un beneficio anche loro e quindi ci portiamo così in avanti. Quindi il transformer che usate tutti oggi, generative pre-trainer transformer GPT, c'ha GPT, si chiama transformer perché nel 2017 era stato inventato per tradurre. Poi questo caro amico Lukas Kaiser traslade, è stata la prima applicazione del transformer commerciale al mondo nel 2017. Poi Lukas mi ha chiamato un giorno e detto senti Marco ma invece che tradurre inglese francese proviamo a fare domanda risposta, è una formulazione semplice di estensione del problema e sì si può fare non solo i dati che è a disposizione non sono più solo le traduzioni che abbiamo fatto nel passato ma possiamo utilizzare tutto internet perché domanda risposta significa prendere una frase sopra, una frase sotto. Qui la quantità di informazione è diventata circa 100.000 volte più grande e con 100.000 volte più informazioni possiamo fare delle reti 100.000 volte più grandi e magia facendo queste reti molto più grandi la macchina è iniziato a dare segni di ragionamento, di reasoning, di capacità di pensiero. Quindi questo è successo e come dire i fatti, vi do la narrativa di questo, traslade se siete tutti clienti, non lo sapete, esempio se usate uber o rbmb tutti i contenuti tradotti lì quando chattate con volete prendere una casa quel sistema di traduzione e tutto quello che vedete su rbmb lo produce translated e aiutiamo tutte queste aziende californiane l'85 per cento del fatturato è fatto lì però vi dico anche che questo problema dei dati è sta diventando irrilevante e vi dico perché questo, vi parlo un po' del futuro, il futuro non è irrilevante la tutela attuale dei dati? L'orgomento sarebbe troppo brutto, allora sta diventando irrilevante la discussione su alcune peculiarità del dato, il dato rimane la sorgente massima da cui la macchina prende, però quale tipo di dato la macchina sta utilizzando oggi è una cosa di cui dobbiamo discutere, il futuro dicevo non è una questione di tempo, è una questione di spazio, in alcuni laboratori di ricerca io vedo quello che loro faranno fra 10 anni, fra 5 anni quello che il resto del mondo utilizzerà quindi è più una questione di geografia che di futuro quindi cerco di portarvi un po' di questo futuro poi lo interpretate voi vi do al solito dei dati su questo, allora prima di tutto abbiamo rotto internet, cioè tutto il dato di internet non è una violazione di qualche legge utilizzare questi dati, il problema è che stiamo violando un accordo sociale importantissimo, per 20 anni noi abbiamo prodotto, ognuno di noi ha prodotto del contenuto su internet e l'ha fatto gratuitamente perché l'accordo internet diceva più contenuto produco più il motore di ricerca mi porterà traffico sul mio sito e quindi con questo accordo tutti abbiamo voluto fare dati di pubblico dominio disponibile a chiunque perché google tratteneva pochi punti percentuali dell'economia internet, la gran parte il 99% di questo valore rimaneva al possessore del sito che riceveva il traffico e quindi gli vendeva dei servizi dei prodotti qualsiasi cosa con l'intelligenza artificiale specificamente con il large language model e il C-H-A-G-P-T, invece stiamo prendendo tutto questo contenuto che l'umanità ha prodotto e ha dato con amore a internet perché in cambio era qualcosa, lo utilizziamo, la macchina dà una risposta e ne mi porta più su quel sito e ne mi dà credito a quel sito su quel contenuto, non è una violazione di legge, questa è una violazione di un accordo sociale e quando gli accordi sociali vengono violati quello che cambia è che le persone modifichano i loro comportamenti, per qual motivo devo produrre contenuto oggi e metterlo su internet se non mi arriva quel beneficio questo cambia le regole del gioco, tanti perderanno, tanti che ne hanno basati i loro business model su questi qui, crolleranno, altri invece vengono attaccati meno, questo è un primo punto importante, la seconda cosa ed è il motivo per cui dico questa discussione sta diventando non rilevante è perché quel dato passato di tutti i dati internet, di tutti i libri ormai liberi da copyright non sono più i dati col quale addestriamo le macchine, le macchine attuali che stiamo addestrando sono come dei bambini, in una prima fase li abbiamo fatte andare a scuola, si chiama principalmente apprendimento supervisionato, cioè il bambino va lì, gli diamo delle nozioni di grammatica, delle nozioni di storia, gli diamo da leggere dei testi e da quei testi il bambino apprende, apprende anche dall'esperienza col mondo ovviamente però in quella fase l'apprendimento supervisionato cioè il contenuto conta finita l'università iniziamo a lavorare e la fase di apprendimento diventa una fase in cui le interazioni che noi abbiamo con le altre persone e il mondo ci portano la ricchezza e ci fanno crescere, noi continuiamo ad apprendere e oggi siamo qui sul palco non per quello che abbiamo studiato ma per quello che abbiamo appreso durante il nostro lavoro, quella fase importante, la prima fase dell'intelligenza artificiale è finita, i dati di web non servono più abbiamo preso l'1% di tutto il web di qualità e questo è già 100 volte superiore a quello che qualsiasi umano riceve nella sua vita come informazione quindi oggi la macchina sta apprendendo perché abbiamo aperto una porta da questo computer e abbiamo fatto uscire la macchina, la macchina inizia a prendere dalle interazioni che fa con noi nel mondo digitale e questa è una piccola parte e poi stiamo aprendo una nuova porta che si chiama l'EI fisica in cui consentiamo la macchina avere sensori, avere robotica e interagire col mondo fisico, questa parte dell'apprendimento sarà la parte più importante perché a differenza di noi umani in cui noi abbiamo avuto esperienze completamente diverse e anche se fossimo una settimana insieme voi non sarete mai in grado di trasferire le vostre grandi conoscenze a me le macchine sì, l'apprendimento federato fa sì che mentre queste macchine vanno fuori e aprendono interagendo con le persone col mondo fisico e tutto si possono trasferire l'apprendimento immediatamente tra di loro, questa seconda fase è la fase a cui dobbiamo prestare attenzione, la prima è già finita e non c'è più nulla da fare che quel dato lì ormai ha già fatto esattamente come se un bambino ha preso un ragazzo all'università facendo le fotocopie del libro invece che comprarlo oggi nessuno più si va a lamentare con lui per quella cosa lì fatta è andata l'abbiamo persa dovevamo fare dei sistemi di protezione dell'editoria al tempo ormai è troppo tardi lo stesso modo oggi secondo me e questo penso possa essere il mio contributo oggi dobbiamo stare attenti perché quel dato non serve più quindi abbiamo un nuovo dato e abbiamo l'opportunità invece di pensare cosa vogliamo per l'umanità cosa vogliamo per la società cosa vogliamo per l'europa rispetto a questi dati che saranno la battaglia per i prossimi non 30 anni i prossimi 5 perché questo è già iniziato chiarissimo direi anche perché poi c'è un tema di trasparenza delle fonti ma questo volevo poi fare una domanda a tutti perché visto che se è così ne sono convinto anch'io che i motori di ricerca hanno esaurito la loro funzione però c'è un tema di trasparenza sulle fonti motori di ricerca nel bene o nel male al di là del ranking ti aiutano a fare una valutazione le hai no ecco però finora abbiamo parlato diciamo di dispunti di di semeiotica di però diciamo i dati hanno anche un elemento tecnico un evento statistico e sicuramente la rivoluzione dei dati come la rivoluzione industriale impatta sulla sulla trasformazione della società per cui vedo che il professore che ha già il microfono infatti volevo chiedere a lei da un punto di vista più neutro e quindi un po al di là dal tema dalla parola colonizzazione ecco lei visto che si occupa principalmente di questo e comunque di informe di sistemi di informazioni e come come la grande montagna dei dati sta trasformando le aziende la società e il modo di approcciare il nostro modo di approcciarci entrambe le cose so che anche delle slide sono già ci sono perfetto grazie claudio mi piacerebbe parlare italiano però non posso purtroppo devo parlare in inglese e ho alcune slides per facilitare tutto questo so here i am vi parlerò proprio di questi aspetti a cui accennava claudio base myself a un listo e me ne sono in questi dieci minuti mi affiderò in un libro che ho pubblicato con cristina laio ma laimo professore di e sec pubblicato dal mit presse ed ha ottenuto un attenzione globale mette il massaccio set institute of technology e diciamo gli editori migliori al mondo allora ecco alcune delle cose che ho da dire sono leggermente diverse da quanto avete detto però si inseriscono bene in questo argomento riguarda noi dati come cambiano le aziende l'amministrazione ma anche in modo in cui cambiano il contratto sociale perché non ci possono essere dati senza un collegamento tra l'individuo e l'azienda l'individuo e lo stato o appunto gli enti pubblici e adesso vi spiego i dati spesso diamo tanto per scontato dato vuol dire dare appunto dal latino no però noi oggi utilizziamo in modo diverso questa parola e non ci cadono dal cielo questo è un punto molto importante ma semplice lavorare con i dati è molto diverso rispetto a lavorare con materie materiali che siano prodotti manufatti o trovate altro o tramite estrazione della natura dall'agricoltore quindi di nuovo questo non è il dato è petrolio come si dice petrolio di oggi e quindi lavorare con i dati è molto diverso rispetto a lavorare con i materiali visto che i dati non ci arrivano dal cielo dobbiamo capire da dove ci arrivano questi dati e a volte semplicemente vengono con la digitalizzazione di libri per esempio pensiamo a quello che ha fatto google ma i dati cui si riferiva marco sono dati prodotti giornalmente dall'interazione tra gli esseri umani tra gli esseri umani e le macchine e recentemente tra le macchine tra di loro l'interazione neanche questa ci cade dal cielo è progettata e anche quello che cercava di dire silvia utilizzando tutta una serie di convenzioni di tecnologie pensiamo alla storia dei motori di ricerca google lo decise nel momento in cui lo deciso ha mise la ricerca e il modo in cui l'individuo inizia la ricerca che fosse fondamentale lo stesso vale per instagram e facebook recentemente tiktok hanno ridesignato quelle che sono le interazioni sociali e adesso non ho tempo per adentrami nei dettagli ma capite tutto che questi click e che sono stati introdotti da queste aziende non sono mai esistite prima sono state realizzati da loro per adattarsi alla produzione di un certo tipo di dati ed un certo tipo di dati che sono per natura loro tecnologici e lo stesso vale per le piattaforme commerciali e anche per le piattaforme industriali ultimamente perché vengono trasformate per produrre servizi quindi non soltanto macchine come nel passato ma anche tanti servizi che hanno a che vedere con il funzionamento della macchina stessa che è chiamata manutenzione predittiva e quindi è importante notare che i dati di nuovo non ci cadono dal cielo ma sono stati progettati dalle aziende da certi individui e vengono prodotti con il presupposto e la prescrizione dettata da questo progetto da questo design originario e quindi le caratteristiche fondamentali di questi dati che sicuramente non rivaleggiano e hanno un costo marginale i dati non rivaleggiano è che se utilizzo un dato lo puoi usare anche tu se io invece ti mangio la bistecca non la mangi più quindi questo è il concetto no che non creano rivalità e i dati sono anche facili da riprodurre però riprodurre un tavolo di legno assorbe tutt'un una serie di risorse quindi hanno un basso costo marginale è stato utilizzato questo concetto dagli economisti per dire che diciamo i beni digitali hanno certi attributi ma se i dati vengono prodotti da interazioni che sono state anticipatamente progettate il modo in cui vengono gestiti i loro attributi prima che vengano gestiti sono tali per cui si disperdono in tutto il tessuto sociale si disperdono in tutto il tessuto economico non si può costruire un impero come la fiat o la general motors o la generale elettrica per gestire i dati occorre un'azienda che abbia braccia e mani in grado di aggrapparsi a tutti questi dati di raccoglierli su base giornaliera utilizzandoli in modo inventivo quindi i dati sono pesantemente disperse e sono contingenti su interazioni globali e dinamiche molto distribuite che vengono prodotte aggiornate mantenute utili e pertinenti su base giornaliera quindi se si utilizzano dati di questo tipo allora abbiamo bisogno anche di altre imprese che li gestiscano abbiamo bisogno di imprese che siano in grado di affrontare la progettazione di questa interazione il procurarsi di questi dati e come dicevo prima i grandi sistemi concentrati tipico del mondo industriale ma anche della prima era in formazione non sono in grado di gestire questi dati occorre anche il concetto di prodotto non avete parlato anche il concetto di prodotto di servizi che è fondamentale per la costituzione di un'azienda e per quello che produce per la gente la società quindi anche il prodotto servizio non è un buon riflesso di come questi servizi vengono prodotti oggi perché molti di questi servizi implicano e sono contingenti dal coinvolgimento dell'utente perché le raccomandazioni che ricevete da instagram o tiktok sono l'esito della vostra interazione col sito web e altre persone sempre con il sito web e questo viene realizzato sul momento il tempo reale non c'è un prodotto simile prima sì magari in luce ma questo viene adattato grazie all'interazione con l'utente lo stesso vale per i servizi di localizzazione oppure non ho tanto tempo per adentrarmi in questi esempi però immagino che abbiate compreso quello cui mi sto riferendo e da qui il titolo del nostro libro data rules le regole che riguardano i dati e le regole sui dati non sono altri che oggi abbiamo bisogno di imprese diverse per gestire i dati avete bisogno di piattaforme di ecosistemi di organizzazioni che siano in grado di affrontare la distribuzione piuttosto che la concentrazione dei dati aziende che siano in grado di utilizzare la centralizzazione decentrata magari suona contraddittorio ma non è così perché se pensate a come sono in grado a centralizzare queste grandi imprese poi a ricentralizzare decentrare insomma nell'utilizzo dei dati questo è ben comprensibile e spesso come scrivo sulla slide il prodotto servizio e l'interazione stessa per farlo le aziende devono modificare la propria cultura e la propria mentalità alcuni l'hanno fatto ma altri sono ancora nel mondo del passato perché questa distribuzione questa gestione di interazioni globali è dispersa non può avvenire tramite delle gerarchie dei sistemi di governance o di controllo che era tipico delle organizzazioni del passato occorre invece avere un sistema di governance distribuita cioè lo decidete voi ma lo dicono altre aziende occorre avviare delle negoziazioni su cosa produrre come utilizzarlo come distribuirlo e non quindi una governance unica o gerarchia o controllo e a questo punto la trasformazione dell'azienda nel mondo economico avviene con la trasformazione della società non perché queste cose devono essere utilizzate dallo stato ma anche perché la relazione tra le imprese e le persone tra le imprese e gli individui tra le imprese e il sistema politico stanno cambiando in modo radicale grazie mille vorrei prendere spunto un po dai vostri interventi e tre cose mi e fare una domanda una a tutti e quattro trasparenza approccio e centralità dell'uomo perché noi siamo animali politici e a un certo punto ok entriamo in una fase in cui l'intelligenza artificiale apprende da sola comunicando in modo federale con le altre macchine ma anche con gli umani se e non ho dubbi di immaginare che non sia così e il periodo scolastico dell'intelligenza artificiale è terminato la prima domanda è come è stata nutrita nel complesso chi ha dato da mangiare quali fonti ha ricevuto che spunti politici hanno nutrito l'intelligenza artificiale mi spiego meglio fino a un po di tempo fa ciò che era fisico era per definizione vero comunque reale poi abbiamo cominciato a capire che c'è un modello c'è un qualcosa di virtuale e per chi è cresciuto in un mondo analogico per definizione virtuale non era vero ma in realtà una cosa esiste anche dal punto di vista o esclusivamente al punto di vista digitale per cui una prossima generazione come potrà sapere che non avendo più a disposizione un motore di ricerca delle fonti tradizionali che quel mondo descritto in futuro da un'intelligenza artificiale che apprende sia corrispondente a quale realtà sarà per definizione vero cioè e poi non voglio allargarmi troppo il processo di trasparenza è perso oppure possiamo ancora intervenire come dovremo approcciarci da questo punto di vista perché e quindi se le macchine crescono da sole e quindi quella sarà una realtà sarà una verità l'uomo che che ruolo avrà nella società sarà al centro non ci sarà più un centro non c'è più un baricentro e quindi mi interessano i vostri punti di vista ognuno nella specificità che rappresentano terrei lo stesso ordine giusto per per seduta non so se sì sì la domanda è chiara la risposta è complessa ma rispetto a quello che diceva trombetti anche il professor khalil cosi ci sono sicuramente degli elementi di verità in quello che loro spiegavano anche perché sono due analisti dell'ora e di quello che è il futuro chiaramente tutti noi sappiamo e tutti e tutti tanti ci dicono la fase del pre training è perso cioè abbiamo perso la prima battaglia però intanto non c'è ragione di smettere di combattere primo altrimenti non faremo il lavoro che facciamo e non lo faremo bene non lo faremo seriamente non lo faremo nell'interesse dei cittadini secondo elemento è che se la battaglia è persa perché tante realtà che lavorano in questa direzione sono così preoccupate delle regole ed e guard rail se lo sono evidentemente ci sono ancora altri dati al con ancora altre cose che le quali loro hanno bisogno per sviluppare questi sistemi allora è vero che in passato non abbiamo visto arrivare la colonizzazione del dato ma adesso che ci siamo resi conto e devo dire che per una volta l'europe ha risposto in maniera rapida con le act quindi anche questo siccome parliamo sempre criticamente delle norme europee del libero regolazione europea ma l'europe questa volta è sulla partita e l'italia anche perché ha un disegno di legge che è già stata approvato al senato e che ora in discussione alla camera che in qualche modo si allinea con lei e portà un contributo ulteriore che per il mondo dell'informazione ma anche per il mondo complessivo estremamente positivo perché un'innovazione assoluta che la nuova fatti specie di reato del di fake che è contenuta in questo disegno di legge ecco allora teniamo presente che quello che dicevano è assolutamente vero però è altrettanto vero che questi sistemi hanno bisogno di aggiornarsi continuamente per esempio nel nostro mondo nell'informazione la realtà cambia di minuto in minuto quindi non possono essere stati addestrati su cose che non sono ancora successe dobbiamo porci il problema di come lo addestriamo da ora in avanti e quale sarà la verità opposte verità con il quale i cittadini si dovranno confrontare perché se l'informazione come dicevo prima è un bene raro e soprattutto costoso perché oggi mandare qualcuno con le scarpe sul terreno in Ukraine o in Medio Oriente o a Gaza è molto rischioso complesso e costoso produrre una fake news con un video trovato da qualche parte non costa nulla ma sposta l'opinione in maniera drammatica quindi io dico sicuramente non abbiamo visto arrivare alcuni nemici del dato o alcuni come dire colonizzatori del dato e abbiamo sbagliato noi tutti a dargli perché i dati le abbiamo dati noi però oggi ci stiamo rendendo conto di quello che è l'effetto boomerang di questo percorso quindi da oggi da ora in avanti dobbiamo capire che alcune interazioni devono cambiare a nostro vantaggio dunque abbiamo tempi televisivi per un tema enorme lo so mi dispiace un po in difficoltà potevamo però stare 5 ore nel senso che poi allora punto numero uno parzialmente d'accordo sul fatto che siamo al termine della prima parte della formazione dell'intelligenza artificiale perché non mi risulta che i dati pubblici siano stati utilizzati per alimentare il language model quindi tutta la parte parlo del senso i dati pubblici i nostri dati pubblici sanitari fiscali catastrali io non penso che siano stati utilizzati e quindi questa parte qui dovrebbe riguardare il secondo round della formazione quindi quantomeno le medie o l'inizio del liceo e qui noi possiamo intervenire rispetto agli stati uniti per esempio riprendendo la considerazione fatta dal sottosegretario prima sull'out out posto a trump l'operazione doge io credo include anche un'operazione invece di questo tipo cioè di accesso da parte dei privati sui dati pubblici e mi risulta che siano in vendita nel dark web i social security numbers per pochi dollari dei cittadini americani cioè il codice fiscale che comporta poi anche la conoscenza di tutta una serie di materie complicate adesso da spiegare tornando in europa l'ai act ha un principio di escalation del rischio molto interessante condivisibile prevede per l'italia l'istituzione di una authority non se ne è più parlato ma lì è prevista un'autorita magari in italia non si farà si faranno altre cose in ogni caso di un controllo da parte del pubblico su come viene sviluppata intelligenza artificiale che non va ovviamente ostacolata va aiutata a evitare comportamenti fraudolenti questo è il punto principale sui dati lato società private io ho proposto da tempo per ora la cosa non è andata avanti però proporrei di includere l'approvvigionamento nonché l'utilizzo di dati fraudolento ovviamente non fatto secondo la regola della gdpr che è quella privacy all'interno della legge 231 che regola la vita degli amministratori delegati perché questo e le verebbe tra virgolette al penale l'uso di fraudolento e i dati e eviteremo probabilmente maniera un pochettino più efficace di essere chiamati a tutte le ore con delle telefonate spiacevoli sui curriculum piuttosto che su cose dell'acqua non mi ricordo come si chiama non so ma sei depuratori direi questo è la proposta questa questa questo è più o meno il quadro dal punto di vista dell'opinione pubblica c'è una grandissima difficoltà nella gestione della privacy grande paura dei propri dati soprattutto quelli bancari sanitari e che quindi le persone sono molto attente intelligenza artificiale viene percepita come un rischio da questo punto di vista non per esempio come potenziale strumento di non so identificazione della cura del cancro perché se noi la spiegassimo in questo modo sicuramente saremmo tutti favorevoli il problema è come ci si arriva a questa soluzione con quali dati e chi li ha ceduti grazie ok prego grazie e io mi sono segnato dati centralità dell'umano e trasparenza sui dati diciamo le cose come stanno il dato privato quello che lei ha appena parlato di dato pubblico giustamente lo parla come pubblico perché di origine pubblica no e quello è un dato privato i nostri dati privati noi dobbiamo proteggere e fare tutto quello che possiamo per creare dei sistemi di protezione di quello che è l'informazione che non vogliamo condividere con gli altri e questo è ovvio dobbiamo creare delle regolamentazioni che ci permettono di essere competitivi a livello globale e nello stesso momento mantenere i principi e i valori che hanno reso l'europe quello che è detto questo qualche informazione per voi il large language model tutti sono allenati con quattro fonti di dati molto semplici che tutti quanti utilizziamo e sono di pubblico dominio uno si chiama common crawl che è un'associazione che ha raccolto il web prima ce l'ava solo google e microsoft e per renderlo accessibile a chiunque ai centri di ricerca fatto uno snapshot si chiama hanno preso una piccola fotografia di internet e fanno questa foto circa ogni sei mesi questo rappresenta il top 1% del web cioè le pagine web più visitate e più di maggiore interesse che sono pubblico di pubblico dominio e che tipicamente non hanno un notice di copyright netto scritto cioè non c'è qualcuno ha detto questa pagina è protetta da copyright non la puoi utilizzare questo è come un crawl l'1% del web questo è la base di allenamento sono circa 10 trilioni di parole ed è la base di allenamento dei language model il secondo gruppo di dati si chiama wikipedia che conoscete tutti ed è un ciclo di aperta pubblica che ha una licenza d'usa estremamente aperta che consente tutti i lavori derivati a tutto fatto appositamente wikipedia è così importante come contenuto che anche se piccola meno di un trilione di parole su 15 viene pesata 10 volte di più nell'addestramento per dare più peso alle sorgenti importanti la terza fonte di dati si chiama i books e sono una collezione di tutti i libri per cui è scaduto il copyright quindi tutti i libri credo che abbiano più di 25 anni di pubblico dominio quindi quello che l'umanità ha prodotto e che oggi per qualsiasi scopo appunto sono utilizzati per pubblico dominio una buona associazione si è occupata di riorganizzare questo patrimonio dell'umanità che altrimenti no è tutto nelle mani di pochissime persone perché google aveva accetto a questo ha fatto google books per questo motivo gli altri microsoft ha fatto la stessa cosa poi delle associazioni hanno detto democratizziamo a tutti i centri di ricerca e a tutte le piccole startup l'accesso a questa informazione tanti finanziamenti e l'hanno fatto e l'ultimo e github che diceva che cos'è è codice sviluppatori che scrivono codice si è scoperta questa macchina che se gli insegna a vedere come la gente scrive codice quella è un'altra lingua una lingua artificiale la programmazione però ti dà molta struttura mentale modo di ragionare quindi è stata molto utile questo è la base col quale ciaggpt clod di antropic lama di psik sono allenati sopra questo qui le aziende oggi open ai sta spendendo circa 500 milioni amazon 650 google forse si è arrivata quasi a un miliardo dove loro pagano delle persone per produrre dei nuovi dati quindi diciamo in medicina mi mancano queste informazioni mi crei dei testi di medicina traslator del nostro lavoro noi questo anche questo lavoro i nostri linguisti no producono contenuto nuovo specifico in campi dove internet non è soddisfacente e lo fanno no ha una specializzazione medicina e scriveranno di medicina quindi vengono vengono pagati dei dati questo è tutto quello su cui viene allenata la macchina ed è stato sufficiente per arrivare al livello che vedete oggi quindi questo ve lo dò come dato perché alcune volte nelle discussioni ci confondiamo e pensiamo che ci sia come dire qualcosa di del furto di informazioni o altro questo è la base poche ci siamo dei cattivoni fuori che fanno le cose diversamente sì per esempio i cinesi di psik hanno detto siccome open ai ha speso un sacco di soldi per fare questi test set di matematica ha pagato degli umani per per per scrivere dei problemi di matematica quello era molto costoso e loro hanno fatto una cosa si chiama la distillazione cioè hanno chiesto a cgpt di risolvere i problemi di matematica e hanno usato dei dati sintetici di là quello che hanno pagato 50 milioni di euro open ai loro con mille euro se non sono distillato quindi cattivoni sì no probabilmente una violazione di queste regole qui e cioè quindi questo è il dato e volevo solo dire quindi il punto di partenza di questo qui poi dobbiamo proteggere la nostra informazione non dobbiamo a nessuno consente di utilizzare il nostro dato privato oggi quello è il dato con cui vengono allenate le macchine sulla centralità dell'umano e devo fare un po lo sceriffo del loro logico come si suol di me vi dico questo dobbiamo essere un po più umili dobbiamo capire una cosa importantissima che se una volta ci avevano convinto che la c'è la terra fosse il centro dell'universo poi abbiamo capito che forse c'era il sole che poi forse il sole non era stesso il centro dell'universo oggi una narrativa importante che ci fa comodo ci siamo messi noi umani al centro dell'universo bene in biologia noi comunque ci dobbiamo rendere conto essere umili sul fatto che non siamo l'intelligenza massima possibile in biologia in biologia puoi fare 100 volte di più con quello che noi abbiamo quindi esistono probabilmente altre specie ben più intelligenti di noi se guardiamo invece la fisica e quindi non usiamo la biologia ma utilizziamo la materia e quindi l'artificiale il limite superore è molto più alto non c'è niente che dica che noi siamo limite maggiore quindi se noi accettiamo questa cosa secondo me noi possiamo guardare al futuro dell'intelligenza artificiale come un bellissimo modo per risolvere dei task dei problemi che hanno valore economico e smettiamo di cercare di replicare l'unicità e la bellezza dell'essere umano perché non ne ha senso ci sono cose specifiche e importanti di valore economico per la società che dobbiamo fare e replicare l'umano che più ci sentiamo centro di tutti e più stiamo cercando di creare macchine che ci assomigliano questo non ha senso esattamente come la calcolatrice per fortuna fa i conti meglio di noi e non l'abbiamo disegnata cercando di replicare il cervello umano siamo unici siamo bellissimi viviamoci la nostra natura per quello che è risolviamo problemi economici ha detto poco grazie grazie a lei professore la chiusura posso parlare in inglese sì sì scusami i want to repeat all other date vorrei ripetere questo tutti i dati di cui avete parlato esistevano anche prima nella storia gli unici dati che sono nuovi sono quelli fatti dall'interazione umana attraverso la progettazione dell'interazione da macchina a macchina questo è proprio il segno di questa era di questa età tutti gli altri tipi di dati esistevano prima certo oggi possono essere usati diversamente per via del fatto che sono digitali però appunto questo c'era e limite c'è noi produciamo tonnellate di dati attraverso le nostre interazioni quotidianamente mi voglio assicurare che voglio e questo avviene questo proprio un segno dei nostri tempi e questo noi lo facciamo spesso noi pensiamo che tutti questi dati parlino di privacy che siano nostri ed è parzialmente vero senza facebook senza google questi dati non sarebbero mai stati prodotti e quindi è molto importante e pensare a questo in termini più ampi la maggior parte di noi non hanno scritto un contratto con facebook che l'europe ha applicato un anno fa per esempio noi lo vogliamo gratuitamente il servizio di facebook e non ci interessa minimamente non so se avete capito cosa volevo dire non ce ne frega niente della privacy in sostanza e queste cose vanno prese in considerazione se no si parla di cose che non hanno se certo l'integrità dell'individuo importante la sua sicurezza è molto importante ma questo va fatto in un contesto e va visto in un contesto diverso e per chiudere riallacciandomi alla sua ultima domanda qual è la collocazione dell'essere umano come colloquiamo l'essere umano in tutto questo abbiamo abbiamo perso ma abbiamo anche guadagnato tanto io ero in toscana la settimana scorsa poi sono andati in borgonia io ho usato appunto cose per imparare sono servizi importanti che nessuno mi avrebbe potuto dare informazioni che ho potuto utilizzare questo va riconosciuto insieme ovviamente al riconoscimento dei problemi che questi creano perché sì i problemi li creano non è che siamo peggio rispetto alle generazioni precedenti è questo che voglio o se stiamo peggio allora la rivoluzione industriale ha peggiorato la situazione rispetto a quella agricola dobbiamo mettere le cose in prospettiva non è che il mondo crollerà domani non è che google facebook e tiktok ci domineranno questo non è vero è una questione un panorama molto più complessa che riguarda l'ambito economico e sociale il posto dell'uomo sarà sempre buono faremo progresso e alla fine vinceremo sull'altro questo è che cosa significa il progresso della civiltà se qualcuno ha delle domande da fare possiamo rubare ancora qualche minuto se qualcuno fosse interessato vedo una mano alzata qui grazie sono Roberto Valenti sono un avvocato sono partner di DLA piper che è uno degli uffici a sponsor grazie innanzitutto perché è stato un dibattito molto interessante la mia domanda è si è parlato molto di EUI act ma in realtà sui dati c'è qualcosa che succede domani perché a settembre di quest'anno entra in vigore il data che molto più pertinente alle cose di cui stiamo parlando perché riguarda i dati generati da dispositivi connessi tutti quelli che noi generiamo automaticamente nell'interazione delle macchine e questi dati se non si adottano determinate precauzioni dovranno essere messi a disposizione per ragioni di trasparenza secondo me condivisibili sulla base un regolamento europeo dovranno essere a disposizione messi a disposizione dell'utente che ne faccia richiesta e dei terzi ecco la mia sensazione è che ancora le società non abbiano soprattutto le imprese private non abbiano percepito in modo consapevole l'importanza di queste legislazioni e l'importanza dei dati che stanno raccogliendo a livello diffuso e non abbiano ancora come dire non siamo ancora intervenuti nella creazione di infrastrutture che consentano diciamo una piena protezione di questi dati e quindi un loro sfruttamento a beneficio dei loro interessi. Volevo sentire i panelist che ne pensano. Tutto ciò non abbiamo affrontato il tema del come tutto ciò che è ricchezza e la protezione della ricchezza perché poi il tema cyber è ancora oggi è un tema complesso nel senso che andrebbe approcciato in modo militare però un tema duale quindi capire anche che ci sono tecnologie che un tempo nascevano militari oggi non ha più senso dire cos'è una cosa militare cos'è una cosa civile in una sesta dimensione è una cosa duale e questo probabilmente complica tutto però poi lascio la risposta. Io credo che abbia molto ragione cioè molte società io mi occupo più di elementi che riguardano per esempio il copyright perché noi stiamo facendo una lungo percorso di difesa del copyright all'interno delle norme e anche dell'applicazione che con l'intelligenza artificiale diciamo avrà il tema del copyright molte società sono continuamente alla ricerca di scappatoie per evitare di rispondere ai regolamenti piuttosto che cominciare a riflettere su quelle che dovrebbero essere le risposte continuano sia nel nostro Paese sia soprattutto nelle sedi europee dove lei sa esistono studi legali che di questo diciamo fanno attività prevalente cioè la ricerca di scappatoie per interpretare i regolamenti europei sta accadendo esattamente questo e anche il codice di buone pratiche che noi adesso stiamo seguendo con le riscritture che parla diciamo di sostanzialmente pratiche di buona condotta e ma le pratiche di buona condotta non sono sufficienti servono normative che consentano diciamo i cittadini di conoscere il percorso di trasparenza ma soprattutto servono anche poi sanzioni perché se la sanzione è solo della munizione è chiaramente diciamo c'è un interesse commerciale da una parte regolatorio dall'altra e le due cose non si abbinano. Non vedo benissimo ma non mi sembra ci siano altre richieste. Ah sì, ecco. Prego. Una domanda per il sottoserretario. Allora lei parlava appunto della capacità di essere usi specifici con i dati etc. E anche al proposito della dualità. Riguardo a diciamo la veridicità delle notizie e le varie conseguenze che queste hanno. Non è, dato che è difficile regolare l'internet, non è più importante in questo momento magari focalizzarsi sugli interessi che stanno dietro chi propone una tale retorica. A me sembra che lei forse aveva partecipato a qualche evento di l'IMES per esempio. Non ha più senso in questo momento capire perché magari un attore vuole farmi percepire una notizia in un certo modo più che inseguire le notizie come singoli eventi o come vediamo nella guerra che sono raccontate come eventi di cronaca e un'esternità nera un po' non collegati l'una all'altra senza capire una logica che ci sta dietro i vari agenti che interessi hanno. Ma è sicuramente una domanda molto interessante però lei deve tenere presente che come esponente del governo la principale missione che noi abbiamo è quella della libertà di difesa, della libertà di stampa e della libertà di espressione sempre. Quindi non è credo compito di un'istituzione governativa quella di indagare quali sono le intenzioni che generano un flusso di notizie, una gestione, un orientamento delle notizie. Il nostro compito è quello di garantire un sistema della difesa, un sistema integrato dell'informazione, un sistema reputazionale, quindi un'informazione che abbia la base solide esperienze professionali e solide strutture professionale, tanto vero che quando noi lavoriamo sulla contribuzione al sistema editoriale indaghiamo per esempio sul numero dei giornalisti presenti, sulla contrattualizzazione dei giornalisti presenti, sulla solidità dell'editore e tutto su una serie di parametri perché questo è per noi il tema principale. Ma rispetto a quello che non volevo eludere la sua domanda è del tutto evidente e io come diceva il collega Nasco giornalista, noi dobbiamo sapere che ogni diffusione di notizia soprattutto nelle aree critiche comporta un interesse, cioè la cosiddetta guerra ibrida dell'informazione che si combatte ogni giorno a Gaza, a Gelsalemme o in Ucraina è una guerra che viene combattuta perché ogni immagine, ogni notizia, ogni lancio di agenzia che esce da quei territori ha prevalentemente, se non è prodotta da qualcuno che è nella zona, ha un potenziale, diciamo una potenziale fonte e quella fonte non sempre trasparente. Quindi questo è del tutto evidente che è un flusso ma non è e non può essere e aggiungo non deve essere un compito governativo quello di indagare. Noi abbiamo bisogno di editori il più possibile, come diceva Silvia Castagna, liberi che facciano un lavoro il più possibile lontano da un interesse commerciale, un interesse poi politico ideologico perché chiaramente quelle poi sono libere espressioni e idee ma il tema è sicuramente delicato. Io aggiungo anche che rispetto al tema di cos'è la verità e cosa non è la verità, sono rimasto colpito perché sembro una persona che ha timore dell'innovazione e non lo sono affatto, mi piace moltissimo l'innovazione quindi sperimento e cerco di capire come funzionano gli strumenti. L'altro giorno preparando un intervento cercavo, avevo in memoria una frase di John Milton di un libro che si chiama L'aereoepagitica che è un libro fondamentale per la difesa di libertà di stampa, avevo in testa una citazione, l'ho messa su un sistema di intelligenza artificiale e il sistema di intelligenza artificiale mi ha restituito esattamente la citazione che avevo in mente ma me l'ha restituita perché gliel'avevo scritta io, non esiste nel libro ma ha voluto dare ragione al sistema di intelligenza artificiale. Lei capisce quanto è delicato questo processo, cioè il sistema mi ha voluto dare ragione, non mi ha dato l'informazione reale ma mi ha secondato. Questo attendere sarà un gravissimo tema perché se le persone non cercano di informazioni, cercano di approfondire e c'è un'indagine americana che dice che oggi il 90% delle persone che cercano informazioni sul sistema di intelligenza artificiale si fermano alla sintesi, non vanno alla fonte. Essendo un pochino libera di rispondere, volevo portare dei dati perché questo è un tema che io studio per lavoro. Vado per punti. Il covid, tutta la pandemia ha molto resettato la capacità mondiale di chi legge le notizie di fare un ranking mentale di fiducia in termini di fonti. In Italia in particolare, a un certo momento l'unica fonte è stata, se vi ricordate, la conferenza stampa delle 8 di sera al TG1 e tutto quello che veniva detto prima aveva il disclaimer però dobbiamo attendere la conferenza stampa. Questo ha resettato completamente il ranking delle fonti per cui oggi i dati sono che si fa ben differenza quando si leggono le notizie in funzione del canale, della fonte, della persona che ne parla. Quindi ognuno di noi ha una reputazione, ogni testata ha una reputazione e pesa, come Wikipedia viene pesato 10 volte, o 100 quant'era, ed è lo stesso meccanismo mentale che abbiamo. L'intelligenza artificiale in Europa in campagna elettorale nell'Europa e non ha pesato, quindi questo spostamento di opinione non c'è stato. Fondamentalmente ognuno di noi ha avuto una campagna elettorale anche molto breve se non ricordo male. Terzo, le pene, ovviamente la mia proposta di includere nella GDPR il discorso dell'uso e approvvigionamento fraudolento dei dati dovrebbe prevedere anche il sequestro, la restituzione di tutto il maggior guadagno ottenuto attraverso l'uso di quei dati, perché se non lo dovevi avere il dato non potevi guadagnarci. Grazie. Purtroppo mi dispiace ma l'orologio ci impone di terminare, spero che in futuro ci sia una seconda puntata perché abbiamo solo iniziato a scalfire un po' la superficie. Grazie a tutti per l'attenzione, per la partecipazione e a voi per i vostri interventi. Grazie a tutti per l'attenzione, per la partecipazione e a voi per i vostri interventi.

Colonizzatori di dati

Relatori

Edizione

{{section.title}}

{{ item.title }}