Taleb II.

A quanto pare questo Taleb ha moltissimi fans, ed e’ (per via della teoria della  montagna di merda) assai difficile debunkare efficacemente le cose che dice. Vediamo di riassumere: Taleb prende un’idea di Asimov (il Mulo), e si sforza di portarla sulle scienze economiche, evitando accuratamente di studiare due pagine, dico due pagine, di matematica. E cosi’, dopo aver copiato uno dei miei autori preferiti (Asimov) inizia a ciurlare nel manico per tenere in piedi le fesserie che dice. Vediamo perche’.Faro’ alcuni esempi MOLTO euristici, cosi’ non serve discutere degli esempi ma dei concetti.

Esempio primo: il bicchiere sul tavolo. Ovvero, la probabilita’ di stato, questa sconosciuta.
Taleb NON conosce, evidentemente , alcuna formula sulla probabilita’ di stato. Prendiamo un bicchiere sul tavolo. Se e’ molto vicino al bordo si trovera’ in uno stato di “probabilita” molto piu’ alto di cadere, rispetto alla situazione in cui si trova al centro del tavolo. In generale, potremmo far cadere il bicchiere e misurare la probabilita’ di stato della configurazione che ottengo. Cocci per terra, eccetera. Diciamo che sara’ un qualche K moltiplicato per una funzione tipo ln P(rotto).
K*ln P(rotto) misura, se vogliamo, l’entropia della stanza quando il bicchiere e’ caduto al suolo e si e’ rotto. Se supponiamo che ci sia un solo modo di rompersi e di cadere, allora possiamo dire che P(rotto) sia la “probabilita’ di stato” che il bicchiere si trovi rotto sul pavimento.
Adesso prendiamo il bicchiere sul bordo. Se calcoliamo la sua probabilita’ di stato , che sara’ K*ln P(bordo) , possiamo calcolare una differenza tra K* ln P(rotto) e K*ln P(bordo). Allo stesso modo, se abbiamo il bicchiere al centro del tavolo, possiamo calcolare K*ln P(centro). E possiamo calcolare la differenza tra K*P(centro) e K*ln P(rotto).
Qualcosa mi suggerisce che queste due differenze siano molto diverse. Per i fisici, quelle differenze sono essenzialmente energia. E questo vi dice, intuitivamente,  che per far cadere un bicchiere che sta sul bordo basta MENO energia di quella che ci vuole per far cadere un bicchiere che sta sul centro.
Che cosa significa questo esempio nei confronti del discorso di Taleb? Ci dice due cose.
  1. Se non e’ possibile calcolare che il bicchiere cadra’ domattina alle 9, e’ possibile calcolare la “distanza di probabilita’ di stato” tra il bicchiere che sta al centro tavola e la caduta, e determinare che la differenza tra probabilita’ di stato sia diversa nel caso del bicchiere sul bordo. Il bicchiere sul bordo, cioe’, e’ sul piano probabilistico piu’ “vicino” a cadere.
  2. Se supponiamo che il resto dell’edificio ove si trova il bicchiere sia immobile, diciamo a 0K , non fa alcuna differenza se consideriamo le probabilita’ di stato dell’intero edificio con il bicchiere dentro una stanza e sul bordo del tavolo e il bicchiere rotto dentro la stanza sul pavimento e il bicchiere dentro la stanza sul centro del tavolo. L’evento, cioe’, e’ LOCALE quando possiamo ignorare gli scambi di energia oltre una certa distanza.
Secondo punto che Taleb ignora quando si sforza di trasformare Asimov in una teoria scientifica. Tutte le sue teorie sono scleronome, cioe’ ignorano il dominio del tempo.
Prendiamo Ivan  e Carmen. Ivan vive in Russia e Carmen in Brasile. Essi nascono nel 1980. Se chiedessi ad un fisico quali siano le probabilita’ che Carmen e Ivan si sposino nel 2001, e ci troviamo nel 1981, il fisico mi dira’ che tutto si perde nei grandi numeri.  Sembriamo ciechi , come dice Taleb.
Adesso siamo nel 2000, e Ivan decide di spostarsi, per ragioni di lavoro, in Brasile. Se nel 2000 chiediamo ad un fisico quante siano le probabilita’, dira’ circa la stessa cosa, ma dira’ anche che, rispetto a prima, c’e’ stato un GIGANTESCO miglioramento, che si perde pero’ nella GIGANTESCA improbabilita’ che due si sposino solo perche’ entrambi in Brasile.
Adesso siamo nel febbraio 2001, e Ivan si prepara ad andare ad una festa. Anche Carmen si prepara ad andare a quella festa. Se chiediamo ad un fisico quali sono le possibilita’ che si sposino, beh, potrebbe dirvi che un matrimonio su centomila in Brasile nasce tra persone che si sono conosciute ad una festa. Mica male.
Durante la festa, solo mezz’ora dopo, Ivan e Carmen stanno flirtando. Se chiedessi ad un fisico quale sia la probabilita’ indicando i due in quel momento, prendera’ delle statistiche brasiliane su quanti si sposano dopo aver flirtato. E andiamo gia’ meglio, almeno numericamente.
Se entriamo in scena qualche mese dopo, quando Ivan e Carmen sono sull’altare e tra dieci minuti si sposeranno, un fisico mi direbbe che solo una coppia su centomila rompe il matrimonio da quel momento in poi. E quindi, stimera’ un 99.999% di probabilita’ che si sposino.
Morale: fare predizioni sulla base del calcolo statistico e’ un’operazione che non ha nulla di scleronomo. Il concetto di “futuro” parte dal momento e dalla situazione in cui facciamo la previsione.
Quindi no, non siamo completamente “ciechi” di fronte al caso. Conosciamo la formula per calcolare entropia e probabilita’ di stato. Sicuramente calcolare la probabilita’ di stato del mondo con Ivan neonato a Mosca e Carmen neonata a San Paolo e fare le differenze e’ computazionalmente troppo complesso. Ma questo NON perche’ noi NON conosciamo la formula. Perche’ non abbiamo abbastanza dati E perche’ non abbiamo abbastanza potere di calcolo. La formula della probabilita’ di stato per una data configurazione la conosciamo:
L’equazione di Boltzmann per un sistema chiuso (nell’esempio sopra, il tavolo-bicchiere che non cambia energia).

E la formula per leggere la cosa in termini di informazione la conosciamo anche quella:

Cosi’, non e’ che sia concettualmente ignota. E’ semplicemente difficile da calcolare perche’ quella Omega sopra e quella E sopra sono un pelino complesse computazionalmente per grandi contesti, dove per “grandi” intendo che il bicchiere nella stanza sul bordo del tavolo con la gente che cammina e’ gia’ enorme usando questo approccio. Ma non perche’ l’approccio e’ sbagliato: perche’ non abbiamo calcolatori abbastanza potenti.
Stabilito che Taleb sia cieco solo perche’ conosce solo la gaussiana come strumento di calcolo di eventi statistici, e non conosce nulla di termodinamica statistica, ne’ di sistemi stocastici.
In pratica, Taleb attribuisce all’umanita’ i propri limiti, e da quel momento puo’ solo copiare Asimov e sperare che tenga. Adesso andiamo al punto del talento, prendendo l’esempio che Taleb fa della scrittrice di successo. Taleb dice che era impossibile stabilire il successo della Rowling con Harry Potter.
Come ho gia’ detto sopra, pero’, questa affermazione ha due grandi limiti. Quanto e’ locale, e in quale momento facciamo la previsione.
Quando nasce la Rowling, diciamo lo stesso anno, ci sono 500.000 neonati inglesi. Cosi’ posso chiedermi “qual’e’ la probabilita’ che la Rowling sia autrice di un best seller, piuttosto che un altro neonato”? Beh, se supponiamo che uno di quelli scriva un best seller, siamo ancora ad 1/500.000.
Dopo 13 anni, pero’, la Rowling legge 30 libri l’anno e tra i suoi coetanei non e’ cosi’ comune. Allora, diciamo che su 500.000 bambini della stessa eta’, siamo scesi diciamo a 5000.
Se adesso prendiamo Taleb, non e’ affatto scontato che le probabilita’ siano spalmate equamente su tutti. La domanda “chi sara’ il prossimo scrittore di best-seller” , se assumiamo che uno di loro lo sara’, non punta indifferentemente su uno qualsiasi dei 500.000, ma sull’ 1% di loro. Il che, anche parlando di gaussiane, non e’ malaccio.
Quando arriviamo a 18 anni, la Rowling oltre a leggere decide di fare un corso e inizia a scrivere. Ma anche questo non e’ comune, e dai 5000 siamo gia’ scesi si e no a 50/100. Se Taleb mi chiede chi sara’ a fare il best seller tra pochi anni tra i coetanei della Rowling, da 500.000 siamo gia’ scesi di un fattore mille.
Se 20 anni dopo la rowling decide di mettersi su internet, mentre gli altri non lo fanno, diciamo lo fanno uno su 10, siamo scesi di un fattore diecimila. Su quei 500.000 coetanei, solo 5-10 possono venire scelti su internet, se assumiamo che un autore scelto su internet diventi best-seller.
Se 21 anni dopo le case editrici decidono di cercare gli autori scandagliando il web, e io calcolo le probabilita’, questo gruppetto di 5/10 persone brilla, in confronto a tutti gli altri coetanei.
Detto questo, Taleb mi dice che tra quei 5/10 io non posso scegliere per talento, quindi il talento non conta. Il che e’ una cazzata, perche’ stiamo scegliendo il bicchiere piu’ vicino al bordo dell’esempio precedente. I 5/10 indistinguibili dalla Rowling per talento HANNO LO STESSO TALENTO. Ma non sono SENZA TALENTO.
TAleb nel fare l’esempio della scrittrice, sta dicendo una frase che si scrive cosi’: “chi, a pari talento, vince la gara, non e’ distinguibile dagli altri misurando il talento”.
Da questo, essendo Taleb a digiuno di logica, deduce che il talento non conti, come se QUALSIASI ALTRO INGLESE avesse potuto scrivere Harry Potter, e non solo un PICCOLO sottoinsieme capace di scrivere un libro. Egli non si rende conto che “persone con uguali talenti” e “persone SENZA talento” NON sono la stessa frase.
“Persona senza talento” io lo scrivo (nel senso di insieme) come
“per ogni  x , persona(x) => (talento(x)=0).
“Persone con lo stesso talento” io lo scrivo circa come
“per ogni x,y (persona(x) ∧ persona (y)) =>  (talento (x) = talento (y)).
“Persone che fanno gli scrittori con lo stesso talento” lo scrivo circa come
“per ogni  x,y , ((persona(x) ∧ persona(y)) ∧ ((scrittore(x) ∧ scrittore(y))) =>  (talento(x) = talento(y))”
Il problema e’ che io, poi, “la persona e’ uno scrittore” vado a pensarlo cosi’: x e’ uno scrittore se
per ogni x, persona(x) => (talento(x) = scrittore(x))
Quando lui dice “non posso sapere QUALE scrittore fara’ un best-seller” pensa di escludere il talento dal gioco, senza rendersi conto che nel momento in cui dice “scrittore” sta gia’ indicando un talento.
Semplicemente Taleb non riesce a distinguere -per talento- tra persone di uguale talento, il che e’ ovvio, e se ci pensasse un attimo la cosa sarebbe ovvia.
L’altro punto in cui Taleb casca miseramente e’ che , come abbiamo detto sopra, quando facciamo calcolo di probabilita’ noi calcoliamo la probabilita’ di un evento. Ma la probabilita’ di un evento richiede che l’evento sia definito.
Cosi’, posso chiedermi se l’evento sia probabile solo assumendo o definendo l’evento, e posso chiedermi se qualcuno scrivera’ un best-seller solo assumendo che lo scrivera’. Cosi’, posso chiedermi quanto sia probabile che il bicchiere caschi se e’ sul bordo piuttosto che se e’ al centro del tavolo. Il problema e’ scegliere l’intorno locale giusto E il momento giusto.
Ma non e’ affatto scontato che il bicchiere cada.
Questo pero’ non rende inutile la misura: volendo far cadere un bicchiere, scegliero’ quello probabilisticamente piu’ vicino alla caduta, che e’ quello vicino al bordo, e i fisici mi confermeranno che questa vicinanza statistica si traduce in “serve meno energia per farlo cadere”.
Cosi’, non posso sapere che arrivera’ un best-seller in un certo anno, e non posso sapere chi sara’, ma se assumo che ci sia un best-seller in quell’anno, posso andare a calcolare che il macellaio che ha smesso la scuola a 13 anni ,e  mai piu’ letto un libro ne’ scritto una riga, sia MOLTO piu’ lontano di una ragazza che legge da 20 anni, scrive da 10, e mette i suoi romanzi sul web.
Taleb non capisce le assunzioni di Asimov, che pure copia. Sebbene Asimov scriva fantascienza, e’ abbastanza logico da dire che il Mulo e’ impredicibile non perche’ sia il Mulo, ma perche’ non era conosciuta la sua esistenza, ed era la sua esistenza il vulnus della psicostoria, non la sua impredicibilita’: sapendo che un individuo possa influenzare il comportamento e la mente di altri, prevedere alte probabilita’ che sarebbe diventato un leader obbedito e’ facilissimo.
Sapendo che la Rowling scrive benissimo, prevedere alte probabilita’ che diventi una famosa scrittrice e’ facilissimo. (1) Ovviamente, le stesse di chiunque altro abbia lo stesso talento.
Taleb sta cercando di dimostrare che se gli economisti non sanno prevedere il successo della Rowling, allora non c’e’ alcuna causa. In pratica, per lui le cause non conosciute sono la stessa cosa di “evento casuale”: se non sapete perche’ il vostro amico vi sta telefonando, cioe’ se il telefono ha squillato ma avete perso la telefonataEVIDENTEMENTE VI TELEFONAVA PER CASO, secondo Taleb.

Per fare questo pippone prende un’idea di Asimov, appiattisce la psicostoria a quel poco che sa di statistica (la gaussiana) , e poi dice che era impossibile prevedere questo e quello solo perche’ lui NON sa come si fa, e poi sostiene che tutto (senza limite di intorno e/o di tempo) si perda “nelle basse probabilita’”.

Non e’ tecnicamente vero che “tutto si perda nelle basse probabilita’”, come dice Taleb, semmai tutto si perde nella sua incapacita’ di usare bene gli strumenti statistici, che e’ un problema diverso.
E’ vero che non possiamo prevedere l’arrivo di un best-seller, ma questo NON ha niente a che vedere con le basse probabilita’: posso dire con una certa sicurezza che ci sara’ un uragano in una determinata zona del centroamerica entro tot anni, SENZA per questo saper prevedere il suo arrivo. Ma l’uragano NON si perde in nessuna maledetta “bassa probabilita’”. Al contrario , ci sono SERIE probabilita’ che ci sia un uragano nei prossimi dieci anni in Florida. Il fatto che io non lo sappia prevedere se non con giorni di anticipi NON ne fa un problema di semplice statistica. L’uragano NON si perde nelle “basse probabilita’”, anche se vale ancora l’effetto farfalla e anche se NON so dire PERCHE’ si formi l’uragano.

Il tizio che ha sparato a Kennedy aveva basse probabilita’ di colpirlo. Circa le stesse di ogni altro tiratore dal medesimo talento che ci provasse. Il fatto pero’ che io non possa prevedere l’evento NON significa che io non possa SPIEGARLO, come invece Taleb sostiene. Il giudice non ha alcun dubbio nel condannarvi per omicidio, e il fatto che nessuno potesse prevedere l’evento NON ne fa un evento senza cause: la causa siete voi.

Allo stesso modo, prima di tirare di biliardo NON posso prevedere quale giocatore infilera’ la palla nella buca. Ma questo NON significa che ci entri senza una causa: ci entra perche’ qualcuno ha picchiato una palla con la stecca.

Semplicemente, Taleb non conosce alcuni strumenti matematici. Prende la sua ignoranza e siccome dal punto di vista della sua ignoranza il Mulo di Asimov gli sembra sensato (peraltro non si prende la briga di leggere BENE il libro di Asimov, che di entropia ne capiva piu’ di lui) , si sforza di spacciarlo per una teoria sostenuta dalla statistica.
A patto che la statistica sia semplicemente una gaussiana su eventi puramente bernulliani. Si e’ “solo” perso un pochino di meccanica statistica, di termodinamica statistica, e quando pensa al pattern di coincidenze che servono a rendere possibile un evento, sembra non sapere cosa sia una costellazione di simboli, e considera tutte le costellazioni equivalenti.
Per cui no, Taleb e’ lontanissimo da qualsiasi approccio sistematico: il suo cigno nero e’ invisibile solo perche’ e’ indistinguibile da qualsiasi altro cigno altrettanto nero, cioe’ la persona vincente e’ indistinguibile per talento da chiunque abbia lo stesso talento.
Mentre quando io parlo di cigno nero mi riferisco ad un evento non lineare (e molto piu’ raro) che porti a vincere qualcuno che non solo sia indistinguibile dai suoi pari che concorrono allo stesso evento, ma che siano indistinguibili da CHIUNQUE altro.
Il che significa che no, non TUTTI i vincenti (come dice Taleb) sono identici, ma solo i candidati alla vittoria. Normalmente.
Mentre in caso di effetto farfalla, e solo in eventi COMPLETAMENTE caotici, la farfalla non e’ diversa da ogni altra. Altrimenti, con un approccio abbastanza locale ed abbastanza limitato nel tempo, di prevedere prevediamo eccome: se io entro in un casino’, posso prevedere benissimo in che casella caschera’ la pallina, esattamente un millisecondo prima che ci arrivi, quando i numeri candidati alla caduta sono 3. Dopo un altro mezzo millisecondo, i numeri candidati sono due.E poi, finalmente diventa uno. Mi basterebbe una telecamera ad altissima velocita’ e un calcolatore molto efficace per farlo.
Sfortunatamente il croupier sa il suo mestiere meglio di Taleb, e dice “rien ne va plus”: sa benissimo che dopo un certo momento le previsioni sono possibili. Solo Taleb pretende di poter prevedere gli eventi IN QUALSIASI MOMENTO.
Tutti gli altri si accontentano di arrivare in tempo. Ma forse Taleb non ha capito come mai le previsioni del tempo non vadano oltre alla prossima settimana.
Uriel
(1) E tutti gli altri scrittori hanno le stesse probabilita’, si. Cosi’ come testa/croce ha 50/50% di probabilita’ di uscire. Anche se ne esce uno solo. Non siamo ciechi di fronte alla probabilita’, che calcoliamo benissimo. E’ che non e’ con la probabilita’ che possiamo calcolare gli eventi. Potremmo pero’ chiederci quale sia la probabilita’ di stato di AAAAAAAAAA e quella di AAAAAAAAAB  avendo la combinazione casuale di A e B, e se siano costellazioni di simboli equivalenti.
Annunci

Rispondi

Effettua il login con uno di questi metodi per inviare il tuo commento:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...