Analiza vs intuicja

Gdy rozpoczęły się przygotowania do wycofywania wojsk USA z Afganistanu, amerykańskie agencje wywiadowcze ostrzegały, że rząd afgański i struktury państwowe są na tyle słabe, że mogą sobie nie poradzić z powstrzymaniem talibów. Początkowo analitycy oceniali, że rząd przetrwa dwa lata po wycofaniu sił amerykańskich. Pod koniec czerwca, gdy talibowie byli już na granicy z Tadżykistanem, prognozy skróciły ten okres do roku. Fiasko całej dwudziestoletniej okupacji było już w zasadzie przesądzone, jednak nadal wydawało się, że cały proces przekazania pełni władzy Afgańczykom odbędzie się płynnie.

Jak dziś wiemy, nie odbył się płynnie. W połowie sierpnia stało się jasne, że większa część kraju jest nie do utrzymania. Jednak analitycy nadal dawali Kabulowi trzy miesiące, co miało pozwolić na dokończenie operacji planowego wycofania wojsk i personelu. Kabul padł trzy dni później. Miała wtedy też miejsce ciekawa sytuacja, obrazująca jak przestarzałym medium są gazety codzienne. Na półkach w polskich kioskach leżały cieplutkie jeszcze gazety obiecujące owe trzy miesiące, a w telewizji i internecie można było zobaczyć Talibów zadomowiających się w pałacu prezydenckim.

Dwa lata a trzy dni, to, delikatnie rzecz ujmując, gruba rozbieżność. Można bez przesady powiedzieć, że trafniejszą wartość dałby rzut kostką. Oczywiście byli też nieliczni eksperci, czy nawet zwykli ludzie, zainteresowani tematem, którzy podawali wartości znacznie bliższe tym prawdziwym. Niestety to, że akurat oni mieli rację, okazało się post factum. Jednocześnie znacznie więcej osób obstawiało wartości zupełnie nietrafione.

W 1906 r. brytyjski naukowiec Francis Galton przeprowadził ciekawy i nowatorski eksperyment. Zorganizował na wiejskim targu konkurs, w którym zwykli ludzie mieli za zadanie odgadnąć wagę wołu. Nikt z uczestników konkursu nie podał prawidłowego wyniku, nawet osoby zajmujące się handlem bydłem. Jednak średnia z niemal ośmiuset odpowiedzi dała wynik idealny (1198 funtów).

Ludzie są dobrzy w szacowaniu, bo szacowanie jest dla Homo sapiens bardziej naturalne niż matematyka. Czy to jest więc aż tak proste? Czy wystarczy wziąć dużą liczbę ludzi i zapytać ich, kiedy Talibowie zajmą Kabul? Z pewnością nie. To zagadnienie jest znacznie bardziej złożone i wymaga dostępu do większej ilości danych, większej wiedzy z dziedziny dość abstrakcyjnej dla przeciętnego człowieka. Ludzie na wiejskim targu sto lat temu doskonale wiedzieli, czym jest wół. Natomiast nawet dziś znakomita większość ludzi nie wie, czym jest geopolityka.

Nie mają sensu ani eksperckie prognozowania, ani masowe szacowania wyników gier losowych, bo tam nie ma żadnych dostępnych danych początkowych. Jednak wiadomo, kiedy eksperci sprawdzają się doskonale – gdy w oparciu o dużą liczbę danych mają stworzyć prognozę dotyczącą znanego sobie zagadnienia. Da się wówczas zastosować znane algorytmy i podeprzeć się własnym doświadczeniem, a nawet stereotypami. Jeśli jednak sytuacja odbiega od standardowej i jest więcej niewiadomych niż twardych danych, sytuacja się komplikuje. Jeszcze gorzej, jeśli na analityków wywierane są naciski, by ich prognozy wyglądały tak, jak tego oczekuje zleceniodawca – w końcu każda prognoza ma pewną siłę samospełniającą. Dochodzi do tego obawa o własną reputację i karierę w przypadku formułowania prognoz odbiegających od poglądów większości (nawet jeśli po czasie okażą się trafne). Dodatkowo przykład Billa Gatesa i pandemii pokazuje, że sporo ludzi nie odróżnia prognozy od groźby. W skrócie: ludzie zasadniczo są głupi i to też należy brać pod uwagę.

Cóż zatem lepsze: żmudna analiza czy szacowanie? Cała siła intuicji polega na tym, że nie opiera się ona na żadnych możliwych do spisania algorytmach. Przez to zresztą stosowanie jej w złożonych procesach zarządzania (czy to w armii, czy przy projektowaniu konstrukcji) jest problematyczne. Trudno przecież zawczasu odróżnić niedające się w żaden sposób potwierdzić przewidywania od przeczucia o podłożu emocjonalnym. Chociaż… nie do końca. Przeprowadzono kilka sporych i dobrze udokumentowanych eksperymentów, polegających na rozwinięciu wiejskiego konkursu Galtona.

Opis eksperymentu ACE (Aggregative Contingent Estimation) dokładnie tłumaczy, że jego celem było „radykalne zwiększenie dokładności, precyzji i aktualności prognoz wywiadowczych dla szerokiego zakresu typów zdarzeń, poprzez rozwój zaawansowanych technik, które pozyskują, ważą i łączą osądy wielu analityków wywiadowczych”. Czyli chodziło o matematyczną analizę wielu prognoz i, upraszczając, wyciągnięcie z niej czegoś w rodzaju średniej. Nadal jednak bazą były opinie formułowane przez ekspertów.

Kolejne eksperymenty, jak np. The Good Judgement, były już otwarte dla wszystkich chętnych, czyli „amatorów”. Co ciekawe, większa liczba amatorów, osiągała wyniki lepsze o 30% od tych eksperckich. Szok i niedowierzanie! Kolejny eksperyment, brytyjski Cosmic Bazaar, położył duży nacisk na elementy grywalności w postaci rankingów użytkowników i nagradzania ich za wysoki współczynnik prawidłowych prognoz. Przypomina to nieco loterię, ale to złudzenie. Przy odpowiednio licznej grupie można wyłuskać z niej tzw. superprognostów, których wyniki wyraźnie wybijają się ponad średnią. Co ciekawe, nadal nie są to eksperci ani osoby, które stosują metody analityczne. Prognozy te okazały się na tyle trafne, że są brane pod uwagę w procesach decyzyjnych rządu Wielkiej Brytanii.

I można by w tym momencie dojść do wniosku, że skoro ludzka intuicja okazuje się skuteczniejsza od zimnej naukowej analizy, to nasze obawy, że sztuczna inteligencja przejmie władzę nad światem, są bezpodstawne. Otóż wcale tak nie jest. Intuicja to nie magiczna zdolność, lecz proces, którego mechanizmu nie potrafimy zapisać w postaci algorytmu, i który ma też swoje ograniczenia.

Weźmy pewne istotne zagadnienie z dziedziny genetyki: jak przewidzieć strukturę białka, znając jego sekwencję genetyczną, czyli instrukcję „wyprodukowania białka”. Można też ten problem przedstawić od drugiej strony, czyli jak zakodować geny, by otrzymać konkretne, potrzebne nam białko. Mimo dziesięcioleci intensywnych badań i zdobywania doświadczeń, wyniki nadal nie są powalające. Najlepsze zespoły naukowców w konkursie CASP (Critical Assessment of protein Structure Prediction) w przypadku złożonych białek osiągały wyniki poniżej 20 punktów na 100 możliwych. W grudniu 2018 r. zwycięzcą konkursu został AlphaFold, program sztucznej inteligencji stworzony przez DeepMind, należący do Google. Dwa lata później program osiągnął 90 punktów.

Pewnie nazwanie stojącego za tym mechanizmu intuicją byłoby lekką przesadą, jednak faktem jest, że nie potrafimy poznać metody, jakiej używa w swoich prognozach AlphaFold. Odpowiedź na pytanie, czy lepsi w prognozowaniu są analitycy, czy dobrze szacujący intuicyjni amatorzy, wkrótce nie będzie ważna. Wielokrotnie lepsza od nich razem wziętych będzie sztuczna inteligencja… albo sztuczna intuicja.