Od jakiegoś czasu świat obserwujący sztuczną inteligencję żyje pojedynkiem w grę Go między południowym mistrzem Lee Seedol a systemem sztucznej inteligencji Alpha Go.
Gra Go (pisaliśmy w artykule Sposoby wykorzystania sztucznej inteligencji) jest o tyle bardziej skomplikowana od np. szachów, ponieważ charakteryzuje się prawie nieograniczoną liczbę kombinacji ruchów. Sztuczna inteligencja nie może wykorzystać schematów. Musi analizować to co się dzieje i podejmować decyzje.
Turniej miał tylko obnażyć słabości AlphaGo. Udało się dopiero w czwartej grze
Gra między Lee Seedol a AlphaGo rozpisana jest na pięć gier. AlphaGo wygrał już trzy pojedynki. Kiedy już wiadome było, że w całym pojedynku sztuczna inteligencja wygrała, czwartą grę wygrał południowo koreański mistrz. Została jeszcze jedna, która odbędzie się w tym tygodniu.
Celem gry było wykrycie drzemiących w AlphaGo słabości. Aby go przetestować potrzebny był mistrz w tę grę.
„Tak naprawdę jesteśmy bardzo szczęśliwi, ponieważ po to zorganizowaliśmy turniej, aby przetestować AplhaGo do granic możliwości i znaleźć słabości, aby móc je poprawić. Słabości mogliśmy znaleźć tylko angażując geniusza takiego jak Lee Sedol, który mógł je odkryć.” mówi po przegranej partii przez AlphaGo Demis Hassabis, CEO Google Deepmind.
AlphaGo stał się właśnie numerem cztery w rankingu graczy w Go. Co ciekawe, gdyby nigdy nie przegrał nie mógłby być ujęty w rankingu. Przed AlphaGo są jeszcze zawodnicy z Chińczyk Ke Jie oraz Koreańczyk z południa Park Jung-Whan oraz Japończyk Lyama Yuta. Lee Sedol spadł na piątą pozycję.
Jak działa AlphaGo?
AlphaGo wykorzystuje starsze programy. Idea polega na tym, aby potrafił je tak połączyć, aby wytworzyć własną intuicję oraz sposób gry, który będzie zrozumiany przez człowieka, ale trudny bądź niemożliwy do wyjaśnienia. Wykorzystuje technikę tzw. deep learning. W skrócie umożliwia ona znalezienie generalnych zasad z setek danych i statystyk, które nie są ustrukturyzowane.
AlphaGo został nauczony poprzez dane dostarczone mu z serwerów dla graczy online. Była to próbka 30 milionów ruchów. Dodatkowo AplhaGo uczył się grać grając z podrasowaną wersją samego siebie, aby wygenerować więcej danych o kombinacjach.
Te dane został przetworzone przez dwa algorytmy. Pierwszy policy network, który był stworzony, aby naśladować grę ludzką. Jego zadaniem jest wybór najbardziej obiecujących ruchów dla kolejnego algorytmu, który je rozważy. Nauczył się tego po obserwacji i analizie milionów gier ludzi.
Propozycje są przekazywane do drugiego algorytmu value network. Ocenia on siłę poszczególnych ruchów, na podstawie gier, które już widział lub poprzez analizę kolejnych ruchów i ich siły. Liczba dalszych kombinacji jest ogromna, stąd oceniana jest szacunkowa siła.
Połączenie tych dwóch algorytmów daje sztucznej inteligencji swego rodzaju doświadczenie, którego człowiek nabywa przez wiele lat.
Jak deep learning zostanie wykorzystany w biznesie?
Sztuczna inteligencja staje się obecnie sektorem zainteresowań nie tylko świata akademickiego ale również biznesu, który inwestuje w jej rozwój ogromne pieniądze. Powodem tego jest szereg możliwości jej aplikacji w naszym życiu. Techniki wykorzystane w AlphaGo mogą być wykorzystane
- do nauki komputera, aby rozpoznawał twarze,
- w tłumaczeniu tekstów i rozmów również tych skomplikowanych wykorzystujących idiomy, slang, skróty myślowe,
- w serwowaniu odpowiednich reklam użytkownikom w internecie,
- lub idąć już bardzo daleko – w stworzeniu prawdziwego bytu równorzędnego do człowieka
Kamień milowy w rozwoju sztucznej inteligencji
AlphaGo to projekt rewolucyjny. Już zdążył wygrać z geniuszem ludzkim w Go, ale jego twórcy wiedzą, że mogą go jeszcze poprawić. Jest to kamień milowy w rozwoju sztucznej inteligencji i zastosowaniu jej w życiu. Nawet jeśli dziś na kimś może to nie robić większego wrażenia, za kilka lat może być zaskoczony jej szerokim zastosowaniem w życiu codziennym.