AI už je soupeřem i profesionálním hráčům go

Ještě donedávna měli ve srovnání s počítačem profesionální hráči čínské deskové hry go „navrch“. O tuto výsadu je připravil výsledek snahy společnosti DeepMind. Řeč je o programu AlphaGo, který opakovaně porazil v partiích go evropského šampiona.

goV šachu vyzrály počítačové programy nad elitními hráči už od konce minulého století, go však bylo díky svému astronomickému množství variací, které několikanásobně kombinace šachu přesahuje, doposud nepokořeno a jeho prolomení odhadovala řada expertů podstatně později.

DeepMind však zvolilo důmyslnou strategii, která sofistikovaně těží z perspektivních přístupů v oblasti umělé inteligence. Počítačová metafora lidského intelektu totiž nabyla nového rozměru s rozvojem neuronových sítí, které imitují strukturu a principy lidského nervového systému a jím produkovaných mentálních procesů.

Program AlphaGo využívající těchto principů je učenlivý a při partiích si počíná způsobem, který je podobný tomu lidskému uplatňujícímu kromě logických operací také prvek intuice.

Single-layer_feedforward_artificial_neural_network

AlphaGo překvapil

Ještě nedávno patřila mezi jednu z charakteristických vlastností, kterou se mohla prastará čínská hra go pyšnit, nepřekonanost umělou inteligencí díky nepodchytitelnému množství možných konfigurací.

Dříve, než se čekalo

Go_adjacent_stones

Kdybyste ještě před rokem bádali po perspektivě vzniku počítačového softwaru, který by dokázal s přehledem porazit profesionální hráče, zpravidla byste se nesetkali s prognózami optimističtějšími, než je deset let. Autor jednoho z doposud neúspěšnějších programů Remi Coulom, který i vůči takovému předpokladu přistupoval s určitou skepsí, byl úspěchem AlphaGo překvapen.

Zaskočil i svého soupeře

Evropský šampion Fan Hui, nad kterým AlphaGo pětkrát zvítězil, byl neméně zaskočen a nepopírá, že to pro něj byla zdrcující prohra. Vysvětluje, že go v Číně představuje nejen hru, ale odraz života. Zároveň dodává, že zatímco výkonnost lidského hráče kolísá v závislosti na aktuálním rozpoložení, například v důsledku únavy, snížené pozornosti, emocí, umělá inteligence je ve svém výkonu stabilní.

Když to nejde hrubou silou

Go_game_Kobayashi-KatoV případě go mechanické naprogramování s ohledem na obrovský počet možných variant nepřichází v úvahu. Jako schůdné řešení se ukázaly programy založené na algoritmickém postupu umožňujícím dospět k užšímu počtu možností optimálního tahu. Díky tomu byl software schopný s postupně stále větší mírou pravděpodobnosti předvídat kroky lidského soupeře.

Na této bázi založené doposud nejúspěšnější programy (CrazyStone, Zen, DolBaram) dosahovaly úrovně takřka nejsilnějších amatérských hráčů.

Efektivní strategie

Software AlphaGo britské společnosti DeepMind však funguje na sofistikovanějším principu, který kombinuje systém „neuronových sítí“ se „stromovým prohledáváním“.

Brain_network

AlphaGo pracuje na bázi tzv. hlubokých neuronových sítí imitujících strukturu lidského nervového systému. Způsob učení, který je pro sítě AlphaGo typický, dokáže využívat nápodobu, jejíž pomocí program postupně zdokonaluje svou strategii.

Výhoda hlubokých neuronových sítí tkví především v množství vrstev (v případě AlphaGo 13) umožňující paralelní výpočet.

Účastny jsou dvě hlavní neuronové sítě. Jedna zastává funkci „strategickou“, takže nabízí vybrané alternativy vhodné pro daný tah. Skrze druhou síť se uplatňuje funkce „hodnotící“, která spočívá v posouzení dobrých a špatných pozic.

V důsledku práce odvedené neuronovými sítěmi se redukuje suma vhodných tahů, čímž se zužuje šíře prohledávaného stromu. Systém prohledávání stromu možných tahů tak pracuje s podstatně nižším množstvím vybraných alternativ, které prošly přes „síto“ neuronových sítí, což pro něj znamená zásadní ulehčení.

744px-Game_of_go_-_placing_a_white_stone

Cvičit, cvičit, cvičit

Z výše popsaného mechanismu lze vytušit, jak velký význam pro software AlphaGo sehrává trénink, z kterého dokáže nesmírně těžit. Právě opakování nečiní umělé inteligenci velký problém, takže je schopná tempem tisíce odehraných partií za hodinu vstřebat neskutečné množství informací a velmi rychle se zlepšovat.

Univerzální a flexibilní

Na rozdíl od šachových programů je princip algoritmů Artificial-intelligence-elon-musk-hawkingAlphaGo nespecifický. Algoritmy nedisponují téměř žádnou předem naprogramovanou doménovou znalostí. Slovy představitelů filozofického empirismu jde o „tabula rasa“ (nepopsanou tabuli), která získává zkušenosti ze záznamů profesionálních her i partiích odehraných proti sobě. Umělá inteligence AlphaGo se tedy svým znalostem učí sama, takže jsou její principy použitelné univerzálně.

V nejbližší době se můžeme těšit…

Další výzva čeká software AlphaGo v březnu, kdy se má postavit v současné době v podstatě nejlepšímu hráči go. Lee Sedol  překonává Fan Huie o třídu, což je na takto profesionální úrovni nezanedbatelný rozdíl. AlphaGo však stihne do té doby ještě spoustu zkušeností pochytit, a tak se schyluje na opravdu fenomenální zápas. Můžeme jen hádat, kdo obhájí pozici šampiona…

Zdroj: http://technet.idnes.cz/alphago-crr-/veda.aspx?c=A160128_150313_veda_mla

 

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *