AlphaGo Zero — новая версия искусственного интеллекта DeepMind
Компания DeepMind, принадлежащая Google, потрясла мир в 2016 году, когда её программа искусственного интеллекта AlphaGo победила одного из лучших игроков в игре Го. Это заставило многих задуматься, насколько способным стал искусственный интеллект за последние годы.

В этом году AlphaGo снова выиграл турнир в Го, на этот раз у Кэ Цзе. После этих побед, Google объявили, что делают перерыв в дальнейшей разработке программы. Однако, этого не произошло: DeepMind представила на днях новую, более совершенную версию AlphaGo – Zero, которая вышла за пределы возможностей своего предшественника, овладев настольной игрой без какой-либо помощи людей, - передает Robotics.ua. 

AlphaGo Zero, DeepMind, США, Google - Искусственный интеллект и экспертные системы - Robotics

 

Новый будущий чемпион:

Будучи ознакомленной только с правилами игры, AlphaGo Zero удалось обучиться технике Го с нуля, приобрести свои собственные знания на этом пути и в конечном итоге победить своего предшественника в серии 100 игр. Новый AlphaGo, как и старый, узнает новые действия через процесс под названием «обучение с подкреплением», поощряющий хорошие ходы, которые с большей вероятностью приведут к победе. 

Для обучения оригинального AlphaGo исследователи DeepMind наполнили систему тысячами игр, которые прошли любители и профессиональные игроки Го. Эти игры помогли системе разработать выигрышные стратегии и выявить хорошие и плохие шаги. AlphaGo Zero, с другой стороны, играл только сам по себе (хотя и миллионы раз), делая шаги наугад, пока не узнал стратегии. Что действительно удивительно в самостоятельном обучении AlphaGo Zero, так это то, что он перешел от новичка к чемпиону всего за несколько дней. Система начинала с совершенно некомпетентного игрока. К третьему дню, играя против себя самой, система была способна победить своего предшественника. 

Если оригинальный AlphaGo был немного больше, чем исключительно талантливый игрок в настольных играх, успехи, достигнутые AlphaGo Zero, в частности способность учиться с нуля, делает систему актуальной для широкого круга приложений реального мира. Те же принципы, которые помогают AlphaGo Zero изучать только правила, могут применяться к другой задаче, основанной на практике.

«Для нас AlphaGo была не просто победой в игре Го, - говорит Демис Хассавис, генеральный директор DeepMind. - «Это был также большой шаг для нас в создании универсальных алгоритмов».
Категория: Новости | Добавил: Rocker | Теги: ИИ, AlphaGo, DeepMind, zero | Просмотров: 419 | Дата: 27.10.2017, 13:27
Категория: Новости | Добавил: Rocker | Теги: ИИ, AlphaGo, DeepMind, zero | Просмотров: 419 | Дата: 27.10.2017, 13:27
Всего комментариев: 0
avatar
Какую соц.сеть вы предпочитаете?