Нейросеть AlphaZero стала лучшим игроком в шахматы за 4 часа

Как минимум по человеческим меркам.

Шахматы — сложная игра, однако для искусственного интеллекта (ИИ) освоить ее за пару часов оказалось тривиальной задачей.

Принадлежащая Google компания DeepMind стала широко известна после того, как созданный ею метод AlphaGo без особо труда победил сильнейших в мире игроков в го Ли Седоля и Кэ Цзе, но основной целью компании являлось и является создание алгоритма, способно самостоятельно обучаться и выполнять широкий спектр задач. Без преимущества первого хода ей удалось выиграть три партии при 47 ничьих. Другие партии закончились ничьей.

В отличие от иных шахматных программ (в том числе Stockfish) AlphaZero выбирает ход не за счет перебора вероятных ходов, а применяя алгоритмы, которые вырабатываются при обучении в играх с самой собой.

«Теперь мы знаем, кто наш новый повелитель».

«Теперь мы знаем, кем является наш новый повелитель», — проинформировал исследователь Дэвид Крамалей, генеральный руководитель шахматного научного сайта Chessable.

Система AlphaZero основывается на наработках ИИ-алгоритмов AlphaGo и AlphaGo Zero, создателями которых являются инженеры лаборатории искусственного интеллекта DeepMind, принадлежащей Google.

Понятно, что AlphaZero обучалась шахматам, зная только правила игры. Нейросеть два часа обучалась игре в японские шахматы (сеги) и смогла одолеть один из наилучших алгоритмов в данной области — программу Elmo.

В середине осеннего периода компания DeepMind уже показывала промежуточный образец алгоритма, названный тогда AlphaGo Zero. Так создатели хотели посодействовать ей в исследовании стратегий игры, но, как оказалось, в действительности это ее только замедлило в развитии.

«Это как наблюдать за инопланетной цивилизацией, изобретающей свою собственную математику», — говорил в интервью порталу Gizmodo еще к середине осени Ник Хайнс, ученый MIT, работающий в области компьютерных наук. DeepMind уже большое количество лет совершенствует этот ИИ, побеждая людей-чемпионов. В опубликованной статье инженеры DeepMind отмечают, как самая заключительная версия AlphaZero перешла на новый уровень и способна заниматься решением не менее широкого круга задач. Играя белыми, AlphaZero добилась 25 побед при 25 ничьих. После 4 часов игры с самой собой нейросеть была готова к партиям против Stockfish 8.

Bookmark the permalink.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *