32x32

Svetlana 03.05.2024

Игровой искусственный интеллект DeepMind может обыграть человека в шахматы, Го и покер (М. Спаркс)

1

Искусственный интеллект, способный обыграть человека в различных играх, – важный шаг на пути к созданию искусственного интеллекта общего назначения, считают в Google DeepMind.

Искусственный интеллект (ИИ) в одиночку может победить человека в шахматах, Го, покере и других играх, для победы в которых требуются различные стратегии. ИИ, получивший название "Student of Games", был создан компанией "Google DeepMind", которая утверждает, что это шаг на пути к ИИ общего назначения, способному выполнять любые задачи со сверхчеловеческой производительностью.

Мартин Шмид (Martin Schmid), работавший в "DeepMind" над созданием ИИ, а сейчас возглавляющий стартап "EquiLibre Technologies", говорит, что модель "Student of Games" (SoG) ведет свою историю от двух проектов. Один из них – DeepStack – ИИ, созданный командой Шмида в Университете Альберты в Канаде, который первым обыграл профессиональных игроков в покер. Другой – AlphaZero компании "DeepMind", – который обыграл лучших игроков в такие игры, как шахматы и Го.

Разница между этими двумя моделями заключается в том, что одна фокусируется на играх с неточными знаниями – тех, где игроки не знают состояния всех других игроков, например, в покере – какие карты у них в руках, а другая – на играх с точным знанием, таких как шахматы, где оба игрока могут видеть положение всех фигур в любой момент времени. Эти два направления требуют принципиально разных подходов. Компания "DeepMind" наняла всю команду DeepStack с целью построить модель, которая могла бы обобщить оба типа игр, что и привело к созданию SoG.

Шмид говорит, что SoG начинается как "проект" того, как изучать игры, а затем будет совершенствоваться через практику. Затем эту стартовую модель можно будет использовать в различных играх и учить ее играть против другой своей версии, изучая новые стратегии и постепенно становясь более способной. Но если предыдущая модель AlphaZero от "DeepMind" могла адаптироваться к играм с точными знаниями, то SoG может адаптироваться как к играм с точными, так и с неточными знаниями, что делает ее гораздо более универсальной.

Исследователи протестировали модель SoG в шахматах, Го, техасском холдеме и настольной игре под названием "Скотланд-Ярд", а также в покере Leduc hold'em и специальной версии "Скотланд-Ярда" с другим игровым полем, и обнаружили, что она может победить как несколько уже существующих моделей ИИ, так и обычных игроков. По словам Шмида, она должна научиться играть и в другие игры. "Есть много игр, которые можно просто запустить в нее, и она будет в них действительно успешна".

За такие широкие возможности приходится платить небольшой производительностью по сравнению с более специализированными алгоритмами DeepMind, но, тем не менее, модель SoG может легко победить даже лучших профессиональных игроков в большинстве игр, которым она обучается. Шмид говорит, что SoG учится играть против себя, чтобы совершенствоваться в играх, а также изучать все возможные сценарии, исходя из текущего состояния игры – даже если она играет в игру с неточными знаниями.

"Когда вы играете в такую игру, как покер, разобраться гораздо сложнее: как, к примеру, я буду искать [стратегически лучший следующий ход в игре], если я не знаю, какие карты у соперника? – говорит Шмид. – Таким образом, из AlphaZero и DeepStack получился некий набор идей, а из этого набора идей – большая смесь идей, которая и стала "Student of Games".

Майкл Роватсос (Michael Rovatsos) из Эдинбургского университета (Великобритания), не принимавший участия в исследовании, говорит, что, несмотря на впечатляющие результаты, предстоит пройти еще очень долгий путь, прежде чем ИИ можно будет считать в целом умным, поскольку игры, в отличие от реального мира, являются средой, в которой все правила и поведение четко определены.

"Важно подчеркнуть, что это контролируемая, самодостаточная, искусственная среда, в которой все действия и результат каждого действия кристально ясны, – говорит он. – Это искусственная задача, потому что, несмотря на то, что она может быть очень сложной, она не настоящая".

Мэтью Спаркс