Играющая покер программа AI сначала, чтобы обыграть профессионалов в Техасе без предела держит их

DeepStack устраняет разрыв между подходами, используемыми для игр прекрасной информации – как используемые в шашках, шахматах, и Пойдите – с используемыми для несовершенных информационных игр, рассуждая, в то время как это играет использование «интуиция», заточенная посредством глубокого обучения переоценить его стратегию с каждым решением.«Покер был давней проблемой проблемы в искусственном интеллекте», говорит Майкл Боулинг, преподаватель в Отделении естественных наук Альбертского университета и научный руководитель на исследовании. «Это – наиболее существенная игра несовершенной информации в том смысле, что игроки не имеют той же самой информации или разделяют ту же самую перспективу, в то время как они играют».Не позволяйте имени одурачить Вас: несовершенные информационные игры – серьезный бизнес. Эти «игры» – общая математическая модель, которые описывают, как взаимодействуют лица, принимающие решения.

У исследования искусственного интеллекта есть легендарная история использования комнатных игр, чтобы изучить эти модели, но внимание было сосредоточено, прежде всего, на прекрасных информационных играх. «Нам нужны новые методы AI, которые могут обращаться со случаями, где у лиц, принимающих решения есть другие точки зрения», говорит Боулинг, объясняя, что у развития методов, чтобы решить несовершенные информационные игры будут заявления далеко за пределами стола для покера.«Думайте о любой проблеме реального мира. У всех нас есть немного отличающаяся перспектива того, что продолжается, во многом как каждый игрок, только знающий их собственные карты в игре в покер».

Непосредственные заявления включают предоставляющие прочные рекомендации лечения, стратегическое планирование защиты и переговоры.Это последнее открытие основывается на уже впечатляющем объеме исследований результаты об искусственном интеллекте и несовершенных информационных играх, который восходит к созданию Computer Poker Research Group Альбертского университета в 1996. Боулинг, кто стал научным руководителем группы в 2006, возглавил группу к нескольким этапам для искусственного интеллекта. Он и его коллеги развивали Polaris в 2008, избивая ведущих игроков в покер в настороженном покере Техас Холдем предела.

Они тогда продолжали решать настороженный предел hold’em с Cepheus, изданным в 2015 в Науке.DeepStack расширяет способность думать о каждой ситуации во время игры – который был заметно успешен в играх как шашки, шахматы, и Идет – на несовершенные информационные игры, используя технику, названную непрерывным решением.

Это позволяет DeepStack определять правильную стратегию конкретной ситуации с покером, не думая обо всей игре при помощи ее «интуиции», чтобы оценить, как игра могла бы терять значение в ближайшем будущем.«Мы обучаем нашу систему изучать ценность ситуаций», говорит Боулинг. «Каждая ситуация сама – мини-игра в покер.

Вместо того, чтобы решить одну большую игру в покер, это решает миллионы этих небольших игр в покер, каждый помогающий системе усовершенствовать ее интуицию того, как игра в покер работает. И эта интуиция – топливо позади, как DeepStack играет в полную игру».

Размышление о каждой ситуации, как это возникает, важно для сложных проблем как настороженный hold’em без предела, у которого есть значительно более уникальные ситуации, чем есть атомы во вселенной, в основном из-за способности игроков держать пари на различные суммы включая драматическое «включая все». Несмотря на сложность игры, DeepStack принимает меры на человеческой скорости – в среднем с только тремя секундами «интеллектуального» времени – и работает на простом игровом ноутбуке с графикой Nvidia обработка единицы.

Чтобы проверить подход, DeepStack играл против объединения профессиональных игроков в покер в декабре 2016, принятый на работу Международной федерацией Покера. Тридцать три игрока из 17 стран были приняты на работу, с каждым попросил сыграть матч с 3000 руками в течение четырех недель.

DeepStack побеждают каждого из 11 игроков, которые закончили их матч, только с одной внешней стороной край статистического значения, делая его первой компьютерной программой, чтобы избить профессиональных игроков в настороженном покере Техас Холдем без предела.