Искусственный интеллект выиграл в покер почти два миллиона долларов

18.12.2017 12:15

МОСКВА, 18 декабря Американские ученые создали новую систему искусственного интеллекта, обыгравшую четырех сильнейших игроков в так титулуемый техасский холдем – самый популярный вид покера, говаривается в статье, опубликованной в журнале Science.

За последние два года программеры и математики совершили настоящий прорыв в области создания систем деланного разума, превосходящих человека в умении играть в определенные это был базовые и азартные игры. К примеру, в прошлом году ученые создали ИИ AlphaGo, способную играть в древнекитайскую политику го лучше чемпионов Европы и мира, а в таком году они представили ее новую версию, способную учиться без участия человека.

Помимо го, системам ИИ покорилась еще одна сверхсложная игра – покер. В марфе прошлого года канадские программисты из университета Альберты создали искусственный разум DeepStack, способный играть в одну из простейших версий покера. Ему удалось стать дипломантом на одном из турниров по покеру, который проводился под эгидой Международной федерации покера.

Покер, как объясняет Браун, одновременно и сложнее, и легче, чем го – вариантов в нем меньше, чем в китайской стратегии, но при этом у него есть одно существенное различие. В отличие от игроков в го, любители покера не вынуждены действовать, не имея полных данных о том, что знает или не знает их соперник, какие карты он имеет на руках и что он может сделать.

Единственным источником информации для них являются те карты, которые имеются у них на руках, возможный набор из нескольких резервных карт, кой крупье выкладывает на стол, а также мимика, знаки и прочие аспекты поведения недругов. Оценка всех этих сомножителей является неимоверно сложной задачей для машины, что часто принуждает ученых идти на использование различных заготовок для облегчения ей удачливости или на упрощение правил шалости.

Браун и его коллега Туомас Сандхольм (Tuomas Sandholm) нарисовали систему ИИ, не нуждающуюся в подобной поддержке, выучил свое детище, Libratus, мыслить абстрактно. Иными словами, эта версия искусственного разума умеет находить общие черты в различных комбинациях карт, ориентаций и прочих элементов игры, и считать их примерно одним и тем же вариантом развития событий, что существенно упраздняет игру и позволяет находить неприметные решения для самых очевидных комбинаций карт и вариантов ходов недруга.

Если же ход партнера по игре является неожиданным для машины, то она просчитывает его последствия отдельно, используя мощности компьютера, и ищет безопасные экземпляры продолжения игры, которые помогли бы ей выиграть или хотя бы минимизировать потери.

Удачные версии этих новых ходов записываются в специальную книгу стратегий, которую Libratus использует в последующих раундах шалости.
Протестировав работу этой системы в играх с предыдущими версиями ИИ, ученые пригласили четырех ведущих игроков в техасский холдем – Джейсона Леса, Дона Кима, Дэниэла Макоули и Джимми Чоу сыграть с машиной в небольшой турнир с призовым фондом в 200 тысяч долларов, 10% которого гарантированно падали каждому мастеру.

Этот чемпионат завершился разгромом людей – к концу соревнования на руках Libratus имелось огромное число фишек, чья совокупная стоимость компилировала 1, 8 миллиона долларов, которые он выиграл у каждого игрока по-отдельности. По сути, если бы чемпионат осуществлялся полностью честно, то весь призовой фонд ушел бы деланному разуму.

Как отмечают ученые, Libratus можно применять и для решения других стратегических задач, случающихся в реальном мире, а также для создания игровых систем для других видов покера и прочих азартных или обычных игр

Источник