AlphaZero самостоятельно учится играть в игры на высочайшем уровне

Группа ученых из группы DeepMind и Университетского колледжа в Лондоне разработала систему искусственного интеллекта, способную самообучаться игре и совершенствованию в трех сложных настольных играх. В своей работе, опубликованной в журнале Science, ученые описывают свою новую систему и объясняют, почему считают, что она представляет собой большой шаг в направлении развития будущих систем ИИ.

Прошло более 20 лет с тех пор, как суперкомпьютер Deep Blue победил чемпиона мира по шахматам Гари Каспарова и показал миру, как далеко продвинулись вычисления в сфере ИИ. С тех пор компьютеры становились все умнее и сегодня побеждают людей в таких играх, как шахматы, сёги и го. Однако каждая из подобных программ настраивалась специально, чтобы стать мастером в отдельной игре. В своей новой работе ученые описали создание искусственного интеллекта, который не только хорош в нескольких играх, но и обучается этому совершенствованию самостоятельно.

AlphaZero: новый мастер

Новая система под названием AlphaZero представляет собой систему обучения с подкреплением, то есть обучается, многократно играя в игру и учась на своем опыте. Это, разумеется, очень похоже на процесс обучения людей. Задается базовый набор правил и компьютер играет в игру — сам с собой. Ему даже партнеры не нужны. Он играет сам с собой много раз, отмечая хорошие и победные ходы. Со временем он становится все лучше и лучше, превосходит не только людей, но и другие системы ИИ, разработанные для настольных игр. Данная система также использовала метод поиска «древа поиска Монте-Карло». Совмещение двух технологий позволило системе научиться совершенствованию в игре. Ученые опробовали силы программы, обеспечив ее большой мощностью — 5000 тензорных процессоров, работающих в паре с большим суперкомпьютером.

На текущий момент AlphaZero освоил шахматы, сёги и го. Следующим шагом станут популярные видеоигры. Что касается производительности ИИ, то в го, например, AlphaZero обыграл легендарного AlphaGo уже через 30 часов.

Как думаете, когда будет взрыв искусственного интеллекта? Расскажите в нашем чате в Телеграме.

ИСТОЧНИК

Добавить комментарий

Популярные статьи

  • Обычный, современный человек проводит в Сети достаточно много времени. Благодаря имеющимся возможностям, развлекаться и общаться с друзьями можно, в буквальном смысле, не выходя из дома. Плохо это или хорошо, решать специалистам. Но факт, как говорится,...
  • WinRar — самый популярный архиватор, с помощью которого можно с легкостью сжимать файлы, а так же открывать архивы
  • Недавнее исследование популяции бабочек монархов (Danaus plexippus) в Калифорнии показало катастрофическое снижение их численности. Если оставить все, как есть, то эти известные во всем мире своей красотой бабочки скоро бесследно исчезнут. В исследовании приняли участие...
  • Ученые уже знают, сколько времени длятся сутки на планетах Солнечной системы. К сожалению, точная длительность суток на Сатурне до сих пор оставалась неизвестной, так как исследования давали разные показатели. В XX веке предположить длительность суток...
  • Австралиец Тоби Прайс стал одним из главных героев «Дакар-2019». Чемпион ралли 2018 FIM World и «Дакар-2016» начал двухнедельную гонку со сломанной ладьевидной костью на правом запястье. До сих пор остается загадкой как он смог...
Все права защищены; 2019 Скачать Программы