Искусственный интеллект DeepMind научился агрессивному поведению в стрессовых ситуациях


С каждым днём запускают всё больше экспериментов по созданию полноценного искусственного интеллекта, учёные погружаются в вопрос всё глубже, а человечество потихоньку приближается к тому светлому моменту, когда первый попавшийся Skynet осознает себя личностью, увидит в нас угрозу для своего существования и примет соответствующие меры. По крайней мере, последняя версия ИИ от Google с говорящим названием DeepMind уже делает первые шаги к господству - машина научилась проявлять сильную агрессию, чтобы добиться поставленной цели.

Напомню, что некогда компьютер с DeepMind обыграл мастера древнекитайской настолки Го. А затем специалисты, воодушевлённые результатом, принялись исследовать границы и пределы Теории игр - области психологии, изучающей при помощи математических расчётов оптимальные стратегии в играх. Если коротко, то под "игрой" понимают логическое противодействие двух и более сторон, а под "оптимальными стратегиями" - поиск универсальных тактик, ведущих к победе при определённом наборе исходных данных.


Так вот, команда, работающая с DeepMind, обнаружила, что в те моменты, когда ИИ считает, что вплотную приблизился к проигрышу, он начинает применять "высоко агрессивные" тактики, направленные на победу любой ценой или максимальное увеличение урона оппоненту.

Исследователи использовали элементарную версию программы, в которой две версии DeepMind должны были параллельно собрать как можно больше яблок из доступного количества. После десятков миллионов действий команда пришла к выводу, что пока фруктов было достаточно оба искусственных интеллекта вели себя спокойно и крайне последовательно. Ожидаемо, правда? Но чем меньше оставалось несобранного урожая, тем сильнее ИИ стремились устранить конкурента. А один из них даже попытался украсть яблоки другого.

Интересная зависимость была обнаружена специалистами Google: чем больше вычислительной мощности выделяли системе DeepMind и чем больше алгоритмов вычислений она использовала, тем агрессивнее и непредсказуемее становилась.

Джоэл Лейбо в разговоре с ведущим изданием WIRED отметил следующее.
Данная модель показывает, что некоторые аспекты человеческого поведения являются производными окружающей среды и обучения... Менее агрессивное поведение происходит из обучения в относительно богатой среде с наименьшей стоимостью затрат. Жадность как мотивация отражает желание вывести соперника из строя и забрать все яблоки себе.
Хорошая новость заключается в том, что в совершенно другой игре, выстроенной на необходимости объединения усилий и ресурсов, несколько ИИ быстро нашли язык в стремлении достичь поставленной цели. И это демонстрирует непреложный факт: даже синтетический разум старается выбрать оптимальную стратегию для выживания.

Аналоги легко найти в реальном мире. В животном царстве есть два очень близких вида - обычные шимпанзе и их карликовые собратья бонобо. В то время, как бонобо демонстрируют крайне миролюбивое поведение, шимпанзе наоборот частенько бывают жестокими и агрессивными, и даже балуются каннибализмом. Антропологи, изучающие эволюционные процессы, утверждают, что подобное поведение стало итогом большой разницы в условиях жизни. Шимпанзе приходится всеми силами бороться за жизнь, а вот бонобо живётся гораздо проще.

По материалу Geek.com.

Комментарии

Анонимные пользователи теперь могут оставлять комментарии