Искусственный интеллект самостоятельно освоил паркур (ВИДЕО)

Обучение с подкреплением — это один из способов машинного обучения, который подразумевает, что испытуемая система (агент) находится в некоторой среде, о которой у нее нет сведений, но в которой она может совершать определенные действия. Действия переводят среду в новое состояние, и агент получает от нее некоторое вознаграждение или штраф. Благодаря постоянной обратной связи, система совершенствует свою работу — подобный метод используется для тренировки роботов или игровых систем искусственного интеллекта (ИИ).

Чаще всего программисты разрабатывают функцию вознаграждения так, чтобы агент решал задачу только определенным способом. Это приводит к тому, что система ИИ порой не может приспособиться даже к незначительным изменениям условий. Разработчики из Google DeepMind, в свою очередь, создали такую среду и систему наград, которые способствуют выработке сложного поведения.

Исследователи построили виртуальный мир с разными по сложности препятствиями, куда они поочередно помещали трех агентов: тело с двумя ногами, четвероногий корпус и человекообразную фигуру. Каждая система была наделена проприцепцией (ощущением положения частей собственного тела относительно друг друга и в пространстве) и примитивным зрением. Всем агентам надо было добраться из точки А в точку В, и чем быстрее они это делали, тем больше была награда. Разработчики также ввели систему штрафов: двуногое тело наказывалось, если оно наталкивалось на препятствия из-за неправильного положения торса, а четвероногий «паук» и «человек» — если смещались с центра плоскости.

В итоге, компьютер самостоятельно научился сложным движениям — он стал перепрыгивать ямы, уклоняться от препятствий сверху, а также взбегать на склоны и перепрыгивать барьеры. Кроме того, как показано на видео, агенты использовали «колени», чтобы залезть на высокие платформы.

Программисты из Google DeepMind заключили, что простая система наград и богатая виртуальная среда способствуют развитию нестандартных двигательных навыков. По их мнению, такой подход позволит в целом улучшить качество и надежность поведения агентов.

Tags:


Notice: Undefined offset: 0 in /home/test2.reklamaster.com/html/wp-content/themes/onfleek/inc/df-core/views/df-content/df-post-layout-9.php on line 167

ТЕБЕ МОЖЕТ ПОНРАВИТЬСЯ

TABASCO отправило писателей из приложения АБУК на пробежку

Сервис аудиокниг АБУК провел эксперимент с участием спортсменов, идею которого подсказало креативное агентство TABASCO.

Бренди Групи Компаній «Нові Продукти» залучилися до хайпового #BottleCapChallenge

Бренди ГК «Нові Продукти», які будують комунікацію зі своєю аудиторією на зрозумілій їй живій мові актуальних мемів, опинилися в центрі деяких роликів, знятих їхніми прихильниками та друзями, зокрема – іменитими

Клан Корниани: Хелен Миррен и другие в мини-сериале L`Oreal

Производитель парфюмерии и косметики L`Oreal Paris запустил рекламный мини-сериал на YouTube. В рекламе снялась английская актриса и лауреат премии «Оскар» Хелен Миррен.