Google научила нейросеть реалистично дорисовывать фотографии

Разработчики из Google Research научили нейросеть качественно дорисовывать недостающие фрагменты фотографий, даже если от нее скрыта большая часть снимка. В основе алгоритма лежит архитектура генеративно-состязательной нейросети, рассказывают авторы статьи, опубликованной на arXiv.org.

Нейросетевые алгоритмы уже некоторое время применяются на практике при редактировании фотографий. К примеру, Adobe Photoshop умеет убирать объекты со снимка, реалистично заменяя их на фон. Для этого программа использует информацию со всех окружающих объект областей. Кроме того, Photoshop способен дорисовывать края изображения, к примеру, при повороте, однако эта функция работает хуже и способна справляться лишь с небольшими участками, отчасти именно из-за того, что лишь часть пустой области окружена фрагментами исходного изображения, с которых можно взять информацию.

Разработчики из Google Research под руководством Уильяма Фримена (William Freeman) научили нейросеть реалистично дорисовывать даже большие области на кадре, расположенные сбоку. Алгоритм основан на популярной архитектуре генеративно-состязательной нейросети. Она подразумевает, что алгоритм состоит из двух частей: одна из них выполняет прямую задачу (в данном случае дорисовывает фотографии), а вторая пытается отличить результат работы первой от настоящих снимков из обучающей выборки.

Одна из ключевых особенностей подхода авторов, которая привела к хорошим результатам, заключается в том, что на входе нейросеть получает не один снимок, а два. Первое изображение — это исходный снимок, на котором большая прямоугольная область залита одним цветом. Авторы экспериментировали с размером этой области, заливая 25, 50 и 75 процентов от исходного кадра. Второе изображение — это маска, показывающая, какая именно область была залита.

Сравнение работы нового алгоритма с аналогами

Такой подход позволил дискриминатору сконцентрироваться на области, дорисованной генератором, и тем самым повысить качество распознавание «подделок». Это в свою очередь повысило качество работы генератора после обучения. Еще одна причина хорошего качества доррисованных фрагментов связана с обучающей выборкой. В качестве нее авторы выбрали почти два миллиона изображений из датасета Places365-Challenge.

Помимо дорисовывания изображений разработчики также опробовали алгоритм на видео. Таким способом они предлагают дорисовывать кадры по бокам, к примеру, в случае с вертикальными видео.

Источник: https://nplus1.ru

Теги: новини технології

Google научила нейросеть реалистично дорисовывать фотографии

СХОЖІ ПУБЛІКАЦІЇ

Як створити нешаблонний візуальний стиль в Instagram для спільноти лікарів. Кейс Kukurudza & Sviy.Doc

Як взяти максимум із SMM-трендів 2024: поради для комунікаційників

Налагодити роботу клієнтського сервісу і не вмерти. Шлях від В2В до В2С

РЕКОМЕНДОВАНО

КМФР 2024 знайомить з міжнародними суддями

Publicis Ukraine розробила айдентику та комунікаційну кампанію для Ukrainian Creative Stories 2024

БІЛЬШЕ МАТЕРІАЛІВ

MEGAКАВА донатить на “крила”. Креатив Gusev Art Lab для проєкту WOG та фонду Dignitas

Як потрапити до Національного рейтингу креативності 2024

Про медіа

Тематичні напрями

Контакти

Відділ реклами

Імейл редакції

+380 44 221 6131

Новини Каннських Левів в Україні

Подкаст Creative Digest

Ми у соцмережах

З поверненням!

Відновіть свій пароль