Новый инструмент от Google для генерации изображений

Google представил инновационный подход к созданию изображений

Команда Google Labs запустила в США новый эксперимент, который должен изменить способ, которым мы используем нейросети для создания изображений. Платформа под названием Whisk позволяет генерировать изображения без необходимости вводить длинные текстовые запросы — достаточно просто загрузить несколько картинок.

Принцип работы: Пользователь загружает три изображения: первое – для объекта, второе – для фона и третье – для стиля. Система под названием Gemini автоматически генерирует подробное описание каждого загруженного изображения, которое затем используется в процессе создания новых изображений с помощью технологии Imagen 3.

Ключевое отличие от других генераторов: Whisk извлекает только важные характеристики из загруженных изображений, а не копирует их в точности. Это позволяет создавать поистине уникальные комбинации. Например, можно взять фото моржа, поместить его на цветочное поле и придать мультяшный стиль с облаками.

Этот инструмент позволяет создавать различные виды изображений – от цифровых игрушек до дизайна значков и стикеров. Разработчики подчеркивают, что Whisk не является редактором изображений, а предназначен для быстрого визуального исследования идей.

Интересный момент: пользователи могут видеть и редактировать текстовые запросы, которые система генерирует автоматически. Это особенно полезно для корректировки определенных характеристик создаваемых изображений.

Пользоваться инструментом могут лишь жители США, но для настоящих энтузиастов обойти эти ограничения не составит труда.