Склейка разных изброжений с Gemini

СКАЧАТЬ ВОРКФЛОУ

Этот воркфлоу автоматизирует объединение нескольких изображений в новое с сохранением стиля и качества исходников при помощи AI-модели Gemini. Процесс идеально подходит для работы с маркетинговыми материалами, созданием сторибордов, комбинированием продуктов и быстрой подготовки визуального контента.

Что делает этот рабочий процесс? Воркфлоу автоматически берет 3 отдельных изображения из облачного или локального хранилища, объединяет их по заданному сценарию с помощью AI, преобразует результат в подходящий формат и размещает финальный файл на Google Drive. Все действия происходят без ручных вмешательств или переключений между сервисами.

Для кого этот рабочий процесс? — Маркетологи и визуальные дизайнеры, создающие рекламные коллажи и презентации — Продакт-менеджеры для быстрой сборки демонстрационных макетов — Контент-мейкеры и иллюстраторы, использующие референсы и ассеты — Технические специалисты и разработчики для интеграции AI-обработки изображений в бизнес-процессы

Преимущества:
  • 🚀 Высокая скорость генерации итогового изображения
  • 🏷️ Сохранение единого стиля оригинальных ассетов благодаря Gemini
  • 🔗 Полностью автоматическое выполнение — от загрузки до финального файла
  • 📁 Готовый результат сразу доступен в Google Drive
  • ⚡ Не требует ручной обработки файлов и сложного монтажа
  • 💡 Возможность масштабирования и доработки под собственные задачи

Как это работает?
  1. Импорт ассетов: Воркфлоу автоматически загружает три нужных изображения из облачного хранилища.
  2. Преобразование: Все изображения конвертируются в строку в формате base64 для корректной работы с AI.
  3. Агрегация: Все данные собираются в единый объект.
  4. AI-композиция: Gemini LLM на основе текста-описания объединяет изображения в одно, строго согласно вашему сценарию.
  5. Преобразование результата: Вывод Gemini преобразуется обратно в бинарный формат.
  6. Загрузка: Готовое изображение автоматически отправляется на Google Drive.
  7. Финальный результат: Файл доступен для скачивания, публикации и дальнейшей работы.

Используемые основные узлы n8n:
  • HTTP Request — загрузка исходных изображений по ссылке
  • Merge — агрегирование данных по изображениям
  • Extract from File — превращение изображений в base64 для AI-обработки
  • Aggregate — объединение всех данных для передачи в AI
  • HTTP Request (Gemini Image Compose) — генерация нового изображения на базе AI
  • Set — выделение содержимого и типа полученного файла из ответа Gemini
  • Convert to File — преобразование base64 обратно в файл для загрузки
  • Google Drive — загрузка финального изображения в облако

Что требуется для работы?
  • Аккаунт Google для Google Drive
  • API-ключ Google Gemini (PaLM) для генерации изображений
  • n8n-сервер с доступом к интеграциям HTTP и Google Drive
  • Ссылки или доступ к исходным изображениям

Как настроить воркфлоу:
  1. Создайте копию шаблона в n8n.
  2. Пропишите свои API-ключи Gemini и Google Drive в соответствующих узлах.
  3. Укажите правильные ссылки на ваши изображения в HTTP Request нодах.
  4. При необходимости скорректируйте текстовое описание в ноде Gemini — именно оно определяет логику композиции.
  5. Проверьте работоспособность: запустите воркфлоу вручную или настройте запуск по Webhook/триггеру.
  6. Убедитесь, что итоговый файл появляется в вашем Google Drive.
  7. При необходимости расширьте воркфлоу под свои сценарии (дополнительные изображения, иной метод выгрузки и пр).

🔐Правила и ограничения (что важно помнить при выполнении):
  • AI Gemini для генерации изображений может быть доступен не во всех странах.
  • Квоты Google Gemini и Google Drive ограничены выбранными тарифами и ресурсами аккаунта.
  • Итоговое изображение будет соответствовать порядку и описанию выбранных ассетов. Корректно формулируйте промпт для AI для достижения нужного результата.
  • Текущий воркфлоу заточен под 3 изображения, но может быть масштабирован при необходимости (учтите скорость и стоимость генерации).
  • При добавлении своих ассетов используйте изображения в поддерживаемых форматах (png, jpg).