Извлечение данных через скриншот сайта

СКАЧАТЬ ВОРКФЛОУ

Dumpling AI и Google Sheets
Из этого воркфлоу вы узнаете, как полностью автоматизировать сбор информации о продуктах (название, цена, скидка, рейтинг) из скриншотов веб-сайтов и создавать актуальную базу данных в Google Sheets без ручного копирования.
Этот рабочий процесс позволяет: Автоматизировать процесс извлечения сведений о продуктах, основываясь на скриншотах страниц интернет-магазинов или любых сайтів с витриной товаров, размещённых в Google Sheets. Система полностью исключает ручной копипаст, обеспечивая быстрый и структурированный перенос ключевой информации в ваши таблицы.
Для кого предназначен этот воркфлоу?
  • E-commerce специалисты
  • Маркетологи и менеджеры по ассортименту
  • Digital-аналитики
  • Каталожные администраторы
  • Разработчики и технические интеграторы
Преимущества:
  • ⚡️ Быстрое получение готовой структурированной информации о продуктах
  • 🛑 Исключение ручной рутины и человеческих ошибок
  • 📊 Данные всегда актуальны в Google Sheets
  • ✈️ Подходит для массового каталогирования товаров с визуальных источников
  • 🧩 Легко интегрируется в существующие процессы и автоматизации
Как это работает?
  1. 🚀 Cкрипт n8n следит за появлением новых ссылок на скриншоты в выбранной Google-таблице.
  2. 📸 При поступлении новой ссылки автоматический запуск всего процесса.
  3. 🤖 Dumpling AI делает снимок указанной страницы (скриншот) по URL.
  4. 🖼 Скриншот скачивается и конвертируется в формат base64.
  5. ✂️ Dumpling AI-API “читает” изображение и извлекает ключевые параметры: название товара, цену, скидку, рейтинг ― только если они полностью видимы на снимке.
  6. ✅ Данные форматируются (JSON) и вносятся в Google Sheets, рядом с исходной ссылкой.
Основные узлы (ноды) n8n:
  • Google Sheets Trigger — отслеживает новые ссылки на скриншоты в таблице.
  • HTTP Request (Dumpling AI Screenshot) — автоматизированное создание снимка сайта.
  • HTTP Request (Download Image) — скачивает файл скриншота с сервиса.
  • Extract From File (Base64 Converter) — преобразует изображение в base64 для последующего анализа.
  • HTTP Request (Dumpling AI Extract) — выполняет извлечение текстовых данных с изображения.
  • Set/Format Nodes — форматирует извлечённую информацию для записи.
  • Google Sheets — сохраняет структурированные данные в таблицу.
Что потребуется для работы?
  • Аккаунт Google с доступом к нужной таблице
  • Доступ к Dumpling AI (API-ключ)
  • Аккаунт n8n (или работающий сервер n8n с нужными credentials)
  • Конфигурированная Google Sheets с колонкой для URL
Как настроить воркфлоу:
  1. Подключите свой Google-аккаунт в Google Sheets Trigger и Google Sheets nodes.
  2. Получите и добавьте токен Dumpling AI в HTTP Request шаги (для создания скриншота и извлечения текста).
  3. Укажите верные ссылки на таблицы и листы Google Sheets.
  4. Проверьте корректность JSON Mapping для соответствующих полей (название, цена, скидка, рейтинг).
  5. Активируйте рабочий процесс, протестируйте на одном примере.
  6. Настройте автоматическую обработку новых строк (event: rowAdded).
🔐Правила и ограничения:
  • Данные о товарах извлекаются только если информация полностью видна на скриншоте.
  • Dumpling AI не “догадывается”—извлекаются только явно присутствующие параметры.
  • Не гарантировано качество извлечения с плохо читаемых изображений, наложенных слоёв, всплывающих окон.
  • Необходимо обеспечить достаточную производительность при обработке большого объёма входящих ссылок.