Zero Code, jede Menge AI. So haben wir Scraping für E-Commerce-Seiten einfacher gemacht als je zuvor.

Du musst nicht mal wissen, wie man effektiv promptet – wir geben Dir einen fertigen Prompt plus klare Anweisungen, damit Du aus praktisch jedem Online-Shop genau die Produkte extrahierst, die Du brauchst.

Genug geredet, lass uns Produkte scrapen!

Schritt 1 – E-Commerce-Scraping verstehen

Es gibt zwei Wege, Produkte aus E-Commerce-Seiten zu scrapen:

Du kannst entweder:

  1. „Collection/Category“-Seiten scrapen, um gezielt bestimmte Produkte aus einem Shop zu extrahieren ⬅️ Diese Methode nutzen wir heute

    This is the category page I’ll use to scrape all products from
    This is the category page I’ll use to scrape all products from
  2. „All Products“-Seiten scrapen, um wirklich alle Produkte aus einem E-Commerce-Store zu extrahieren

    “All products” pages offer less control about the extracted products
    “All products” pages offer less control about the extracted products

Die Konfiguration für den AI Agent funktioniert in beiden Fällen gleich – nur der Startpunkt ist ein anderer.

Schritt 2 – Scraping für E-Commerce-Seiten vorbereiten

Vorbereitung ist die halbe Miete, oder? Das machen wir, um das Scraping von E-Commerce-Seiten sauber vorzubereiten:

  1. Sammle die Links zu den E-Commerce-Seiten, die Du scrapen willst
  2. Registriere Dich bei Datablist
  3. Erstelle eine Collection in Datablist

Los geht’s!

Um Produkte ohne Code aus E-Commerce-Seiten zu scrapen, brauchst Du ein Tool, das Anweisungen in normaler Sprache versteht. Eines davon ist der AI Research Agent in Datablist.

Datablist’s home page
Datablist’s home page

Sobald Du Dich bei Datablist angemeldet hast, richtest Du Deine Automatisierung ein. Ich zeig Dir, wie das geht!

Erstelle eine neue Collection, indem Du auf das Plus klickst – oder nutze einfach den Shortcut „N“.

Datablist’s page to create a new collection
Datablist’s page to create a new collection

Das siehst Du beim Erstellen einer neuen Collection. Ich habe meine Collection schon umbenannt (und ihr direkt ein nettes Emoji verpasst).

This is how an empty collection looks like in Datablist
This is how an empty collection looks like in Datablist

Damit ist die Vorbereitung erledigt. Jetzt kommt der spannende Teil.

Schritt 3 – Produkte aus E-Commerce-Seiten scrapen (Start)

Um mit dem Scraping von Produkten aus E-Commerce-Seiten zu starten, musst Du drei Dinge machen:

  1. Wähle „AI Agent - Site Scraper“ als Source
  2. Füge den Prompt ein, der dem AI Agent Dein Ziel erklärt
  3. Lege für jede Produkt-Info, die Du scrapen willst, ein Output-Property an

Jetzt, wo klar ist, was wir machen — legen wir los und scrapen!

Klicke auf „See all sources“, um mit der Konfiguration des AI Agents fürs Scraping zu starten.

This is how you can access Datablist’s extensive data sources
This is how you can access Datablist’s extensive data sources

Wähle jetzt den „AI Agent - Site Scraper“.

Datablist’s AI Agent Site Scraper allows you to scrape almost any page
Datablist’s AI Agent Site Scraper allows you to scrape almost any page

Füge im ersten Feld die URL der Seite ein, aus der Du Produkte scrapen willst.

The URL of the category page I want to scrape with the AI agent
The URL of the category page I want to scrape with the AI agent

Gib dann einen Prompt ein, der dem AI agent sagt, welche Informationen Du aus dem Shop extrahieren willst (Du kannst auch meinen Prompt unten verwenden).

Having the right prompt makes extracting products much easier
Having the right prompt makes extracting products much easier
Extract product prompt

Context: I have an e-commerce site with a listing of products.

===

What I want you to do: Visit that site and get me all the displayed products and their information.

===

How to do it: Visit the site that I am going to give you the link for and extract all displayed information for each product.

===

Important mention about the task: Don't extract any information that isn't linked to a product, e.g. call to actions

===

Here's a description of what we are looking for:

  • Name of the Product
  • Link to the product page
  • Original Price of the product in the displayed currency
  • Product category: (examples: Nutritionally Complete Instant Meals, Tank tops, Socken)
  • Product specification 1: (examples: Compression fit, 40g protein, Premium Füßlinge)
  • Product specification 2: (examples: Color, pieces, servings)
  • Special Tags: (examples: New, limited edition, last chance etc. Return "None" if there none)
  • Absolute link to the product picture
  • Discount in % (if available. Return "None" if there's no discount)

Don't return anything what doesn't fall in these data types and return only one piece of information for each type

===

Important mention about the data: Not all pages are structured in the same way but the products are all labeled well enough that you should be able to recognize the distinctions between the data point.

Setze jetzt den Haken bei Enable Pagination, damit der AI Scraper nach der ersten Seite automatisch zur nächsten Seite weitergeht.

Enabling pagination is crucial when it comes to scraping e-commerce sites
Enabling pagination is crucial when it comes to scraping e-commerce sites

Jetzt musst Du für jede Art von Produktinformation, die Du scrapen willst, ein Output-Feld bzw. eine Spalte anlegen.

Output property to store the names of the extracted products
Output property to store the names of the extracted products

Klicke auf „More“, um weitere Output-Felder zu erstellen, und wiederhole das so lange, bis Du für jeden Informationstyp ein eigenes Feld hast.

Create as many properties as you need to store your scraped product information
Create as many properties as you need to store your scraped product information

Wenn Du die Produktspezifikationen getrennt speichern möchtest, lege pro Spezifikation ein eigenes Feld an. Hier ein Beispiel:

Example of product specifications
Example of product specifications
Creating one property for each specification is crucial for a clean data overview
Creating one property for each specification is crucial for a clean data overview

💡 Mach das für genauere Scraping-Ergebnisse

Gib den AI Agents konkrete Beispiele für die Produktspezifikationen, die Du haben willst. Hier ein Beispiel basierend auf GymShark Tank tops (Bild oben)

Product specification 1: Slim Fit
Product specification 2: Black

Wenn Du alle Output-Felder für die Infos erstellt hast, die Du scrapen willst, aktiviere die Checkbox „Advanced Settings“.

Enable advanced setting to unlock more scraping features
Enable advanced setting to unlock more scraping features

Jetzt kannst Du:

  1. Das Modell auswählen, das Du fürs Scraping nutzen willst ⬅️ Wir empfehlen GPT-4o mini für das beste „performance to price“-Verhältnis
  2. Die maximale Anzahl an Iterationen festlegen, die der AI Agent machen darf. Klicke hier, um mehr über AI agents zu lernen
  3. Die Option „Render HTML“ aktivieren, damit der AI Agent auch JavaScript-gerenderte Shops scrapen kann – 🚨 für manche E-Commerce-Shops ist das absolut entscheidend. Du kannst erst ohne testen und das Scraping dann mit dieser Einstellung neu starten, falls der erste Run keine Ergebnisse geliefert hat

Wenn Du das aktiviert hast, klicke auf „Continue“.

The “Render HTML” option is a feature that almost no tool has
The “Render HTML” option is a feature that almost no tool has

Klicke danach auf „Run import now“, um das Scraping der Produktdaten aus Deiner Liste an E-Commerce-Seiten zu starten.

The last click before the AI agents starts extracting products
The last click before the AI agents starts extracting products

Das sind die Ergebnisse, die Du mit dem website scraper AI Agent bekommst.

This are the products I scraped from the site I showed at the beginning
This are the products I scraped from the site I showed at the beginning

💡 Mach das, um Duplicates zu vermeiden

Wähle einen eindeutigen Wert wie Produktlink oder Produktname, damit beim erneuten Scraping nicht nochmal dieselben Produkte importiert werden. Beim nächsten Run werden dann nur neue Items ergänzt. Du zahlst trotzdem für die nicht importierten Produkte, weil wir nur den Import verhindern können, nicht das Scraping

Anleitung unten ⬇️

Wähle zuerst Deinen Unique Identifier. In meinem Fall nehme ich den Produktlink – bei Dir kann das aber auch etwas anderes sein.

Klicke dann auf den Spaltenkopf und wähle „Rename - Settings - Delete“.

The column options in Datablist
The column options in Datablist

Aktiviere jetzt die Checkbox „Do not allow duplicate values“ und klicke auf „Save Property“.

This is how to create an unique identifier in Datablist
This is how to create an unique identifier in Datablist

Wenn Du das gemacht hast, bist Du fertig: Jedes Produkt aus dem Store erscheint nur einmal in Deiner Collection – selbst wenn Du denselben Shop mehrfach scrapest.

Du solltest jetzt auch ein Key-Icon im Spaltenkopf sehen, das Dir das bestätigt.

Every unique identifier has a key icon right of it
Every unique identifier has a key icon right of it

Fazit

E-Commerce-Seiten und Shops ohne Code zu scrapen ist absolut möglich — nutz einfach einen AI agent, der das automatisiert für Dich erledigt. Der wichtigste Hebel ist Dein Prompt. Du kannst auch einfach unseren Prompt verwenden, aber setz unbedingt Deine eigenen Beispiele in die Klammern ein, damit genau die Produktdaten extrahiert werden, die für Dich relevant sind.

Kann ich E-Commerce-Seiten ohne Code scrapen?

Ja. Mit Datablists AI kannst Du E-Commerce-Seiten per natürlicher Sprache scrapen. Du schreibst einfach Deine Anweisungen in normalem Englisch, und der AI agent übernimmt den technischen Teil.

Wie kann ich Preisänderungen in E-Commerce-Shops überwachen?

Du kannst Datablists AI agent mit wiederkehrenden Tasks einrichten, um Preisänderungen automatisch zu überwachen und zu tracken. Der Agent prüft die Seiten regelmäßig und speichert Updates.

Wie scrape ich Produktdaten aus E-Commerce-Seiten?

Erstelle einen AI agent, definiere die Datenpunkte, die Du sammeln willst (z. B. Preise, Namen, Beschreibungen), und gib die URL der E-Commerce-Seite an. Die AI extrahiert und sortiert die Infos automatisch.

Wie scrape ich mehrere E-Commerce-Websites gleichzeitig?

Nein, aktuell ist das nicht möglich. Du kannst aber mehrere Collections anlegen und mit Datablist jeweils einen Shop nach dem anderen scrapen. Konfiguriere den AI agent einmal und er extrahiert dann automatisch alle Produkte.

Web Scraping an sich ist nicht illegal, aber manche Websites verbieten es in ihren Nutzungsbedingungen ausdrücklich.