
Der Web-Scraping-Import funktioniert auf jeder öffentlichen Website, ohne API-Schlüssel oder Einrichtung. Er zeigt dir vor dem Festlegen immer eine Live-Vorschau eines extrahierten Produkts, damit du zuerst bestätigen kannst, dass die Daten korrekt aussehen.
So funktioniert es
Wähle einen Quellmodus
Kategorieseite durchläuft eine Listenseite und ihre Seitennummerierung, um jedes Produkt zu finden (am besten für den Katalog eines Lieferanten oder Mitbewerbers). Sitemap startet von einer Produkt-URL und findet ähnliche Seiten auf der gesamten Website. Manuelle Liste nimmt eine Liste von Produkt-URLs, die du einfügst, eine pro Zeile.
Füge die URL und Begrenzungen hinzu
Füge die Start-URL ein. Lege optional ein URL-Muster fest (um nur die richtigen Seiten einzubeziehen) sowie Obergrenzen dafür, wie viele Listenseiten und Produkte abgerufen werden, damit ein erster Durchlauf klein bleibt.
Sieh dir ein Produkt in der Vorschau an
Starte die Vorschau. WISEPIM meldet, wie viele Produkt-URLs es gefunden hat, das erkannte Muster, einige Beispiel-URLs und ein vollständig extrahiertes Produkt, sodass du prüfen kannst, ob die Felder korrekt übernommen wurden.
Einstellungen, die du festlegen kannst
Du gestaltest jeden Scrape mit ein paar optionalen Überschreibungen. Die Standardwerte funktionieren für die meisten Websites, greife also nur dann zu diesen, wenn ein Durchlauf einen Anstoß braucht:- Sitemap-URL überschreiben: Verweise WISEPIM auf die richtige Sitemap, wenn eine Website keine in ihrer
robots.txtangibt. Nutze dies, wenn der Sitemap-Modus die Produkt-URLs nicht von selbst finden kann. - Produkt-URL-Muster überschreiben: Sage WISEPIM, welche URLs als Produkte gelten (zum Beispiel
/p/oder/products/), wenn das automatisch erkannte Muster die falschen Seiten erfasst. - Max. Listenseiten: wie viele Seitennummerierungs-Seiten einer Kategorie durchlaufen werden. Erhöhe den Wert für große Kataloge, halte ihn für einen schnellen Test niedrig.
- Max. Produkte: eine Obergrenze dafür, wie viele Produkte ein Durchlauf importiert. Eine Sicherheitsgrenze, die einen ersten Durchlauf klein und vorhersehbar hält.
Die Vorschau lesen
Die Vorschau gibt es, damit du nie blind importierst:- Anzahl der gefundenen URLs zeigt dir, ob der Crawl ungefähr die erwartete Produktanzahl gefunden hat. Null oder viel zu wenige bedeutet, dass das Muster oder die Start-URL angepasst werden muss.
- Das erkannte Muster zeigt, welche URLs als Produkte behandelt werden. Wenn es Kategorie- oder Blog-Seiten erfasst, schränke das Muster mit der Überschreibung des Produkt-URL-Musters ein.
- Das extrahierte Beispiel ist der eigentliche Test: Prüfe, dass Name, Preis, Bilder und wichtige Attribute korrekt zugeordnet wurden, bevor du dich auf den vollständigen Durchlauf festlegst.
Handle nach deinen Erkenntnissen
Die Vorschau hat 0 (oder viel zu wenige) Produkte gefunden
Die Vorschau hat 0 (oder viel zu wenige) Produkte gefunden
Die Start-URL oder das Muster stimmt nicht. Bei einer Kategorieseite vergewissere dich, dass du die Listenseite eingefügt hast (nicht ein einzelnes Produkt); im Sitemap-Modus füge eine echte Produkt-URL ein, damit WISEPIM das Muster lernen kann. Passe die Muster-Überschreibung an und mach erneut eine Vorschau. Ergebnis: Der Crawl findet das vollständige Sortiment, bevor du einen Importlauf dafür aufwendest.
Beim Beispielprodukt fehlen Felder
Beim Beispielprodukt fehlen Felder
Manche Websites verstecken Daten in Skripten oder Bildern. Mach erneut eine Vorschau, um zu bestätigen, dass es durchgängig ist, importiere, was sauber extrahiert wird, und fülle dann die Lücken mit Produkte anreichern (die AI kann die Produktbilder lesen, um Attribute wiederherzustellen). Ergebnis: ein vollständiger Katalog, selbst wenn die Quellseite dünn war.
Du wirst erneut von derselben Website importieren
Du wirst erneut von derselben Website importieren
Notiere dir die Einstellungen, die funktioniert haben: den Quellmodus, die Start- oder Kategorie-URL und alle Muster- oder Sitemap-Überschreibungen. Wenn der Lieferant das nächste Mal aktualisiert, gib dieselben Werte ein, um die Änderungen abzurufen. Für Quellen, die du häufig erneut importierst, ist ein strukturierter Feed die zuverlässigere Langzeitoption, sofern einer verfügbar ist. Ergebnis: wiederholbares Lieferanten-Onboarding.
Du brauchst einen Feed, keinen Scrape
Du brauchst einen Feed, keinen Scrape
Wenn die Quelle dir einen XML- oder CSV-Feed bereitstellen kann, bevorzuge den Feed-Hub-Import oder den Dateiimport: Strukturierte Feeds sind schneller und zuverlässiger als das Crawlen. Nutze das Scraping, wenn kein Feed verfügbar ist. Ergebnis: das richtige Werkzeug für jede Quelle.
Der Vergleich
| Web-Scraping-Import | Datei-/Feed-Import | Web-Recherche | |
|---|---|---|---|
| Eingabe | Eine Live-Website-URL | Eine XML-/CSV-/JSON-Datei oder ein Feed | Eine Suchanfrage oder Mitbewerber-URL |
| Am besten für | Websites ohne verfügbaren Feed | Lieferanten und Kanäle, die einen Feed veröffentlichen | Fakten sammeln, um bestehende Produkte anzureichern |
| Die AI macht | Extrahiert Felder von der Seite | Ordnet Spalten den Feldern zu | Sucht und fasst zusammen |
| Ausgabe | Produkte in deinem Katalog | Produkte in deinem Katalog | Recherche, die du auf Inhalte anwendest |
Verwandtes
Produkte importieren
Dateibasierter Import (CSV, Excel), wenn du strukturierte Daten hast.
Feed Hub
Aus XML-/Feed-Quellen importieren und in sie veröffentlichen.
Web-Recherche
Recherchiere Produkte im Web, um das anzureichern, was du bereits hast.
Produkte anreichern
Fülle die Lücken, die der Scrape hinterlassen hat, mit AI.


