Zum Inhalt springen
Web Content Crawler

Textextraktion mittels mindUp Web-Crawler/Spider

Adaptives Web-Crawler bzw- Spider-System für das automatisierte Abrufen von Web-Inhalten und die vollautomatische Extraktion von strukturiertem Wissen.

Web-Crawler Eigenschaften:

  • Skalierbar für jede Anwendungsgröße
  • Viele Millionen Web-Seiten täglich
  • Beliebige Extraktionsaufgaben möglich (Extraction Agent)
  • Adaptive Scanning (Domain-Scanning)
  • Bot-Conformity (berücksichtigt "robots.txt")
  • Webfarming

mindUp beherrscht die Erkennung von Web-Inhalten bis zur Perfektion. Sei es die Extraktion von Produktinformationen (Immobilienanzeigen, Autoanzeigen) zur Generierung von Marktdaten oder Preisvergleichen. Die Crawler-Technologie von mindUp gepaart mit der Inhaltsextraktion erlaubt viele Einsatzbereiche.

Weitere Anwendungsbereiche sind:
    Scouting
    Autokategorisierung
    Datenprüfung / Validierung