Workshop Datenerkennung

Pilot Sprint Intelligente Informationsgewinnung

Erstellung eines Prototyps zur automatischen Extraktion strukturierter Daten aus unstrukturierten Dokumententypen in 5 Tagen - von der Quellanalyse über die Pipeline-Entwicklung bis hin zur Evaluation und Übergabe.

Was beinhaltet der Workshop?

  • Analyse der unstrukturierten Quelldokumente (z.B. HTML-Webseiten, PDF-Angebote, Word-Verträge)
  • Definition der Extraktionsziele mit Fachbereich (z.B. Aussteller, einzelne Angebotspositionen) und Bereitstellen einiger annotierter Referenzdokumente
  • Prototyping der LLM-basierten Pipeline zur intelligenten Informationsextraktion
  • Evaluation und Livedemo mit Fachanwendern
  • Handover des PoC (technische Dokumentation, Architekturdiagramme, Deploymentvorlage, Nächste-Schritte-Plan für das MVP)

Sie erhalten am Ende des Workshops

  • Prototypische Extraktionspipeline für die definierten Dokumententypen
  • Testdatensatz mit Annotationen und Evaluationsreport
  • Vollständiger Sourcecode mit Dokumentation, Architektur- und Datenflussdiagrammen
  • Nächste-Schritte-Plan, Aufwands- und ROI-Schätzung für das MVP 

Für wen ist der Workshop geeignet?

  • Fachabteilungen mit hohem Dokumentenaufkommen (z. B. Buchhaltung, Einkauf)
  • Teams für Data Entry und Prozessautomatisierung
  • IT- und Data-Engineering-Verantwortliche
Estelle Hounsa, Sales Managerin bei js-soft

Wir hören zu, verstehen und setzen um.