Wir bieten aktuell ein PoC Package (Proof of Concept) für unser spezielles Angebot „Data Cleanup mit semantischen Technologien“ an.
Worum geht es?
In verschiedensten Szenarien wird die kontrollierte Vernichtung und Transformation bzw. Migration von Datenbeständen notwendig. Anwendungsfälle finden sich in allen Branchen, hier eine kleine Auswahl:
- Datenschutz: Identifikation und Aussonderung von PID-Daten (Personendaten); Vollständigkeits- und Bestandsanalyse
- Archivbereinigung: Nachvollziehbare Löschung von Datenbeständen (Kassation) bei nicht oder unzureichend vorhanden Metadaten (Lifecycle Attributen)
- Datenmigration: Verschieben von Daten aus unstrukturierten in strukturierte Umgebungen (z.B. aus Foldern in ECM/DMS Systeme)
- Kontrollierte Datenübergaben: Datenübergaben, die auf Grund regulatorischer Anforderungen lückenlos nachvollziehbar gemacht werden müssen (z.B. bei der Medikamentenentwicklung). Übergabe von Patientendaten aus verschiedenen Anwendungen in eine PID.
- Erhöhung der Datenqualität: Datenbereinigung und entfernen von ROT-Daten.
- Kontrolle von Dokumentationen: Nachvollziehbarkeit der Versionierung und lückenlosen Nachvollziehbarkeit
Die Erschliessung von grossen Datenmengen kann heute nur noch mittels KI-Unterstützung erfolgen.
Nutzen
Der Nutzen liegt auf der Hand. Die Kernfrage lautet also: Wie kann man die wertvollen Nutzdaten von den ROT-Daten trennen? (ROT steht hier für Redundant, Outdated, Trivial, also Daten, welche doppelt vorhanden sind, veraltet oder keine Bedeutung für die Organisation haben).
- Nutzen POC: Anhand eines ausgewählten Datenbestandes kann die Machbarkeit des automatisierten Data Cleanups aufgezeigt werden.
- Nutzen automatisierter Data Cleanup: Das Einsparpotenzials gegenüber einer manuellen Datenbereinigung wird quantifiziert.
- Die benötigten Verfahren stehen heute auch Kunden zur Verfügung, welche nicht die Lizenzen eines „Big Players“ bezahlen möchten.
ROT-Daten verursachen heute geschätzte 70% der gesamten IT-Kosten.
Nebst dem finanziellen Nutzen kann eine wesentliche Verbesserung der Datenqualität erreicht werden.
Die Kernfrage lautet also: Wie kann man die wertvollen Nutzdaten von den ROT-Daten trennen? (ROT steht hier für Redundant, Outdated, Trivial, also Daten, welche doppelt vorhanden sind, veraltet oder keine Bedeutung für die Organisation haben).
Methode
Der PoC basiert auf der MATRIO® Data Cleanup Methode (Whitepaper):
Unser Angebot
Wir führen Sie strukturiert durch diesen Prozess und erarbeiten mit Ihnen ein umfassendes Konzept zur Bereinigung. Dabei setzen wir sowohl auf die PoolParty Semantic Suite wie auch auf einen Methodenbaukasten für die Analyse Ihrer Daten. Wir arbeiten dabei mit einer erfahrenen SW-Entwicklungsfirma zusammen, welche sich auf u.a. auf NLP und intelligente Suchverfahren spezialisiert hat.
Technologie-Baukasten:
Namenserkennung | Identitätscheck, Erkennung und Löschung persönlicher Information aus Dokumenten |
Themenerkennung | E-Mail Triage, Weiterleitung von Anfragen und Informationen |
Textklassifikation | Automatische Dokumentenzuweisung und -Ablage |
Informationsextraktion | Zusammenfassung & Extraktion von Schlüsselinformation aus Dokumenten und Dossiers |
Annotation | Auszeichnung von Textelementen mit kundenspezifischen Labels |
Recommender Systeme | Empfehlungen aufgrund von Textinhalten und Metadaten |
Ähnlichkeitsbestimmung | Bestimmung und Suche ähnlicher Dokumente / Entitäten |
Intelligente Suche | Semantische Volltextsuche, Unterstützung bei der Navigation in Dokumenten-Repositories, Informationsfilterung |
Kombination von Komponenten | Inhaltsgesteuerte Entscheidungsunterstützung |
Datenklassifikation | Taxonomien, Ontologien |
Knowledge Graphs | Einsatz von KG Verfahren auf Basis der PoolParty Semantic Suite |
Interessiert? Dann melden Sie sich bitte direkt bei uns! Ihr Ansprechpartner: Bruno Wildhaber
0 Kommentare