Umfassende Auswertungs-Services
Umfassende Dokumentenanalyse "as a Service"
Die neue Lösung "Heimdall" von prego ermöglicht es, Texte aus unterschiedlichsten Dateitypen wie .doc, .pdf, .txt oder .csv zu durchsuchen und zu analysieren
(21.01.15) - Der IT-Dienstleister prego services hat mit "Heimdall" ein neues System für die kontextsensitive Analyse unstrukturierter Texte entwickelt. Im Gegensatz zur herkömmlichen Volltextsuche ist es in der Lage, ähnliche Inhalte, die mit anderen Begriffen formuliert sind, zu identifizieren, und auch Kollokationen aufzeigen. Mit der neuen Lösung bietet prego Unternehmen umfassende Auswertungs-Services, beispielsweise zur Optimierung von Wissensdatenbanken.
Die neue Lösung "Heimdall" von prego ermöglicht es, Texte aus unterschiedlichsten Dateitypen wie .doc, .pdf, .txt oder .csv zu durchsuchen und zu analysieren. Dazu entfernt das System zunächst alle für die Indexierung irrelevanten Stoppwörter wie Artikel, Konjunktionen und Präpositionen, korrigiert Rechtschreibfehler und reduziert die verbleibenden Wörter auf ihre Stammform. Danach verschlagwortet es die Dokumente und ordnet ähnliche Wörter, etwa "Haus" und "Gebäude", entsprechenden Äquivalenzklassen zu. Anschließend werden sie in eine In-Memory-Datenbank geschrieben, die es erlaubt, die Texte sehr schnell zu durchsuchen und in Echtzeit statistisch auszuwerten.
Heimdall findet die Lösung in Dokumenten auch Inhalte, die der Suchanfrage ähnlich sind, aber andere Begriffe und Formulierungen aufweisen. Außerdem kann die Software so genannte Kollokationen darstellen – also aufzeigen, mit welchen anderen Begriffen ein gesuchtes Wort besonders häufig gemeinsam auftritt. Dabei lässt sich die Lösung in den unterschiedlichsten Themenbereichen einsetzen. Um auch von fachspezifischen Begriffen die Stammformen zu produzieren, können Wortbibliotheken aus allen erdenklichen Gebieten in das System geladen werden – seien es Rechtswissenschaften, Medizin, Ingenieurwesen oder IT.
Mit ihrer neuen Lösung kann prego umfassende Auswertungs-Services anbieten. Möchte ein Unternehmen beispielsweise seine Wissensdatenbank optimieren, findet der IT-Dienstleister mit Heimdall Dokumente, die ähnliche Informationen enthalten und deshalb konsolidiert und zusammengefasst werden können. Das Aufzeigen der Kollokationen ermöglicht es dem Auftraggeber außerdem nachzuvollziehen, welche Themenschwerpunkte in der Wissensdatenbank bereits ausreichend abgedeckt sind und wo es eventuell noch Lücken gibt.
Zu den zahlreichen weiteren Anwendungsmöglichkeiten zählen das Aufspüren von Musterverträgen, die von Gesetzesänderungen betroffen sind, oder die Plagiatssuche im wissenschaftlichen Umfeld. Hierbei findet Heimdall nicht nur Passagen, die Wort für Wort übernommen sind, sondern auch solche, die zur Verschleierung umformuliert wurden, aber identische Inhalte aufweisen. In sämtlichen Fällen müssen die Auftraggeber ihre Dokumente nicht zwingend an den IT-Dienstleister übergeben. Da Heimdall nur lesenden Zugriff benötigt, kann das System je nach Sicherheitsanspruch und vorhandenen Schnittstellen auch direkt an die Dokumente andocken.
"Die Dokumente der Unternehmen bergen meist das gesammelte Wissen ihrer Mitarbeiter", sagt Stefan Schreiber, Teamleiter Application Support bei prego services in Ludwigshafen. "Mit Heimdall haben wir eine neuartige und leistungsfähige Lösung entwickelt, die ihnen dabei hilft, auf dieses Wissen zurückzugreifen, neue Zusammenhänge zu erkennen oder Probleme zu identifizieren." (prego services: ra)
prego Services: Kontakt und Steckbrief
Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.