Sie wollen sofort loslegen?

TXT Werk ist eine leichtgewichtige Textanalyse API und ermöglicht es, durch einfache Integration in Ihren Workflow aus deutschen oder englischen Texten Metadaten zu extrahieren und so zu unstrukturierten Texten semantischen Kontext zu liefern. Durch die Anwendung komplexer linguistischer und statistischer Algorithmen kann TXT Werk Ihren Text lesen und verstehen, und das mit hoher Geschwindigkeit. Ob Sie 1000 oder 10 Milliarden Dokumente verarbeiten wollen, TXT Werk erkennt die wichtigsten Schlüsselwörter, Personen, Orte, Organisationen, Events und andere Konzepte und verlinkt erwähnte Entitäten und Konzepte zu einer frei abfragbaren Quelle in der Linked Open Data Welt: Wikidata. Mit dieser Verlinkung und der Nutzung von Linked Open Data erschließen sich völlig neue Möglichkeiten der Weiterverarbeitung. TXT Werk findet nicht nur bekannte Personen, sondern ist auch in der Lage, völlig unbekannte Personen in Texten zu erkennen (open domain entity recognition).

TXT Werk. Enabling text analysis.

TXT Werk Funktionen

Entitätenerkennung und -verlinkung

TXT Werk kann Entitäten (Personen, Orte, Organisationen, Jobtitle und Events) aus Ihren Texten extrahieren und die Fundstellen im Dokument ausweisen. Die erkannten Entitäten werden zur Linked Open Data Quelle Wikidata verlinkt. Aus Buchstaben werden so Bedeutungen.
Unterstützte Sprachen: Deutsch und Englisch

Erkennung unbekannter Entitäten

Auch in Wikidata nicht vorhandene Entitäten werden durch TXT Werk erkannt. Man kann das auch das Lieschen-Müller- oder Otto-Normalbürger-Problem nennen. Sie sind damit völlig unabhängig von einem zu pflegenden Lexikon.
Unterstützte Sprachen: Deutsch und Englisch

Konzept-Tagging

TXT Werk findet generelle Konzepte aus der realen oder abstrakten Welt und verlinkt sie zu Wikidata. Konzepte sind Begriffe wie "Waldsterben". In Wikidata wird dies mit der URI https://www.wikidata.org/wiki/Q1361577 bezeichnet. Die TXT Werk API ist aber auch in der Lage, alternative Schreibweisen für dieses Konzept auf die gleiche URI zu verlinken, beispielweise "Baumsterben". Damit ist sichergestellt, dass - egal wie man ein Konzept beschreibt - immer die gleiche Bedeutung verlinkt wird.
Unterstützte Sprachen: Deutsch und Englisch

Schlüsselwort-Extraktion

TXT Werk extrahiert die wichtigsten Schlüsselwörter (tags) aus Texten. Wir benutzen hierzu statistische Algorithmen und Techniken der natürlichen Sprachverarbeitung (NLP), um Ihre Daten zu analysieren. Damit ist es möglich, die extrahierten Schlüsselwörter zu benutzen, um sie in einem Index weiterzubenutzen, Tag Clouds zu erstellen oder weitere Dimensionsreduktionen für Ihre Texte zu ermöglichen.
Unterstützte Sprachen: Deutsch

Kategorie-Klassifikation

TXT Werk klassifiziert automatisch Ihren Content in verschiedene Kategorien (Ressorts). Wir benutzen hierbei Techniken des maschinellen Lernens. Für Sie entfällt die manuelle Klassifikation.
Unterstützte Sprachen: Deutsch

Datumserkennung

Sind in Ihrem Text Zeitbezüge, so erkennt TXT Werk sie und gibt den absoluten Zeitpunkt an. Dabei ist es egal, ob es sich um ein explizites Datum handelt, oder um relative Zeitangaben wie "gestern", "letzte Woche" oder "vor vier Jahren".
Unterstützte Sprachen: Deutsch

Preise

Evaluation (Kostenlos)


Entitätserkennung mit Wikidata URIs
Konzept-Tagging mit Wikidata URIs
Schlüsselwortextraktion
Klassifikation
Datumserkennung
bis zu 10.000 Zeichen pro Dokument
max. 500 Calls / Tag
10.000 API Calls / Monat
einen Monat kostenlos

Enterprise


Entitätserkennung mit Wikidata URIs
Konzept-Tagging mit Wikidata URIs
Schlüsselwortextraktion
Klassifikation
Datumserkennung
bis zu 200.000 Zeichen pro Dokument
flexibel
flexibel
monatliches Abonnement

Kontaktieren Sie uns!

Sie möchten weitere Informationen erhalten? Sie haben weitere Fragen? Nehmen Sie mit uns Kontakt auf!

Image verification