TXTWerk - Neofonie Textmining API

Sie wollen sofort loslegen?

TXTWerk ist eine leichtgewichtige Textanalyse-Framework und ermöglicht es, durch einfache Integration in Ihren Workflow aus deutschen oder englischen Texten Metadaten zu extrahieren und so zu unstrukturierten Texten semantischen Kontext zu liefern. Durch die Anwendung komplexer linguistischer und statistischer Algorithmen kann TXTWerk Ihren Text lesen und verstehen, und das mit hoher Geschwindigkeit. Ob Sie 1000 oder 10 Milliarden Dokumente verarbeiten wollen, TXTWerk erkennt die wichtigsten Schlüsselwörter, Personen, Orte, Organisationen, Events und andere Konzepte und verlinkt erwähnte Entitäten und Konzepte zu einer einer der bekanntesten Wissensquellen: Wikidata. Diese Verknüpfung und die Verwendung von Linked Open Data eröffnet völlig neue Möglichkeiten. zur weiteren Verarbeitung. TXTWerk findet nicht nur bekannte Personen, sondern ist auch in der Lage, völlig unbekannte Entitäten in Texten zu erkennen oder kundenspezifische Wissensquellen zur Anpassung von TXTWerk an eine bestimmte Domäne zu nutzen.

API Dokumentation

Demo

Kontakt

TXTWerk Funktionen

Entitätenerkennung und -verlinkung

TXTWerk kann Entitäten (Personen, Orte, Organisationen, Jobtitle und Events) aus Ihren Texten extrahieren und die Fundstellen im Dokument ausweisen. Die erkannten Entitäten werden zur Linked Open Data Quelle Wikidata verlinkt. Aus Buchstaben werden so Bedeutungen. Unterstützte Sprachen: Deutsch und Englisch

Erkennung unbekannter Entitäten

Auch in Wikidata nicht vorhandene Entitäten werden durch TXTWerk erkannt. Man kann das auch das Lieschen-Müller- oder Otto-Normalbürger-Problem nennen. Sie sind damit völlig unabhängig von einem zu pflegenden Lexikon. Unterstützte Sprachen: Deutsch und Englisch

Konzept-Tagging

TXTWerk findet generelle Konzepte aus der realen oder abstrakten Welt und verlinkt sie zu Wikidata. Konzepte sind Begriffe wie "Waldsterben". In Wikidata wird dies mit der URI bezeichnet. Die TXTWerk API ist aber auch in der Lage, alternative Schreibweisen für dieses Konzept auf die gleiche URI zu verlinken, beispielweise "Baumsterben". Damit ist sichergestellt, dass - egal wie man ein Konzept beschreibt - immer die gleiche Bedeutung verlinkt wird. Unterstützte Sprachen: Deutsch und Englisch

Schlüsselwort-Extraktion

TXTWerk extrahiert die wichtigsten Schlüsselwörter (tags) aus Texten. Wir benutzen hierzu statistische Algorithmen und Techniken der natürlichen Sprachverarbeitung (NLP), um Ihre Daten zu analysieren. Damit ist es möglich, die extrahierten Schlüsselwörter zu benutzen, um sie in einem Index weiterzubenutzen, Tag Clouds zu erstellen oder weitere Dimensionsreduktionen für Ihre Texte zu ermöglichen. Unterstützte Sprachen: Deutsch

Kategorie-Klassifikation

TXTWerk klassifiziert automatisch Ihren Content in verschiedene Kategorien (Ressorts). Wir benutzen hierbei Techniken des maschinellen Lernens. Für Sie entfällt die manuelle Klassifikation. Unterstützte Sprachen: Deutsch

Datumserkennung

Sind in Ihrem Text Zeitbezüge, so erkennt TXTWerk sie und gibt den absoluten Zeitpunkt an. Dabei ist es egal, ob es sich um ein explizites Datum handelt, oder um relative Zeitangaben wie "gestern", "letzte Woche" oder "vor vier Jahren". Unterstützte Sprachen: Deutsch

Preise

Evaluation (Kostenlos)

Entitätserkennung mit Wikidata URIs
Konzept-Tagging mit Wikidata URIs
Schlüsselwortextraktion
Klassifikation
Datumserkennung
bis zu 10.000 Zeichen pro Dokument
max. 500 Calls / Tag
10.000 API Calls / Monat
einen Monat kostenlos

Jetzt unverbindlich testen

Enterprise

Entitätserkennung mit Wikidata URIs
Konzept-Tagging mit Wikidata URIs
Schlüsselwortextraktion
Klassifikation
Datumserkennung
bis zu 200.000 Zeichen pro Dokument
flexibel
flexibel
monatliches Abonnement

Kontaktieren Sie uns

Sie möchten weitere Informationen erhalten? Sie haben weitere Fragen? Nehmen Sie mit uns Kontakt auf!

Schreiben Sie uns

Rufen Sie uns an

Über uns

TXTWerk ist die Textmining API der Neofonie GmbH, ein in Berlin ansässiger Fullservice Provider, spezialisiert auf Portale, Suche, Sozial Media, E-Publishing und Entwicklung mobiler Applikationen.

Impressum

Neofonie GmbH
Robert-Koch-Platz 4
10115 Berlin, Germany
Phone: +49 30 24627-0
Website: https://www.neofonie.de

Amtsgericht Berlin-Charlottenburg
HRB 67 460 - Sitz Berlin
Geschäftsführung:
Thomas Kitlitschko
USt-ID: DE 194 693 995

Sie benötigen Hilfe?

Sie können weitere Informationen in der Dokumentation der TXTWerk API erhalten.

2018-2020 neofonie GmbH
Datenschutzerklärung

TXTWerk: leichtgewichtige Textanalyse API