wij bellen u

Vul uw telefoonnummer in en wij bellen u z.s.m. terug!



tm7_22

header language technology carp small

Automatisch tags bepalen

Tegenwoordig kunnen we in facties van seconden zoeken, maar hoe kunnen we de juiste informatie vinden? En hoe zoeken we als we niet weten waar naar we moeten zoeken? Een goede methode is het classificeren van teksten. Het nadeel hiervan is dat vooraf training nodig is. Daarom heeft Carp Technologies een unieke verbeterde technologie ontwikkeld: keyword-extractie. Op basis van Natural Language Technology en door Carp ontwikkelde technieken bepaalt de keyword extractor wat de belangrijkste onderwerpen zijn in de tekst of het document en geeft tags aan. Het bepalen van tags gaat dan volautomatisch.

Hoe werkt het?

Bij zoek machines wordt vaak de “term frequency–inverse document frequency” (tf-idf) methode gebruikt. Dit is een statistische methode die bedoeld is om
aan te geven hoe belangrijk een woord in een document of corpus is. Deze methode werkt goed voor het filteren van stopwoorden. Het nadeel is dat veel irrelevante woorden ook worden gemarkeerd.

Op basis van Natural Language Technology heeft Carp een unieke methode ontwikkeld waarbij ook naar tekst fragmenten wordt gekeken. Zo zal “Boekenweekessay” herkend worden maar ook “Boekenweek”. Daarnaast worden irrelevante woorden niet gemarkeerd. Hiermee worden grote voordelen behaald. Training is niet nodig én de relevante keywords worden getoond.

Tagger - nl screenshot

Voordelen

De volautomatische tagger heeft door de unieke techniek de volgende voordelen:

  • Consistente manier van tagging.
  • Snelle werking.
  • Eenvoudige installatie.
  • Volledige integratie mogelijk in uw bedrijfsproces.
  • Autmatische traning op een specifieke corpus is mogelijk.

Meer informatie?

De volautomatische tagger is beschikbaar als webapplicatie en als webservice zodat deze volledig geintegreerd kan worden in uw bedrijfsproces. Neem gerust contact op als u meer wilt weten over de volautomatische tagger of over onze andere producten:

Download de Brochure, lees de SOAP Service documentatie of neem contact op als u meer wilt weten over volautomatisch taggen of over een combinatie met één van onze andere producten:

  • Anonimiseren: het anonimiseren of pseudonimiseren van teksten.
  • Summarizer: volautomatisch samenvattingen maken.
  • Classifier: het classificeren van teksten op basis van training.
  • Duplicate finder: het vinden van gelijkwaardige teksten
  • Identifier: specifieke metadata toevoegen aan teksten.