wij bellen u

Vul uw telefoonnummer in en wij bellen u z.s.m. terug!



tm7_22

header language technology carp small

Metadata tags voor zoekverbetering

Googelen® is volgens de Dikke van Dale het zoeken naar informatie op Internet. Bijna iedereen gebruikt het met miljoenen resultaten in een fractie van een seconde, maar vindt u ook wat u zoekt?
Bedrijven die informatie belangrijk vinden hebben vaak documentalisten in dienst die nieuwe gegevens ordenen en het archief bijhouden zodanig dat informatie ook voor anderen eenvoudig te vinden is. Zij signaleren welke informatie belangrijk is en stellen collega’s op de hoogte.

Hoe wordt de metadata bepaald?

Met de diverse Carp taaltechnologische modules analyseert de Identifier de inhoud van een tekst en toont de rol van een persoon of entiteit binnen een tekst. Specifieke tekstuele elementen worden herkend en gemarkeerd en kunnen worden toegevoegd als metadata aan de tekst. Door deze tekstherkenning bepaalt de Identifier om wat voor soort elementen het gaat, zoals persoons- of bedrijfsnamen en welke rol deze vervullen in de tekst. Ook plaatsnamen, beroepen etc. kunnen worden herkend.

De Identifier kan specifiek geconfigureerd worden zodat de gewenste elementen uit de tekst worden geëxtraheerd en de bijbehorende rollen worden bepaald. Zo kunnen aliassen worden geconfigureerd (is het nu Den Bosch of ’s Hertogenbosch?) en een eenduidige schrijfwijze van namen worden gebruikt. Met de Identifier-output worden meta-gegevens aan uw documenten toegevoegd zodat het vinden van documenten zeer sterk verbeterd wordt.

Voordelen

  • Nauwkeurige resultaten bij het identificeren.
  • Identifier kan geconfigureerd worden en daardoor zeer specifiek worden.
  • Grote hoeveelheden tekst kunnen worden voorzien van meta-gegevens.
  • Lagere kosten in vergelijking met handmatig identificeren.
  • De Identifier is beschikbaar als applicatie en als web service zodat deze volledig geïntegreerd kan worden in uw bedrijfsproces.
Meer informatie?

Probeer het zelf op onze playgrounddownload de Brochure of neem contact op als u meer wilt weten over de Identifier of over een combinatie met één van onze andere producten:

  • Anonimiseren: het anonimiseren of pseudonimiseren van teksten.
  • Summarizer: volautomatisch samenvattingen maken.
  • Tagger: volautomatisch keyword extractie.
  • Classifier: het classificeren van teksten op basis van training.
  • Duplicate finder: het vinden van gelijkwaardige teksten

Klik op onderstaande afbeelding voor meer details:

brochure-carp-technolgies-identifier 2013-04-02