wij bellen u

Vul uw telefoonnummer in en wij bellen u z.s.m. terug!



tm7_22

header language technology carp small

TAAL TECHNOLGIE

Met taaltechnologie zijn vele oplossingen mogelijk om teksten automatisch te analyseren. Afhankelijk van de gewenste oplossing gebruiken we verschillende zelf ontwikkelde modules.

Fuzzy matching

Op een ‘tolerante’ en associatieve manier worden teksten vergeleken en wordt er bepaald in hoeverre deze overeenkomen. Ondanks dat de teksten niet woordelijk overeenkomen, kunnen ze toch met elkaar worden gematcht. Hierbij wordt gebruik gemaakt van zinsontleding, synoniemen, gerelateerde termen, alternatieve vervoegingen, et cetera.

Query expansion

Zoekvragen (binnen een zoekmachine) worden geanalyseerd en kunnen automatisch worden uitgebreid met synoniemen, alternatieve vervoegingen en gerelateerde termen. Ook type- en spelfouten worden verbeterd.

Pattern matching (patroonherkenning)

Handmatig gedefinieerde patronen in teksten worden herkend en daaruit worden eventuele parameters geëxtraheerd. De patronen worden dusdanig gespecificeerd dat een breed scala aan verschillende verwoordingen wordt herkend.
Bijvoorbeeld: ‘Ik wil <aantal> kaartjes bestellen voor de voorstelling <titel> van <artiest> op <datum>.’

Zinsontleding, grammaticale analyse

De zinsstructuur en de rol van de verschillende zinsonderdelen worden bepaald.

Chunking

Een zin wordt opgesplitst in logische onderdelen.
Bijvoorbeeld: [‘De gemene hond] van [de buurman] bijt [de kat].’

Keyword extraction, keyphrase recognition

Hier wordt bepaald welke woorden en passages in een tekst markant zijn. Deze geven een indicatie van het onderwerp van de tekst.

Type- en spelfoutencorrectie

Hier worden suggesties gegenereerd voor correcties.

De groepeerder

Met de groepeerder kunnen tekstitems of concepten worden gelokaliseerd in een tekst en ter vergelijking bij of naast elkaar worden getoond. Hiermee kan men zich sneller en gemakkelijker complexe teksten eigen maken.

De ontdubbelaar

De ontdubbelaar kan nagaan of teksten die in verschillende woorden zijn opgesteld toch dezelfde inhoud hebben. Met deze tool kunnen nieuwsteksten worden ontdubbeld, parafrases worden vastgesteld of kan plagiaat worden opgespoord.

Combinaties

Diverse combinaties van taaltechnologieën maken meerdere toepassingen mogelijk. Hieronder vindt u een aantal ideeën ter inspiratie.

Automatisch vragen beantwoorden

Bepaalt welk FAQ-antwoord het beste past bij een gestelde vraag en extraheert met behulp van patroonherkenning en zinsontleding eventueel ook relevante parameters uit de vraag, die worden ingevuld in het antwoord of gebruikt worden in een dynamisch gegenereerd antwoord.

Dialoogsysteem

Voert een chatgesprek met een gebruiker voor onder andere zelfhulp, op basis van bijvoorbeeld een FAQ. Kan ook gebruikt worden voor ‘transacties’ zoals het bestellen van kaartjes, financiële berekeningen, etc. Met patroonherkenning en zinsontleding worden de relevante gegevens uit de gebruikersuitingen geëxtraheerd.

User profiling

Op basis van geraadpleegde teksten wordt automatisch een interesseprofiel opgebouwd. Het profiel bestaat uit een ‘wolk’ van markante woorden en wordt gebruikt om te bepalen in hoeverre bepaalde content (document, advertentie, etc.) bij het profiel past (fuzzy matching). User profiling kan ook gebruikt worden om een verzameling documenten (bijvoorbeeld zoekresultaten) te sorteren naar relevantie ten opzichte van het profiel.

Redactionele hulpmiddelen

Er wordt als het ware meegekeken over de schouder van de redacteur en geholpen bij specifieke redactionele taken door bijvoorbeeld relevante passages op te lichten. De mogelijkheden zijn legio: het samenvatten van teksten in belangrijke passages, het anonimiseren van privacygevoelige passages, het redigeren van teksten, etc.

Hulpmiddel voor redigeren van teksten

Zoekmachines zoals Google waarderen zoekresultaten waarvan de inhoud elders ook letterlijk voorkomt, veel lager. Dit geeft bijvoorbeeld problemen voor webwinkels die de productomschrijving van fabrikanten letterlijk overnemen. TM7 heeft een tijdbesparend hulpmiddel ontwikkeld welke op een interactieve wijze suggesties doet in de tekst voor parafraseringen die met één klik zijn over te nemen. Dit hulpmiddel is o.a. ook geschikt voor partijen in de nieuwsbranche.