Nog een staartje voor NLP technologie
Om te hervatten wat ik voor het weekend behandelde over natuurlijke taalverwerking, hier nog even het vervolg! Lemmatiseren en Stemming Lemmatiseren en stampen zijn tekstnormalisatietaken die helpen tekst, woorden, en documenten voor te bereiden op verdere verwerking en analyse. Volgens de Stanford Universiteit is het doel van zowel stemming als lemmatisering het terugbrengen van verbuigingsvormen en soms afgeleide vormen van een woord tot een gemeenschappelijke grondvorm. Bijvoorbeeld: Omdat woorden zoveel verschillende grammaticale vormen hebben, gebruikt NLP lemmatisering en stammen om woorden tot hun grondvorm te herleiden, zodat ze gemakkelijker te begrijpen en te verwerken zijn. Stopwoord verwijdering Stopwoord verwijdering is het proces van het verwijderen van veel voorkomende woorden uit tekst, zodat alleen unieke termen overblijven die de meeste informatie bieden. Het is essentieel om hoogfrequente woorden die weinig semantische waarde aan de tekst bieden te verwijderen (woorden als “the,” “to,” “a,” “at,” enz.) want ze erin laten zal de analyse alleen maar vertroebelen. Woordbetekenis ontambiguatie Woordzin disambiguatie is het proces van het bepalen van de betekenis van een woord, of de “zin”, op basis van hoe dat woord in een bepaalde context gebruikt wordt. Hoewel we er zelden bij stilstaan hoe de betekenis van een woord totaal kan veranderen, afhankelijk van hoe het gebruikt wordt, is het een absolute must in NLP. Neem bijvoorbeeld het woord “bas” – een woord met twee heel verschillende “betekenissen”: Tekst Classificatie Tekstclassificatie kent vooraf bepaalde categorieën (of “tags”) toe aan ongestructureerde tekst volgens de inhoud ervan. Tekstclassificatie is vooral nuttig voor sentimentanalyse, een techniek die gebruikt wordt om te bepalen of de taal positief, negatief, of neutraal is. Bijvoorbeeld, als in een stuk tekst een merk genoemd wordt, kunnen NLP algoritmen bepalen hoeveel vermeldingen positief en hoeveel negatief waren. E-mail filters Veel e-mail platforms kunnen je e-mail inbox automatisch ordenen in categorieën als Primair, Sociaal, Promoties, en Spam. Die categorisering is te danken aan trefwoord-extractie, een NLP taak waarbij de machine de woorden in de onderwerpregels analyseert, ze associeert met vooraf bepaalde tags, en dan leert ze te categoriseren waar ze thuishoren. Na jaren en jaren van trainingsgegevens zijn deze e-mailfilters nu ongelooflijk nauwkeurig en voorkomen ze dat je inbox een puinhoop wordt. Automatisering van klantenservice Op dezelfde manier kunnen we NLP toepassen op het automatiseren van handmatige klantendienst taken. Tekstclassificatie stelt bedrijven in staat om binnenkomende tickets voor klantenondersteuning te taggen op basis van trefwoord, onderwerp, sentiment en belang, zodat er kostbare tijd vrijkomt voor menselijke medewerkers van de klantendienst. Door deze zich herhalende manuele taken af te schaffen, kunnen klantendienstteams betere ondersteuning bieden aan klanten en efficiëntie binnen hun processen creëren. Chatbots Klanten willen snelle, on-demand service. Betreed chatbots, programma’s die in staat zijn menselijke, op tekst gebaseerde gesprekken na te bootsen. Door natuurlijke taalverwerking en -generatie kunnen chatbots de bedoeling interpreteren achter wat een klant intypt, trefwoorden identificeren, en een antwoord genereren op basis van hun begrip van de gegevens. De beste van deze chatbots kunnen zelfs de emoties van een klant interpreteren en nuttige opmerkingen geven, en zo eentje kan je bij ADD Business Point verwachten binnenkort! Voorlopig gaat de klantendienst nog even via deze link Contact ADD Business Point! Florentijn van den Bos – ADD::Flex4you Chief Flexwork Officer |
Terug naar overzicht
Geplaatst op: 2 mei 2022