Rachid Sabri
Het leren en toepassen van taal is voor ons een natuurlijke ontwikkeling, die we vanaf onze kindertijd relatief moeiteloos doorlopen. Het is een ontwikkeling die ons brein in staat stelt de wereld om ons heen steeds beter te begrijpen en vorm te geven aan onze manier van communiceren. Op het moment dat we taal voldoende beheersen, zijn we in staat om in enkele seconden informatie te ontvangen, te verwerken en erop te reageren met de juiste woorden of handelingen. De technologie die we AI noemen vertoont weinig overeenkomst met het leerproces van de mens. Het onderdeel van AI dat zich bezighoudt met het begrijpen en verwerken van de menselijke taal wordt Natural Language Processing (NLP) genoemd. Het maakt daarvoor gebruik van zogenaamde ‘neurale netwerken’, die werken op basis van algoritmes. AI bootst dus het menselijk brein na op basis van wiskundige berekeningen.
Een neuraal netwerk is een samenwerkende samenstelling van knooppunten (neuronen), verbindingen en rekenkracht. Het netwerk is opgebouwd uit verschillende lagen van onderling verbonden knooppunten, die fracties van de ontvangen informatie kunnen verwerken. Bij het analyseren van de aangeboden informatie verwerkt ieder knooppunt kleine gefragmenteerde stukjes informatie, die op hun beurt weer worden doorgegeven aan een volgend knooppunt. Elk knooppunt leert om de aangeboden informatie te herkennen en te identificeren op basis van toegekende waardes, uitgedrukt in een getal, met een bepaald gewicht. De aangeboden informatie wordt door ieder knooppunt verrijkt en in verband gebracht met de datapatronen waarmee het neuraal netwerk al bekend is.
Een neuraal netwerk wordt getraind om informatie te classificeren en er verbanden tussen te leggen waarin patronen kunnen worden herkend. In meerdere lagen van complexiteit worden specifieke stukjes informatie geanalyseerd en vervolgens in een bepaalde hiërarchie op basis van getallen doorgegeven aan een volgend knooppunt. Alle verwerkte losse stukjes informatie worden uiteindelijk op basis van getallen omgezet naar een voor de mens logisch herkenbaar geheel.
Het neuraal netwerk baseert de keuze voor een specifiek logisch geheel op de vele data die het tijdens het trainingsproces ingevoerd heeft gekregen. Tijdens het trainingsproces heeft het netwerk geleerd welke structuren vaak samen voorkomen.
Ter verduidelijking nemen we het voorbeeld van het herkennen van een hond op een afbeelding. Een neuraal netwerk analyseert als eerste enkele verschillende eenvoudige kenmerken van hetgeen dat wordt waargenomen op de afbeelding, zoals de contourlijnen en het kleurverloop. Vervolgens worden de wat complexere kenmerken geanalyseerd, zoals vacht, ogen, oren, snuit en poten. Daaropvolgend wordt er een verband gelegd tussen hetgeen het netwerk waarneemt en de tijdens de training geleerde definities van verschillende dieren met een soortgelijke bouw (vier poten, snuit, staart, enz.) Als laatste wordt er door middel van een kansberekening de meest waarschijnlijke waarneming benoemd, in dit geval een hond.
Op deze manier is een neuraal netwerk na veel training met een gigantische hoeveelheid data in staat om informatie te analyseren en te verwerken tot voor een mens herkenbare objecten. Zo kan een netwerk bijvoorbeeld het verschil herkennen tussen afbeeldingen, spraak of tekst. Het herkennen is hierbij niet te vergelijken met de werking van het menselijk brein. Het netwerk herkent patronen in data en herleidt dat, in het voorbeeld van de hond, naar de honderdduizenden gelabelde afbeeldingen van honden die tijdens de training zijn ingebracht. Door de in de training ingebrachte menselijke taalpatronen kan het neuraal netwerk zich vervolgens ook uiten in taal, waardoor een dialoog met de mens mogelijk wordt.
Een specifieke toepassing van een neuraal netwerk is het Large Language Model (LLM). Een LLM is gespecialiseerd in taal en wordt getraind met data van biljoenen zinnen. Door het gebruik van al deze data leert een dergelijk model voorspellen welk woord logisch volgt op een reeks woorden. Ook hier vormt de grondslag voor de werking een wiskundig proces, gebaseerd op zogeheten ‘vectorrepresentaties’. Een vectorrepresentatie vertaalt woorden, zinnen of objecten uit de menselijke taal naar getallenreeksen. Op basis van de statistische samenhang tussen deze reeksen, leert kunstmatige intelligentie hiermee te opereren. Op die manier kan een LLM verbanden leggen tussen woorden (bijvoorbeeld arts – ziekenhuis – klant – bestelling) zonder ooit expliciet te leren dat het ene woord een specifieke rol speelt binnen de context van de andere woorden.
Het bekendste voorbeeld van een LLM is GPT-4, dat onder meer wordt toegepast in generatieve AI-oplossingen als ChatGPT, Microsoft Copilot (in Word, Excel) en Bing Chat. Wanneer we gebruikmaken van dergelijke oplossingen, lijkt het alsof het model onze taal beheerst en ons begrijpt op de vertrouwde menselijke manier. In werkelijkheid is dat natuurlijk niet zo. Voordat deze modellen met menselijke taal kunnen werken, moet die taal eerst worden omgezet naar een serie wiskundige berekeningen.
Met de bovenstaande uitleg van de werking van NLP, neurale netwerken en LLM, kunnen we op zijn minst concluderen dat de communicatie tussen de mens en kunstmatige intelligentie nogal wat voeten in aarde heeft. Deze vormen van kunstmatige intelligentie zijn alleen in staat om op een menselijke manier te communiceren wanneer ze kunnen terugvallen op de statische data die hen is aangereikt tijdens hun uitgebreide trainingsperiode.
Het besef van de wijze waarop AI middels achterliggende wiskundige processen communiceert, moet tot de constatering leiden dat het belangrijkste aspect van de menselijke communicatie daarin volkomen afwezig is, namelijk de semantische samenhang. Semantiek in mensentaal gaat over het begrijpen van de bedoeling achter woorden. Het is het op waarde schatten van wat woorden, zinnen en uitdrukkingen betekenen en hoe mensen die betekenis in een bepaalde context begrijpen.
Het is juist de semantiek die de menselijke taal en de manier waarop we met elkaar communiceren zo uniek maakt. Bij een mens verloopt deze semantische benadering via taal natuurlijk en intuïtief. Mensen geven betekenis aan de wereld om hen heen gebaseerd op context, cultuur en persoonlijke ervaring. Mensen begrijpen elkaar niet alleen via woorden, maar ook via een combinatie van woordbetekenis, zinsstructuur, hun persoonlijke algemene ontwikkeling en natuurlijk de taal van het lichaam. Dit maakt dat mensen in staat zijn om nuances te begrijpen, ironie te herkennen en woordgrappen te snappen. Door de louter wiskundige benadering mist AI dit vermogen. Zonder deze semantische samenhang kan er dan ook nooit sprake zijn van een werkelijke beheersing van de menselijke taal.
– einde artikel –
Je las een Premium artikel uit Gezond Verstand
Volg ons op social media
Kijk en beluister Gezond Verstand via