13. oktober 2023

Plaprepapegøjer

Indlæg

Det er forkert at sige, at ChatGPT forstår sprog som mennesker. For én ting er at formulere en sætning - noget andet at forstå, hvad der bliver talt om.

Kronik af lektor Thor Grünbaum ( Sektion for Filosofi og Institut for Psykologi)  i Weekendavisen den 13. oktober 2023. 

Siden ChatGPT blev frigivet sidste efterår, har de fleste efterhånden stiftet bekendtskab med store sprogmodeller - de kunstige neurale netværk, som ChatGPT og lignende chatbots bygger på. Store sprogmodeller er statistiske modeller, som efter at være blevet trænet på enorme mængder tekst fra internettet kan gætte på det næste mest sandsynlige ord i en sekvens af andre ord. Modellerne har imponeret med deres evne til at producere velformede tekststykker, der ofte ikke er til at skelne fra tekst skrevet af mennesker. Derfor hører man folk tale om store sprogmodellers evne til at»forstå sprog«.

Men kan ChatGPT virkelig forstå, hvad man skriver til den? Kan den forstå engelsk eller dansk på samme måde som en engelsksproget eller dansksproget person?

Eksperternes meninger om chatbottens sprogforståelse er delte. I en række artikler har lingvisten Emily M. Bender argumenteret for, at store sprogmodeller blot er»stokastiske papegøjer«, altså rene statistiske forudsigelsesmaskiner, der ikke forstår det sprog, de bearbejder og producerer. Menneskelig sprogforståelse er ifølge Bender et langt mere komplekst fænomen. Hertil har Sam Altman, direktør for firmaet bag ChatGPT, svaret, at også mennesker blot er stokastiske papegøjer.

Hvis vi vil finde hoved og hale i snakken om store sprogmodellers reelle forståelse af sprog, kan vi finde god hjælp i lingvistikken og sprogfilosofien. Her har man i lang tid diskuteret, hvad det vil sige at forstå et sprogligt udtryk, og hvilke evner mennesker bruger, når vi afkoder meningen i en anden persons sproglige ytringer.

FOR DET FØRSTE bruger vi en række formelle sproglige kompetencer til at navigere i sprogets generelle grammatiske, syntaktiske og semantiske regler. Man skal have et ordforråd og vide, hvordan ordene kan sættes sammen til grammatisk velformede sætninger. Man skal også kunne omforme sætninger fra en aktiv til en passiv form, fra nutid til datid og fra ental til flertal. Hvis en person mestrer disse ting på dansk, ville vi måske sige, at vedkommende»forstår dansk«.

Man kommer dog sjældent særlig langt med at tale eller skrive på dansk, hvis man ikke supplerer de formelle sproglige kompetencer med en række andre kompetencer.

Tag for eksempel ytringen:»Hende med champagnen er min nabo.«Med de formelle sproglige kompetencer kan man måske udlede en skematisk mening af sætningen, også selvom man ikke ved, hvem der taler, eller hvem der omtales (man kan forestille sig at finde sætningen som flaskepost på en strand).

Mange filosoffer mener, at man ikke kan have fuld forståelse af en ytring, før man kender ytringens sandhedsbetingelser. Man skal vide, hvad der skal være tilfældet, for at sætningen er sand. Derfor skal man i dette tilfælde også vide, hvem der taler, og hvilken person udtrykket»hende med champagnen«refererer til. Ytringens sandhed afhænger af, om disse to personer har bopæl ved siden af hinanden. Hvis man forstår, hvad taleren siger (og hvis det, personen siger, er sandt), så ved man nu noget nyt om verden.

Man sanser rummet omkring sig og gør brug af fælles viden om, hvilke drikkevarer der oftest skænkes i hvilke typer glas. Gennem formel sprogforståelse, evne til samarbejde, sanseindtryk og almen viden opnår man så en forståelse af, hvad veninden siger med sin ytring

Thor Grünbaum

Før man kan vide, hvem taleren omtaler med sin ytring, skal man kunne koble den generelle betydning af udtrykket»hende med champagnen«til den kontekst, man befinder sig i. Måske står man til en fest, og en veninde udpeger sin nabo i mængden af gæster. Måske følger man venindens blik, og er man i tvivl, supplerer hun med information om kvindens påklædning (» i grønt«). Man sanser rummet omkring sig og gør brug af fælles viden om, hvilke drikkevarer der oftest skænkes i hvilke typer glas. Gennem formel sprogforståelse, evne til samarbejde, sanseindtryk og almen viden opnår man så en forståelse af, hvad veninden siger med sin ytring.

Samtidig kommunikerer vi ofte mere end vores ytringers bogstavelige indhold. Beskrivelsen af dette ekstra indhold kaldes ofte for pragmatik. Hvis man spørger en ven, om hun vil med i biografen, og hun så svarer»jeg skal på stranden i eftermiddag«, er hun måske i færd med at afslå invitationen. I forståelsen af vennens kommunikative hensigt trækker vi på en myriade af relevante informationer i konteksten - for eksempel vores erindringer om det, der er blevet sagt tidligere i samtalen, og en forventning om, at hun siger ting, der er relevante for os at vide.

HVAD MED CHATGPT? Forstår store sprogmodeller tekster på sammenlignelige måder? Store sprogmodeller har vist sig at præstere langt bedre end forventet, når det gælder de formelle sproglige kompetencer.

De kan producere grammatisk velformede tekster. De kan opsummere i et simpelt sprog og omforme tekster fra én genre til en anden. De klarer sig næsten lige så godt som mennesker, når man tester deres evne til at indsætte ord i grammatisk komplekse sætningskonstruktioner. De repræsenterer sammenhænge mellem ord på måder, der svarer til sammenhængen mellem vores begreber. Forskning tyder på, at sprogmodellerne præsterer alt dette på måder, som på relevante punkter minder om vores hjerners bearbejdning af sprog.

Men mennesker trækker ikke kun på formelle sproglige evner, når vi forstår, hvad andre mener. Vi bruger en række ikkesproglige evner, når vi skal forstå en ytrings bogstavelige betydning og talerens hensigt med ytringen. Vi samarbejder og tænker på samtalepartnerens mentale liv. Vi sammenholder sanseindtryk med hukommelse og generel viden om verden, og vi drager logiske slutninger. De store sprogmodeller, vi kender nu, kommer i hovedreglen til kort, når det gælder disse yderligere kompetencer.

Hvis vi siger, at ChatGPT og store sprogmodeller forstår sproglige beskeder på samme måde som mennesker, siger vi ofte én af to ting.

Enten siger vi, at sprogmodellerne er mere fantastiske, end de faktisk er. Vi kommer til at påstå, at ChatGPT og andre store sprogmodeller evner alle former for menneskelig sprogforståelse. Eller vi siger, at mennesker er dummere, end vi egentlig er. Vi kommer til at påstå, at sprogforståelse blot indebærer formelle kompetencer. Ligesom Sam Altman, når han siger, at også mennesker bare er stokastiske papegøjer. Begge ting synes forkerte.

Menneskelig sprogforståelse involverer også evnen til at forstå andres hensigter, samarbejde og bruge fælles viden til at vurdere, om en ytring er sand, og hvilke intentioner en taler har.

Emner