Glatte ansigter

Nu skal vi til at forhandle om, hvem der skal tale,« siger Judith Holler, da jeg har stillet mit åbningsspørgsmål til Holler og hendes kollega Asli Ozyurek, og de bryder begge ud i en høj latter.

De to forskere studerer de mange små, nærmest usynlige tegn, vi bruger til at få snakken til at glide, når vi taler med hinanden ansigt til ansigt, og jeg har bedt dem svare på, hvordan samtaler forandres, når de pludselig skal føres over Zoom, Skype eller Google Hangouts – videomødetjenester, som er blevet voldsomt populære under coronakrisen og kan blive en vigtig del af vores liv i fremtiden.

Judith Holler er lektor ved Donders Institut for Hjerne, Kognition og Adfærd ved Radboud Universitet i Holland og leder af forskningsgruppen for kommunikation i social interaktion ved Max Planck Institut for Psykolingvistik. Det er hende, der har foreslået at lave interviewet over Zoom, og interviewet er altså knap gået i gang, før vi kan se de første konsekvenser af at skifte vores tredimensionelle ansigter ud med de todimensionelle skærmudgaver.

»Vil du begynde?« må Asli Ozyurek til sidst spørge Holler, der tager ordet. Havde vi siddet ansigt til ansigt, ville talerækkefølgen for længst være afklaret gennem vores blikretninger, mimik og gestikulering.

»Jeg tror, at de fleste mennesker har den her oplevelse af, at det er en fattigere version af kommunikation, når vi taler sammen over video,« siger Judith Holler.

Kropssprog og mimik har længe været forstået som en måde at signalere sindstilstande på, men de seneste årtier har forskere i stigende grad opdaget, at vores mange lyde og bevægelser ikke blot er emotionel pynt, men en vigtig ingrediens i den vellykkede samtale. De små signaler er ganske enkelt afgørende for, hvordan vi forstår hinanden, og dét kan vise sig at være et væsentligt benspænd for den digitalisering af arbejde, undervisning og sundhed, som coronakrisen ellers har sat blus under.

Samtalens under

Siden krisens start har virksomheder som Facebook og Google annonceret, at de vil lade deres medarbejdere arbejde hjemmefra i hvert fald resten af året. Andre virksomheder har ligeledes meldt ud, at man vil fortsætte med fjernarbejde og digitale møder, efter coronakrisen er overstået. Universiteter har omlagt undervisning til virtuelle rum, og læger har advokeret for flere virtuelle lægebesøg.

Videotjenesterne kan på billig og bekvem vis give os en følelse af at være ansigt til ansigt med en kollega, lærer eller læge, men det sker ikke uden omkostninger. Mange af de lyde og bevægelser, vi bruger til at holde balancen i samtalerne, overlever simpelthen ikke turen gennem internettet:

»Når vi taler sammen over video som nu, har vi på en måde adgang til de visuelle signaler, vi plejer at bruge, men de fortæller os bare ikke nødvendigvis særligt meget. For eksempel har jeg nu Asli i højre side af skærmen og dig til venstre, men sådan ser det måske ikke ud på din skærm, og så fungerer blikretningen ikke nødvendigvis som normalt, hvor den er en måde at vise, hvem man henvender sig til,« siger Judith Holler.

På samme måde kan mange andre af vores kropslige tegn gå tabt i videomøderne, forklarer Asli Ozyurek, der er professor ved Center for Sprogstudier ved Radboud Universitet og leder af forskningsgruppen for multimodal sprog og kognition.

»Jeg kan ikke give turen videre til en specifik person ved at vende mig mod vedkommende, og man kan ikke se, hvem blandt de mange små ansigter på skærmen jeg nikker til. Det er et problem,« siger Asli Ozyurek.

Den menneskelige samtale er på mange måde et under. Vi opfatter det måske blot som personer, der skiftes til at sige, hvad de har på hjerte, når det falder dem ind. Men i realiteten er samtaler en nøje koreograferet pingpong af afskudte udbrud, hvor den ene taler som oftest overtager ordet næsten sømløst fra den forrige som et veleksekveret stafetløb.

Pausen mellem det punkt, hvor den ene taler stopper, og den næste begynder, er i gennemsnit kun på 200 millisekunder. Danskere har godt nok vist sig at holde en anelse længere pauser end folk fra mange andre lande, men de er stadig væsentligt kortere end den tid, det tager at planlægge at frembringe blot et enkelt ord. Hvis vi skal kunne overtage taleretten uden akavede pauser, må vi kunne forudsige, hvornår folk er færdige. Derfor er vores snak styret af nogle usagte færdselsregler, som helst skal overholdes, for at vi opfatter en samtale som velfungerende, og det er i høj grad de regler, som udfordres i videosamtaler.

Den afgørende pause

Det bekræftes af et dansk forskningsprojekt, der afsluttes i de kommende måneder. Her har forskere undersøgt, hvordan videokommunikationen påvirker den menneskelige interaktion, og den overordnede konklusion er, at der typisk opstår problemer, hvis man tror, at man bare kan overføre rutinerne fra almindelige møder til videosamtalerne.

»Da vi begyndte på projektet for tre år siden, var der ikke mange, der interesserede sig for spørgsmålet. Det har ændret sig nu,« forklarer Brian Due via telefon.

Han er lektor ved Institut for Nordiske Studier og Sprogvidenskab på Københavns Universitet og en af forskerne bag projektet, der undersøger brugen af videokommunikation i sundhedssektoren, i virksomheder og det offentlige ved hjælp af såkaldt multimodal samtaleanalyse, hvor man ved hjælp af mange timers videooptagelser nærstuderer samtaler helt ned til de mange smålyde, pauser og kropshandlinger, vi laver undervejs.

At menneskets kommunikation er multimodal, betyder, at vi ikke forstår tale, blikretning, mimik, fagter og lignende som isolerede signaler, men at det er samspillet mellem dem, der fortæller de andre deltagere i samtalen, hvad vi egentlig mener.

»Et grundelement i samtalen er fremdrift, og hvis den bliver hakket i stykker, får man ineffektive samtaler, hvor man skal begynde forfra, og der kan opstå misforståelser. Derfor kan vi ikke lide for lange pauser, når vi taler ansigt til ansigt, og en pause på mere end ét sekund opfattes som problematisk,« forklarer Brian Due.

»Men det er helt anderledes, når man kommunikerer via video. For eksempel kan der være forsinkelser i lyden, og særligt for et par år siden, da vi indsamlede vores data, kunne forsinkelsen være ret stor. Det betyder, at folk ikke længere kan regne med pausen som et signal, og derfor opstod der problemer, hvor folk begyndte at tale mere i munden på hinanden og havde svært ved at koordinere, hvem der skulle tale hvornår.«

Man skulle tro, at det ikke gjorde den store forskel med en smule forsinkelse, så længe de rigtige ord når frem. Problemet er bare, at timingen af de mange små lyde og kropslige signaler er afgørende – særligt når vi skal skelne vigtige, subtile signaler fra de mange bevægelser, der ikke har nogen betydning. Samtidig kan vi opfatte lange pauser efter et spørgsmål som et signal om, at vi ikke køber spørgsmålets præmisser eller har tænkt os at give et andet svar end det, spørgeren ønskede.

Når vi taler sammen, venter vi hele tiden på, at vores samtalepartner med små tegn godkender vores ord, før vi bevæger os videre til næste pointe. De små bekræftende tilbagemeldinger kan være svære at opfatte i videosamtaler.

»I en samtale handler det ikke bare om, at de andre deltagere skal kunne se, hvad man gør. Det er også meget vigtigt, at man hele tiden kan forstå sig selv gennem den andens blik. Hvis man taler til en skærm og slet ikke får nogen feedback fra de andre deltagere, fordi de har slået kameraet fra, er det svært at tale sammenhængende. Det har mange af os, der har skullet undervise over video under coronakrisen, måttet sande på den hårde måde. Her kan det hjælpe, hvis man også kan se sig selv på skærmen, så man hele tiden har en idé om, hvordan andre opfatter en,« siger Brian Due.

At tage ordet

Judith Holler har for nylig undersøgt betydningen af et andet signal: øjnenes blinken. Blink har selvfølgelig en rent praktisk funktion med at holde øjnene fugtige, og nogle af de korte blink ser ud til kun at spille den rolle, men længere blink på mere end 410 millisekunder lader til at spille en central rolle som en tilbagemelding:

»Det er en måde at sikre sig, at den anden person forstår, hvad man siger, inden man fortsætter sin talestrøm. Det er enormt vigtig at skabe den her fælles forståelse, og det ser ud til, at vi bruger de her blink sammen med små nik og bekræftende lyde som et signal om, at vi har forstået talerens pointe. Men hvis man har selv små forsinkelser i forbindelsen, eller man eksempelvis har et videomøde, hvor man kun kan se de andre deltagere som en masse små ansigter, virker de her små signaler måske ikke altid efter hensigten,« forklarer Judith Holler.

Deltagerne i Hollers forsøg gav længere svar, når de henvendte sig til et virtuelt ansigt, der ikke blinkede. Det kan skyldes, at de ikke følte sig forstået og derfor var nødt til at tilføje yderligere oplysninger.

»Vi kan naturligvis heller ikke blinke eller nikke, når vi taler i telefon med folk, så her siger vi rigtigt ofte lyde som ’uhm’ og ’aha’ sammenlignet med samtaler ansigt til ansigt. Vi ved ikke, hvordan det fungerer med videosamtaler, men ofte har folk lyden slukket, når de ikke har ordet, og de vil nok ikke tænde for lyden blot for at sige ’uh-uhm’, så måske vil folk ende med at nikke rigtigt meget, når de taler over video,« siger Judith Holler

Netop det faktum, at de fleste deltagere i et møde vil have lyden slukket, indtil de får ordet, kan fjerne mange af de små lyde, vi plejer at bruge til at tage ordet:

»Nogle af tegnene er enormt subtile, og derfor tænker vi måske ikke over, at vi mister dem. Jeg havde for eksempel aldrig tænkt over, hvilken rolle det, man kalder ‘det hørbare åndedrag’, spiller i samtale, før jeg begyndte at studere dem. Pludselig hører jeg dem hele tiden og kan se, hvordan den anden persons blik straks vender sig mod en person, der højlydt suger luft ind,« forklarer Judith Holler, som selv har lavet forsøg med mobil eyetracking, som viser, at folk straks vender sig mod den person, der trækker vejret ind.

»Når man bliver klar over det og tester det i frokostpausen, ser man, at det virkelig fanger folk,« siger hun.

»På den måde er det sværere at klemme sig ind i talerækken, når man holder et videomøde. Det har jeg lagt mærke til, når jeg selv har holdt møder i den her periode. Alle har lyden slukket, og så siger de måske kun en enkelt ting, fordi det er svært at signalere, at man vil bryde ind. Samtalen bliver mere hierarkisk, og især mange kvinder og ældre mennesker kan have svært ved at bryde ind,« siger Asli Ozyurek.

Flere fagter

Menneskets kommunikationssystem er fleksibelt, og der er mange eksempler på, at vi har lært at lægge støre vægt på fagter og mimik i situationer, hvor det har været svært at kommunikere med ord – eksempelvis på fortidens jagter eller i de mange støjende omgivelser, man kan møde i dag. Måske kræver den nye virkelighed på samme måde mere udtryksfulde signaler?

»Jeg argumenterer for, at folk må til at bruge fagter mere. Både i videosamtaler og i virkeligheden, hvor social afstand og masker kan betyde, at meget af den subtile mimik og gestikulering går tabt. Der er forskel på, hvor mange og hvor store fagter man laver i forskellige kulturer, og måske må nogle af de kulturer, der ikke gestikulerer så meget, til at tilpasse sig,« siger Asli Ozyurek.

At vores fagter og bevægelser skal være tydeligere, når vi kommunikerer via video, bekræftes af Brian Due og kollegernes danske undersøgelser. Men nogle af signalerne kan måske erstattes af videotjenesterne:

»Zoom har for eksempel en mulighed for at kunne række hånden op digitalt. Her har man prøvet at imitere det kropslige. Hvis man er god til at bruge det og er blevet enige om, at det er sådan, man fordeler taleretten, kan man nærme sig dynamikken fra samtalen ansigt til ansigt,« siger Brian Due.

Samtidig kommer videomødernes mere grovkornede sanseindtryk måske også med fordele.

»Hvis man gerne vil være effektiv og måler effektivitet på samtalens varighed, vil video oftest være bedre end at mødes ansigt til ansigt. Det er nok derfor, vi for tiden ser alle de her positive historier om videomøderne. Man kan ikke smalltalke på samme måde til et videomøde, og derfor kommer man hurtigere til pointen. Så hvis man bare skal løse en simpel opgave, give en status eller afklare, hvem der gør hvad, er videomøder nok smartere. Særligt hvis man tager al transporten med i betragtningen. Vi kan se, at der generelt bruges kortere tid på de virtuelle end på de fysiske møder, når man i forsøg laver sammenlignelige opgaver. Men det kan godt være, at man havde brugt endnu kortere tid, hvis man havde lavet det over telefon. Det ved vi ikke,« siger Brian Due, der til gengæld peger på, at mange opgaver, hvor man skal tage stilling til noget visuelt, formodentligt vil løses bedre via video end i telefon.

»Man kan for eksempel godt være kreativ sammen over video, og det fungerer faktisk rimeligt godt. Det kræver bare, at man kender hinanden i forvejen, og det er lettere, hvis man har mødtes ansigt til ansigt før.«

Videomøderne giver os altså muligheden for at se hinanden uden så meget sniksnak. Men spørgsmålet er, om synsindtrykket på de små skærme giver os en masse signaler, der forvirrer mere, end de hjælper?

»Mange folk siger, at de bliver trætte, når de har videokonferencer. Hvorfor det? Måske er det, fordi de forsøger at få mening ud af folks blik, men ikke rigtigt kan få det, og så kan de ikke følge samtalen, og det bliver en ond spiral, hvor man konstant gætter sig frem. Folks blik er et utroligt kraftfuldt tegn. Det er den ting, vi lægger mest mærke til fra det øjeblik, vi bliver født,« siger Asli Ozyurek.

Anders Boas (f. 1982) er journalist og skriver især om forskning, der udfordrer vedtagne sandheder, og om politik og ideologi, der pynter sig med videnskab. Anders har en kandidatgrad i journalistik fra Roskilde Universitet på baggrund af studier i Journalistik og Musikvidenskab (Københavns Universitet).

xboa@weekendavisen.dk