På Kungliga Tekniska högskolan i Stockholm försöker forskare att få robotar att bli mer sociala på mänskligt vis. Men det är inte helt lätt för en robot att lära sig att konversera, det är många olika komponenter som ska stämma.
Roboten måste förstå orden som sägs, men också hur de sägs. Tonfallet är en viktig komponent i mänskligt tal, samma ord kan betyda många olika saker beroende på hur det sägs. Ansiktsuttryck är ytterligare en komponent som behöver förstås, men även sammanhanget spelar in – var vi är och vad vi pratat om innan.
– Så vad roboten måste göra är att bygga upp en modell av tillståndet i vårt samtal, vad det du säger betyder i just den här situationen, säger Gabriel Skantze, docent i talteknologi vid Kungliga Tekniska högskolan.
Avsaknad av humor
Roboten måste uppfatta ord, tonfall, ansiktsuttryck och sammanhang och tolka dessa på rätt sätt.
– Sedan måste systemet själv avgöra hur det ska svara. Vad ska systemet använda för tonfall i sitt svar tillbaka? Det är många komponenter, säger Gabriel Skantze.
Något som rör till det hela ytterligare är att vi ibland säger saker som betyder något helt annat. Ironi, sarkasm och skämt är svåra att tolka om ord och tonfall är det enda som uppfattas.
– Problemet där är ju att det är så kontextberoende. Ett skämt är ju inte bara i mitt tonfall, ett skämt eller ironi handlar ofta om att vi bryter mot det förväntade. Då måste man börja tolka intentioner och då börjar det bli svårt för roboten, säger Gabriel Skantze.
I vårt språk ingår också outtalad information. Frågar vi någon om den vet vad klockan är förväntar vi oss också att få svar på vad klockan är, vi vill inte bara veta om personen vi frågar vet vad klockan är.
Robotar lär sig
Men det finns vägar runt den här typen av språkligt krångel, roboten kan lära sig vanligt förekommande fraser och vad den förväntas svara.
En robot kan också lära sig hur den ska agera i en viss situation. Jobbar den i en reception handlar samtalet om det, och det är då lättare att begränsa vad roboten behöver kunna. Då uppstår problem först när fraser den inte har lärt sig kommer på tal.
– Vi kan ju lära roboten de här standardiserade slutledningarna, men det är väldigt svårt för roboten att på ett kreativt sätt tänka ut vad du egentligen menar. Ofta är ju humor, sarkasm och ironi skapat i stunden och kreativt, om det ska bli roligt i alla fall, och det är svårt för roboten, säger Gabriel Skantze.
Det är just det som skiljer artificiell intelligens från mänsklig intelligens än så länge. Robotar kan läras upp att klara väldigt komplexa uppgifter, men de kan idag inte använda sig av den kunskapen för att klara andra uppgifter.
– Vi människor lär oss någonting via ett område och sedan överför vi det. Vi är jätteduktiga på att se analogier och paralleller mellan problem och applicera det, det är så vi lär oss hela tiden. Det är det som de här systemen inte klarar av helt enkelt.
– Det är den heliga graalen, att komma dit, att få den att göra den här överföringen, säger Gabriel Skantze.
Mer artificiell intelligens i programmet Vetenskapsstudion på SVT Play.