I fremtiden vil vi alle kunne blive snydt – skal vi frygte AI-skabte billeder?
Med kunstig intelligens kan vi alle skabe alle mulige og umulige billeder med et fingerknips. Hvad kan gå galt? En hel række ting, påpeger professor.
Et søuhyre rejser sig fra det grågrumsede vand i, hvad der ligner Nyhavn i København med de karakteristiske farvede byhuse. Et stort skeletmonster kravler hen over huse på, hvad en dansker med ét vil afkode som et gadehjørne i en dansk by.
Billederne ligner værker kreeret af en billedkunstner med flair for at skabe magisk realistiske billeder af monstre i Københavns gader. Men det er de ikke.
De er derimod lavet af en dansk filmklipper uden nogen særlige evner udi tegning.
Han har i stedet mestret kunsten at taste de rigtige søgeord ind i billedgeneratorerne Dall-E 2 og Midjourney. Tjenester, der – simpelt forklaret – forvandler ord til billeder ved brug af kunstig intelligens.
- Jeg har altid haft visioner for billeder, jeg gerne har villet skabe. Men jeg har haft fokus på andre ting end at lære at tegne. Med denne teknologi kan man få sine ideer og visioner ud på skærmen, uden du behøver at have evnerne til at tegne det hele selv. Du kan afprøve de skøreste og mest vanvittige ideer på to sekunder. Ideer, som ellers kunne tage mange timer at få ud i verden, siger Nils Aaholm, der til daglig passer jobbet som klipper, men i fritiden laver AI-genereret kunst på Instagram-profilen @CPHmonster.
Før han lærte at tøjle værktøjerne rigtigt, lignede mange af hans billeder lidt af et makværk. Mange AI-genererede billeder har et skær af noget sært, syntetisk, tåget og forvrænget. Noget, der skurrer og afslører, at værktøjerne intet kender til verden, kun til alverdens billeder skrabet fra internettet.
Men teknologien stormer frem og udvikler sig konstant i retning af at blive nemmere, mere tilgængelig og bedre til at skabe virkelighedstro billeder.
Men er AI-genererede billeder blot et kreativt værktøj, der vil medføre en demokratisering af kreativitet? Eller er det et farligt våben i hænderne på os alle sammen?
Ligner det mere eller mindre en kat?
AI-teknologier som Dall-E 2 og Midjouney skaber indhold gennem en proces, der kaldes diffusion. Det går i bund og grund ud på, at de på baggrund af enorme mængder data kan skabe nyt indhold, der ligner den bagvedliggende data uden nogensinde at blive identisk.
For at skabe nye billeder bearbejder Dall-E 2 og Midjouney enorme mængder data bestående af billeder med tilhørende tekst. Ser den eksempelvis tilstrækkeligt mange billeder af en kat sammen med ordet "kat", vil den kunne begynde at danne en forståelse af, hvilke mønstre der ligner en kat.
Det forklarer professor på IT-Universitetet Sebastian Risi. Han forsker blandt andet i kunstig intelligens.
- De her modeller tager udgangspunkt i ren larm og begynder derefter at sige “hvis jeg ændrer denne pixel, ligner det så mere eller mindre en kat?”. Og det vil derefter begynde at ligne noget, vi kan genkende som en kat, fordi den har set millioner af katte og kan genskabe mønstret af en kat, forklarer Sebastian Risi.
Og på den måde kan AI-tjenesterne generere billeder, der ligner fotos, malerier eller noget helt tredje. Faktisk har en AI-billedgenerator vundet en kunstkonkurrence, lavet internationale magasinforsider og er taget i brug til at generere stockfotos.
- De her modeller er allerede ret utrolige, og de bliver hele tiden bedre, jo mere de “træner”. De har dog den svaghed, at de ikke har det, man kan kalde almindelig sund fornuft, og ikke kan ræsonnere. Hvis en maskine for eksempel genererer et billede af en kop med et hul i bunden, vil den ikke forstå, at det ikke giver mening for en kop. Men det skal nok også blive bedre, forklarer Sebastian Risi.
Herunder: Kunstneren Lorenzo Sovrappensiero har skabt et træ med sort pels ved hjælp af tjenesten Dall-E.
Værktøjerne er altså kraftfulde, og de bliver kun bedre og klogere. Men kan de også blive for kraftfulde?
Værktøjerne kan give reelle traumer
Der har fra starten været store etiske spørgsmål og dilemmaer knyttet til AI-billedgenerering.
Et altoverskyggende dilemma er spørgsmålet om copyright. Hvem ejer et billede skabt af AI – et billede, som vel at mærke er skabt på baggrund af data fra andet materiale med copyright?
Derudover er der etikken omkring, når værktøjerne bruges til at generere billeder af voldelig eller seksuel karakter. Ligeledes kan de være et magtfuldt redskab til at skabe fake news – særligt fordi værktøjerne bliver bedre og bedre til at skabe fotorealistiske resultater.
Grundlæggeren af Montreal AI Ethics Institute, Abhishek Gupta, har sagt til mediet Techcrunch, at han mener, der bør skabes "skadesreducerende tiltag" for AI-generering. Han frygter, at AI-billeder kan forvolde “reel skade på dem, de bruges imod".
Både Dall-E og Midjourney har en række filtre på, hvad man kan generere, og tillader for eksempel ikke vold og seksuelt indhold. Det gælder dog ikke alle platforme.
Redskabet er allerede i brug til at skabe pornografisk indhold, og flere har advaret om, at tjenesterne kan forværre det allerede alvorlige problem med deepfake-porno – altså syntetisk pornografisk materiale af en virkelig person skabt uden samtykke.
Sådan er menneskeheden
Som mennesker har vi med vores kreativitet altid skabt billeder med vores fantasi uden begrænsninger. Men bør der gælde andre regler, når man ved computeres hjælp kan kan generere alverdens indhold i stor skala?
Herunder: Et får med en mund for meget skabt via Stable Diffusion.
Ikke hvis man spørger Emad Mostaque, der er CEO i Stability AI, der står bag platformen Stable Diffusion – et værktøj, der har langt færre begrænsninger end konkurrenterne på, hvilket indhold brugere kan generere.
Han har anerkendt, at Stable Diffusion kan bruges til at skabe “virkeligt ækle ting”, men mener ikke, at det er teknologien, der er problemet.
- En procentdel af mennesker er ganske enkelt ubehagelige og underlige, men sådan er menneskeheden. Vi har troen på, at den her teknologi bliver fremherskende, har Emad Mostaque sagt til Techcrunch.
Hvem bestemmer?
Professor Sebastian Risi fra IT-Universitetet forudser, at der vil rejse sig en række store juridiske spørgsmål i takt med udbredelsen af teknologien, særligt omkring rettigheder til brug af personers lighed og kunstneres unikke udtryk.
Men teknologien rejser også nogle mere grundlæggende dilemmaer.
- Der findes ikke et klart svar på, hvordan man bedst skal kontrollere og regulere disse værktøjer. For det første: Hvem skal bestemme? Der findes jo ikke kameraer, der siger, du ikke må tage et billede af en voldelig scene, og folk kan tegne og male hvad som helst. Og ønsker vi, at denne teknologi kun skal være i hænderne på magtfulde aktører, eller er det bedre, at vi alle har adgang?
Men mere nærværende er dog spørgsmålet om, hvorvidt vi snart alle sammen kan blive snydt af kunstige billeder. Som det er i dag, vurderer Sebastian Risi, at selv et utrænet øje godt kan se, om et billede er syntetisk, ved nærstudering. En ekspert vil lynhurtigt kunne afgøre det samme.
Men snart vil det ikke længere være tilfældet. Og det vil kræve nye foranstaltninger for medier såvel som for alle brugere af internettet, lyder vurderingen fra Sebastian Risi.
- Vi rykker os hurtigt i den retning, at når du ser et billede online, vil du umuligt kunne vide, om det er ægte eller ej. Der kommer til at komme en modbølge af teknologi udviklet til at påvise, om et billede er ægte eller ej, og om det er manipuleret eller ej, siger Sebastian Risi.
I fremtiden vil lignende teknologi kunne overføres til levende billeder og lyd, og dermed vil vi også kunne skabe videoer, musik og andre lyde på samme vis. Modellerne kan nemlig anvendes på alt, hvor der findes et tilstrækkeligt stort datasæt at "træne" maskinerne på.