hero
Molnár Zoltán

Rovat:

NextÉJÁJ
Becsült olvasási idő: 7 perc
Nem hiszem, ha látom! Megmenthető a mozgóképek valósága?

A FakeCatcher projekt a deepfake, azaz a kamuvideók ellen jött létre és szervezetünk pulzálását veszi alapul a hitelesítéshez. De vajon meddig létezhet hiteles kép, videó, hang a mesterséges intelligencia korában? A hamisítók visszaszerzik a lépéselőnyüket? Ezekre a kérdésekre kerestük a választ a Dentsu és a Wavemaker munkatársaival.

E cikkünk a Kreatív szeptemberi lapszámában is megjelent ám, aminek ajánlóját itt böngészheted át!

Nyár elején ellátogattunk a Cannes Lions reklámfesztiválra, ahol számos parádés kampányba tekinthettünk be, több díjátadót is végigültünk. Nyilván az egész glóbusz egyéves reklámtermésének krémjét látjuk, de ezek között is voltak kiemelkedően jó projektek. Az egyik, ami megragadta a képzeletünket, a Dentsu és a chipgyártásáról is ismert Intel projekte volt:

a Certified Human.

Jöjjön is egy videó róla, aztán belemerülünk a részletekbe:

A 2023-as év a mesterséges intelligencia (AI) kirobbanó előretöréséről, exponenciális fejlődéséről és az AI/robotok uralta posztapokaliptikus világképek mantrázásáról szólt. A fejünkre növő digitális gólem valóban tartogathat veszélyeket, köztük azt, hogy a jövőben nem fogjuk tudni megkülönböztetni az AI által előállított álló- és mozgóképeket, hangzóanyagokat a valódiaktól (itt a Nvidia jó példája).

Jellemző, hogy a mostani hollywoodi író- (és színész-) sztrájkhoz is köze van a témához: az amerikai filmipar mögött állók egyfelől az AI által elvett megélhetésükért, másrészt a személyiségi és képmáshoz fűződő jogaikért aggódnak, no meg azért, hogy a nézőközönséget egyáltalán érdekelni fogja-e, hogy hús-vér színészek által eljátszott, élő forgatókönyvírók által megírt cselekményű filmet néz-e vagy sem.

A veszélyek ennél is sokrétűbbek: bárkiről ártó szándékú, perverz, hamis fotók terjedhetnek, politikusok szájába kerülhetnek valójában sosem elhangzott, felháborító beszédek, pánikkeltő hamis felvételek lephetik el a netet, de a branding, a reklám se lehet kivétel (képzeljünk el egy mosóporos videót, amiben a szer rászóródik egy kisgyerekre, akinek aztán a szemünk láttára ég csontig a keze). A kép és a hang manipulálására szinte korlátlan lehetőség nyílt, ezért is lehet fontos az Intel műve.

A FakeCatcher nevű alkalmazás egy orvosi trükkel valós időben teszi lehetővé a deepfake-videók felismerését. Ahogy a szívünk vért pumpál az arcunkba, folyamatosan változik annak színe, amit fotopletizmográffal (PPG) lehet megvizsgálni. Az Intel deep learning segítségével megtanította a FakeCatchernek, hogy ezeket a szabad szemmel nem is látható,  a kamuvideókról értelemszerűen hiányzó színváltozásokat érzékelje. Az alkalmazás az arcokba kerülő vér mellett a pislogás természetességét is figyeli.

Végeredményben a készítők szerint az Intel rendszere 96 százalék pontossággal ismerte fel a deepfake-et.

A FakeCatcherrel egy másik irányba tartó vonatra is fel lehet szállni: az app úgy tud nekünk új arcot rajzolni egy felvételen, hogy közben megmarad a mimikánk, de az egyre terjedő, a személyiségi jogokba belegázoló arcfelismerő szoftverek nem fognak minket felismerni.

A kamufogó

A FakeCatcher reklámkampányát a Dentsu Creative Chicago vitte a hátán, nem is eredménytelenül. A projektről Major Zoltánnal, aka. Pepével, a Dentsu Creative hazai Experience Directorával beszélgettünk.

Ők sokat kísérleteztek már új karakterek létrehozásával, így döbbentek rá, mennyi nem valós arccal találkozni a közösségi médiában. Megkérdeztük, miből tudni, hogy nem létező személy influenszerkedik nekünk a képernyőn? Major Zoltán szerint 

„a szem a kereksége olyan pont, amit ki lehet szúrni” (pontosabban az íriszé), ez elárulja a simlit, de ha a kéz látszik, az a legárulkodóbb: sokszor összefolynak az ujjak vagy több van belőlük, mint amennyit az evolúció alapból a kezünkre helyezett. 

„Az Intel projektje még eggyel tovább ment, mert olyan biomarkereket figyelt, ami a mi szemünk számára nem látható.” 

Kép: Mdv Edwards / Adobe Stock

Válaszában, hogy kikerülhető-e ez a védelem, a szakértő messziről indult. Szerinte a deepfake videók voltaképp két algoritmus egymásnak feszüléséből állnak elő. Az első legyártja a promptok (utasítások) alapján a tartalmat, a másik pedig visszajelez, hogy mennyire lett ez reális. A folyamatot újra meg újra lefuttatva lesz egyre valósághűbb a végeredmény. „Nem lehetetlen, hogy valaki létrehozzon egy olyan algoritmust, ami ezeket a biológiai változásokat is tudja figyelni majd, de egyelőre ez a feladat túl komplexnek tűnik” – mondta Major Zoltán még azzal kapcsolatban, megugorható-e az Intel által magasra tett léc.

Reményt szerinte az adhat, hogy az emberi szervezetben a szívverés egyforma ritmusban hat a test egészére. Ahhoz, hogy az AI a látható testfelület minden apró részletén összehangoltan utánozza ezeket a biomarkereket, borzasztóan nagy számítási kapacitás kell. Olyan biomarker-adatbázisra lenne ehhez szükség, ami jelenleg nem hozzáférhető (kórházaknak lehetne ilyen, de ők várhatóan nem tesznek jözzé ilyesmi adatokat a jövőben).

Mezriczky Marcellnek, a Wavemaker médiatervezőjének, deepfake-kutatójának sem kellett bemutatni az Intel-fejlesztést. „Az ötlet maga egyszerű, de nagyszerű”, amivel

 „nemcsak megállapítjuk valamiről, hogy hamis, hanem találtunk valamit, ami az emberségünk sajátossága, nemcsak filozófiai értelemben”.

Mezriczky mégis szkeptikus, szerinte nem az Intel az első tartós megoldást ígérő szereplő. „Tengernyi olyan tudományos publikációt olvasni, amely különböző detektáló rendszerek és megoldások sikerességét teszteli, mellette érvel”. Így „könnyebb erre kommunikációs kampányt építeni, mint valódi megoldással előállni”. Véleménye szerint az idő majd eldönti az Intel fejlesztéséről, elegendő lesz-e.

Hallott már más megközelítésű védelmi próbálkozásokról is, blokkláncokkal (blockchain) például videók eredeti verziójának visszakeresése lenne lehetséges: ha nem találja meg a rendszer a tartalom forrását, az nem számít megbízhatónak. Emellett a mammut techcégek is kísérleteznek védelmi rendszerekkel, a Facebook a Microsofttal közösen, a Google önállóan mesterséges intelligenciát bevetve, de Mezriczky szerint szóba került már a magas frekvenciájú összetevő-elemzés (high-frequency component analysis) használata is.

Mezriczky szerint emellett kérdéses, meddig lesznek hasznosak és tartósak a kamutartalmak elleni (vagy akár hitelesítő) védelmi mechanizmusok. Az Intel FakeCatcherje még nem bizonyított széles közönség előtt, szűk és limitált adatbázison tesztelték, várni kell rá, hogy meggyőződjünk a működőképességéről.

Ráadásul folytatódik a versenyfutás: „akik a realisztikus és autentikus deepfake videók gyártására törekszenek, elkezdenek dolgozni a fejlesztések kiküszöbölésén”. Mezriczky sem lenne meglepve, 

„hogyha pár hónap múlva megjelennének az első olyan deepfake videók, amelyek már tökéletesen imitálnák az arc változó véráramlását is”.

Jogi háttér

Lemaradva, de a jogalkotók is igyekeznek felvenni a kesztyűt a témában. Készül az Európai Unió csomagja, de az USA és Kína is dolgozik a cikkelyeken. Hogy többek közt „az anonimitásba burkolózó deepfake-gyártókkal” szemben ezeket ki fogja betartatni, az már kérdéses Mezriczky szerint.  

Kovács Aliz, a Mito jogásza egy nálunk is megjelent vendégcikkben igyekszik elmagyarázni, jogilag miért oly ingoványos talaj még az AI. Először is jogi szempontból nehéz megállapítani, hogy valamely okozott kárért az AI rendszer üzemeltetője a felelős, vagy épp a felhasználó, aki rosszra használta azt. Az adatvédelem, a magánélethez való jog, a diszkrimináció lehetősége és az AI betanításához használt anyagok szerzői jogai is fontos problémakörök. Kovács így fogalmaz:

„Egyre nehezebbé válik a manipuláció, megtévesztés elkerülése, hiszen az AI által generált szövegek, képek, videók, nem is beszélve a deepfake megoldásokról, komoly feladat elé állítja a fogyasztókat, hogy kiszúrják, mi a valós és mi nem. Másfelől talán felértékelődhetnek az emberek által vezetett hírforrások és művészi alkotások.”

Fekete-fehér, igen-nem

Major általánosságban elmondta, az igazi és a hamis közti macska-egér harc „olyan játék, mint a jogalkotás”, hogy akkor hoznak valamiről jogszabályt, amikor már megtörtént egy eset. Az AI vonalán maradva vannak olyan mesterségesintelligencia-fejlesztő cégek, amik erkölcsösen járnak el: az OpenAI például rendelkezik eszközzel, ami felismeri az általa fejlesztett ChatGPT által írt szövegeket.
 

No, de hogy a fészkes robotból fogjuk tudni a jövőben, mely kép vagy videó eredeti (mint a fenti pápás alkotás)? Major Zoltán elmondása szerint ügynökségi szinten sokat gondolkodnak azon, az AI-generálta képeket milyen módon lehet felhasználni egy kampányhoz. „Amikor eljutunk oda, hogy forrásmegjelölés és/vagy technológiamegjelölés történik, az alapvető, bizalmat építő lépés kell, hogy legyen” – summázta a helyzetet. Szerinte ugyanakkor tovább fog apadni a társadalom általános bizalmi szintje, előbb-utóbb mindenben kételkedni fogunk, ha ez nem így történik. Hozzátette:

„A kreatíviparnak különösen nagy felelőssége van abban, hogy erről közösen gondolkodjunk”.

Major Zoltán szerint az AI-eszközök roppant hasznosak, növelik a hatékonyságot, időt szabadítanak fel, de ha a felelősségi határokat elkezdjük átlépni, abból baj lesz.

Mezriczky szerint nem szabad csak a technológiára támaszkodni. „A médiatudatosság és a megfelelő részletességű oktatási programok legalább ilyen fontos szerepet töltenek be. Kell, hogy legyen a fogyasztók fejében általános tudás és forráskritikusság az interneten fellelhető tartalmakról.” (Az októberi ITBN-napon is az AI lesz a húzótéma.)

Mindeközben az emberek még csak most kezdik kiaknázni a mesterséges intelligenciában rejtőző potenciált, így Mezriczky szerint meglepő lenne, ha hamar megtalálnánk a tökéletes megoldást a deepfake felismerésére. „Én úgy gondolom, mindez beleivódik majd a hétköznapjainkba. Hozzászokunk, hogy duplán kérdőjelezzük meg azt, amit látunk” – tette hozzá.

Mezriczky Marcell nem is az eredetiség, hanem a realitás fogalma miatt aggódik.

Kérdéses, ki fogja eldönteni, mi számít eredetinek: „Mondhatjuk-e emberi tartalom előállítására, ami tegyük fel, több ihlet behatására történik, hogy eredetibb, mint annak a műnek a megalkotása, amit az algoritmus hoz létre ugyanazoknak az ihleteknek a tanulmányozása után?” A jövő elhozhatja a szubjektív valóságot, mindenki azt fog elhinni, amit akar. Ez nem is a jövő, hanem inkább a jelen: 

„több esetben is előfordult már, hogy nem a deepfake-et hívták valóságnak, hanem a valóságot deepfake-nek. Ez megfordíthatja az egész párbeszédet, amelyben már nem a manipulációról kell bizonyítanunk, hogy hamis, hanem a valóságról, hogy igaz.”

(Ajánlókép forrása: Kis Péter / Fortepan)