hero
Gábor BálintPapp Olivér

Rovat:

ÉJÁJ
Becsült olvasási idő: 8 perc
Amikor Bradley Cooper saját hangján, magyarul beszél majd

Elég csak egy hatalmas adatbázisnyi hang, és nem kellenek többé színészek a szinkronhoz? Feltámasztható egy színész hangja egy film kedvéért? Milyen jogi és erkölcsi dilemmák vannak a hangok AI-általi felhasználásakor? Ennek jártunk utána.

Ez a cikk eredetileg a Kreatív szeptemberi, nyomtatott számában jelent meg.

A generative AI lassan egy éve a köztudatban van, már szöveget és képet is létrehozhatunk a segítségével, ami feszegeti a jogi, etikai és szakmai határokat. Legutóbb Gesztesi Károly hangját élesztették volna fel a Shrek folytatásához, ami volt feleségét felháborította, ugyanakkor a szinkronszínészszakma megosztott a kérdésben.

Az biztos, hogy a mesterséges intelligencián alapuló szoftverek csak akkor tudnak igazán jól működni, ha kellő minőségű és mennyiségű adatbázisból tanulhatnak. Fontos, hogy a tudása befolyásolható, akár valótlan anyagokat is létrehozhat, amihez nem kell más, csak néhány hamis információt tartalmazó cikk az interneten.

A képalkotó Midjourney és a hozzá hasonló képi programok már mások, hiszen hatalmas, többezres, akár tízezres adatbázis kell ahhoz, hogy ha nem is kiválóan, de elfogadhatóan működjenek, ilyen adatbázisok pedig általában csak fizetősen érhetőek el, hiszen jogvédett képekből állnak, mint például a Getty Images vagy az Adobe Stock.

Az AI kordában tartása

A hatalmas adatbázisok használatához, majd egy új termék előállításához rengeteg jogi előírásnak kell megfelelni, hogy ne merülhessen fel például plágium vagy más jogsértés vádja. A most születő új uniós AI-szabályozás alapján az AI-szolgáltatások fejlesztőinek többek között meg kell majd jelölniük, hogy milyen szerzői jogilag védett forrásokat (pl. adatbázisokat, online elérhető tartalmakat) használtak az algoritmusaik, alkalmazásaik tanításához. Ennek egyik célja, hogy a szerzők gyakorolhassák ezzel kapcsolatos tiltakozási jogukat. Nem véletlenül indult per már több ügyben is, erről is beszélt a Kreatívnak Bartal Iván, az Oppenheim Ügyvédi Iroda partnere, Data, Technology, Cyber & AI praxisának vezetője.

„Több ügyfelünk, például reklámügynökségek, szoftverfejlesztők, internetes szolgáltató, hírközlési cégek és befektetési alapok érdeklőnek sokszor, hogy milyen jogi feltételei vannak a generative AI felhasználásának, de tudni kell: más szabályok vonatkoznak arra, aki felhasznál ilyet, fejleszt, vagy netán befektetne ilyen megoldásokat fejlesztő cégbe – mondta Bartal. A most születőben lévő új EU-s szabályozás az egyes AI-megoldásokat kockázati szintek szerint sorolja majd be, aszerint, hogy milyen hatással lehetnek az emberek életére. Minél magasabb kockázatú lesz egy rendszer, annál szigorúbb szabályok vonatkoznak majd rá. Így például egy ügyfélszolgálatos AI alacsony kockázatú lesz, míg a kritikus infrastruktúrák (pl. közlekedési eszközök, közlekedésirányítás), amelyek veszélyeztethetik az emberek életét és egészségét, magas besorolást kapnak. Az embereket a cselekményeik alapján értékelő rendszerek pedig elfogadhatatlannak minősülnek majd. Az új EU-s rendelet szabályozni fogja a generatív AI-megoldásokat is, és rájuk nézve elsősorban a transzparens működéssel és az illegális tartalmak előállításával kapcsolatos szabályok vonatkoznak majd.

Bartal Iván

„Ezeknek az új technológiáknak a szabályozása azért is fontos, mert a jog statikus, és mindig utólag követi az élet dinamikus történéseit és a technológiai újításokat. Az internet korai szakaszában sem voltak külön jogszabályok az internet egyes területeire, de később ezeket mind be kellett vezetni, így jutottunk el például az EU digitális szolgáltatásokról szóló, és többek között a nagy piaci szereplőket (pl. Meta, Google, Amazon stb.) megregulázó jogszabálycsomagjáig” – vázolta Bartal.

Az újító, diszruptív technológiák, mint amilyen az AI is, mindig komoly kihívások elé állítják a meglévő jogrendszert. Jelenleg az egyik központi kérdés az, hogy hogyan elégíthető ki az AI-fejlesztések „adatéhsége” úgy, hogy az ne sértse az algoritmusok betanításához felhasznált szerzői jogi tartalmak (pl. képek, fotók, festmények, könyvek stb.) szerzőinek jogait.

 Jelenleg itthon is van olyan jogszabályi kivétel (a szerzői jogi törvényben egy EU-s irányelv alapján bekerült szöveg- és adatbányászati kivétel), amely bizonyos feltételek teljesítése esetén szerzői engedély és díjfizetés nélkül lehetővé teszi a szerzői jogi tartalmak AI-fejlesztések során történő felhasználását, de ez nem terjed ki a generatív AI-megoldásokkal létrehozott tartalmakra.

A probléma egyik forrása, hogy a felhasznált művek tulajdonosai, legyen az írott, kép-, vagy hangalapú, általában nem kapnak tájékoztatást arról, hogy a művüket felhasználták egy AI-megoldás betanítására (bár az ellenőrzésre bizonyos esetekben alkalmas lehet a haveibeentrained.com), emiatt nehezen tudják érvényesíteni ezzel kapcsolatos jogaikat. „Sőt, egy esetleges perben nekik kellene bizonyítani, hogy az AI-szoftverhez felhasználták szellemi terméküket, de még ha ez sikerülne is, akkor is csak nagyjából az elmaradt jogdíjat tudnák kifizettetni. Az amerikai ügyekben megszokott büntető kártérítésnek már jóval nagyobb visszatartó ereje lehet – állította Bartal.

Az is probléma, hogy sokszor nem egyértelmű, hogy ki a felelős azért, ha egy jogilag nem tiszta prompt (input vagy utasítás) alapján csináltatunk valamit a mesterséges intelligenciával, hiszen bár a ChatGPT és a Midjourney hiába tiltja, a felhasználó az, aki leírja a kérését. Tehát, ha a Coca-Cola mintájára csináltatunk egy logót, akkor bár a Coca-Cola nem lesz szerző, megtilthatja a logó felhasználását. Az kérdés marad, hogy ilyenkor a jogsértő logót felhasználó személyen túl az alkalmazás gyártója vagy forgalmazója is felelősségre vonható-e. „Erre tekintettel az új EU-s szabályozás várhatóan kötelezni fogja a generatív AI-megoldások fejlesztőit arra, hogy tegyenek megfelelő tartalomszűrési és egyéb intézkedéseket az ilyen jogsértések megelőzésére”– emelte ki az ügyvéd.

Szinkronproblémák

A hangalapú felhasználás esetében egyszerre merülnek fel jogi aggályok, de a színészek és szinkronszínészek helyzete és hozzáállása is egy fontos tényező, ezekről is kérdeztük Rajkai Zoltánt, a Szinkron Alapszervezet elnökét.

„Tudok olyan megrendelésről, amiben az volt a kérés, hogy csak két élő színész hangját használják egy filmszinkron elkészítéséhez, a többi karakter számára ebből a két hangból, utómunkában az AI kreált volna szinkronhangokat. A megkeresett stúdió ezt a megoldást elvi okokból elutasította, de nem zárom ki, hogy egy másik elvállalja majd, mert üzletet lát benne hosszú távon” – vázolta a problémát Rajkai Zoltán.

A reklámszakmában még a szinkronnál is könnyebben elterjedhet az AI használata, mert a rövidebb, alkalmazott műfajokban nem létszükséglet olyan minőségű színészi játék, mint egy filmnél. Nem beszélve arról, hogy sokkal olcsóbb lehet AI segítségével megcsináltatni egy reklám-hangalámondást, mint egy valódi színésszel. A kérdés, hogy az adott cég számára fontos-e, hogy egy ismert hang narráljon, vagy megelégednek azzal, hogy csak hasonlít rá.

Ismertek már olyan esetek is, amikor színészek tudatosan mondtak le arcukról vagy hangjukról, így például Bruce Willis a képmását adta egy reklám erejéig, ami egy másik színész arcát helyettesítette digitálisan; James Earl Jones pedig a hangját adta el a Respeecher ukrán cégnek, hogy AI segítségével újra felhasználhassák a későbbiekben, ahogy azt tették már az Obi-Wan Kenobi-sorozatban Darth Vader szinkronizálásánál is.

„Ez biztos, hogy Magyarországon is bevett szokássá válik majd, azonban addig is vannak nagyobb jogi aggályok a színészek jelenlegi helyzetével kapcsolatban” – emelte ki Rajkai. „Az eddig használt, mondhatni ránk erőltetett szerződésekben olyan szakaszok szerepelnek például, minthogy ››az univerzumban eddig még fel nem talált technológiák alkalmazása esetén is lemondunk a mi hangunk jogairól‹‹, vagyis az elmúlt 10-20 évben hatalmas mennyiségű hangadatot gyűjtöttek be a színészek hangjaiból, amelyekből az AI könnyen tudna dolgozni, hiszen tökéletes, zajmentes, stúdióminőségű hangok állnak rendelkezésre, és még csak jogi akadálya sincs a felhasználásnak.”

Rajkai Zoltán

Ezeket a szerződéseket ráadásul nem is a hazai stúdiók írják, hanem a külföldi forgalmazók, megrendelők igényeit közvetítik, így sokkal nehezebb bármilyen változást elérni. „Emiatt talán épp a szinkronstúdióknak lenne feladatuk, hogy együttesen, összefogva olyan szakmai és etikai irányelveket dolgozzanak ki, amelyek védik a szinkronipar érdekeit, és a benne dolgozó művészek, alkotók, szakemberek munkáját, többek között az AI-jal szemben. Ez a felhasználás különösen aggályos lehet akkor, ha olyan tartalmakat állítanak elő a színész hangjával, amivel ő maga egyáltalán nem ért egyet” – mondta Rajkai.

Most még kisebb, de a jövőben egyre nagyobb félelem lesz a színészek számára, amikor majd például Bradley Cooper már nem Rajkai hangján szólal meg magyarul, hanem az eredeti, saját hangján, de szintén magyarul. 

És ha ez bekövetkezik, akkor már nem is lesz kérdés, hogy mit csinálnak a korábban, éveken át felvett hangokkal, hiszen a filmekhez már nem lesz rájuk szükség. Rajkai azt is elmondta, Gesztesi Károly Shrek-hangjának felélesztéséről eltérő vélemények vannak a szinkronszínészek között. Azt tudjuk, hogy volt felesége, Liptai Claudia kikelt az ötlet ellen, de valójában az örökösök, ebben az esetben a gyerekek dönthetnek. Rajkai szerint az ehhez hasonló ügyekben megosztott a szinkronszínészszakma, egyesek pártolják, mások ellenzik a mesterséges hangfeltámasztást.

Generált hangok mindenütt

A filmek mellett a videójátékok is meghatározó szereplői lehetnek az AI fejlődésének, az alapvetően videókártyáikról ismert Nvidia például már létrehozott egy olyan AI-t, ami tud reagálni a játékos által élőszóban feltett kérdésekre, és a saját tudása alapján – amit a fejlesztők tápláltak be neki – válaszolni is tud. Az AI által létrehozott hang nem csak a filmek és sorozatok terén terjedhet el, ott van például Siri, az Apple egyik mesterséges intelligenciája, vagy a Google Fordító, Alexa vagy a TikTok-videókban is hallható jellegzetes felolvasó hang.

Használhatja a technológiát az orvostudomány is. Tim Shaw korábbi NFL-játékos ALS (amiotrófiás laterálszklerózis) betegségben szenved, ami miatt napról napra egyre rosszabbul tud beszélni. A Google egyik kutatórészlege, a DeepMind kifejlesztett egy szoftvert, ami felismeri Shaw beszédét az állapotromlás ellenére, sőt, a korábbi felvételek alapján régi hangján meg is szólal. Egy ilyen szoftverhez egyébként hatalmas adatbázisra van szükség, akár többórányi zaj nélküli felvételre, amivel Shaw azért rendelkezett, mert korábban rengeteg interjút adott. 

Felismerjük-e a gép által írt dalokat?

A közönség többsége a mesterséges intelligencia segítségével írt dalokat az ember művének véli, de magabiztosan felismeri, ha igazi dalszerző egyáltalán nem vett részt az alkotásban – derült ki az Artisjus Dalszerzők napi kísérletéből. Míg a 100 százalékban MI által írt dalt többen beazonosították, a részben és teljesen „emberi” alkotásokat már alig tudták megkülönböztetni egymástól: csak minden harmadik tippelő jött rá, hogy melyik az emberi szerzemény, míg az MI-ember koprodukciót a legtöbben teljesen emberinek gondolták. 

Nem úgy, mint a kísérletbe bevont kilenc zenész, zenei újságíró és MI szakértő. Közülük Dés László, Harcsa Veronika, Járai Márk és Mérő László volt az, akinek sikerült tetten érni a mesterséges intelligencia nyomát a szerzeményekben – az erről készült videóban elárulták azt is, hogy milyen különbségek megfigyelésével jöttek rá a megfejtésre.