2024 áprilisának végén a marylandi Pikesville High School igazgatójáról, Eric Eiswert-ről hamis hangfelvétel kezdett keringeni: a klip rasszista és antiszemita kijelentéseket tulajdonított neki. A rendőrség szerint a felvételt az iskola volt atlétikai igazgatója, Dazhon Darien készítette, mesterséges intelligencia felhasználásával.
A hamis felvétel miatt Eiswertet kényszerszabadságra küldték, a házát rendőrök őrizték fenyegetések miatt, az iskolát pedig hívásokkal és üzenetekkel árasztották el, megzavarva a működést.
Külső szakértők elemzése AI-nyomokat mutatott ki, valamint azt, hogy a hanganyagot több felvételből vágták össze, és utólagos zajokkal tették valóságosabbá. A hatósági álláspont szerint ez hamis, meterséges intelligenciával manipulált a hangfelvétel.
2025. április 29-én Darien 4 hónap börtönt kapott az iskola működésének megzavarása miatt, Alford-vallomás keretében (a bizonyítékok elfogadása közvetlen beismerés nélkül). Eiswert időközben egy másik baltimore-i megyei iskola igazgatója lett.
A generatív MI (a mesterséges intelligencia egy részhalmaza) már hiperrealista képeket, videókat és hangklipeket tud létrehozni. Ezek olcsók és könnyen használhatók, és gyakran rövid hangmintából is klónozható valakinek a hangja.
A New Hampshire-i előválasztást megelőzően történt, hogy AI-val generált robothívások Joe Biden hangját utánozva próbálták lebeszélni a demokratákat a szavazásról. A felelős cég 1 millió dolláros bírságot vállalt, a politikai tanácsadó ellen külön büntetőügy indult.
Számos amerikai állam az elmúlt években célzott jogszabályokat fogadott el a választások befolyásolására szánt deepfake-tartalmak és a digitálisan létrehozott/módosított gyermek-szexuális visszaélési képek ellen.
New Jersey 2025 áprilisában büntető- és polgári jogi szankciókat vezetett be a megtévesztő deepfake-ek készítésére és terjesztésére. Maryland idei ülésszakán a törvényhozók AI-megszemélyesítést tiltó javaslatot fontolgattak; Scott Shellenberger, Baltimore megye államügyésze támogatta a módosítást, ám nem ment át.
Mit hozhat a jövő?
A generatív eszközök egyre meggyőzőbbek és hozzáférhetőbbek. A videó terén a Google DeepMind Veo 3 már natív hanggal (párbeszéd, zajok, zene) képes realisztikus mozgásokat és fényviszonyokat egyben generálni.
OpenAI-oldalon a Sora a releváns párhuzam: szövegből (és képből/videóból) készít hosszabb, nagyfelbontású klipeket, kifejezett fókuszsal a mozgó fizikai világ szimulációjára. Ez a technológiai irány nemcsak „hallható”, hanem teljes audiovizuális meggyőzőerővel támadhat — miközben a forenzika és a jogalkalmazás folyamatosan fut utána.
Zárógondolat:
Nem egyoldalúan a mesterséges intelligencia eszközeiben látjuk a probléma gyökerét, mert az AI eszközökkel való visszaéléssek mögött emberi motivációk állak. Fogalmazzunk úgy, hogy a késsel is lehet szeletelni és gyilkolni is. A teljes kontrol viszont csorbítaná az AI-ban rejlő hasznos potenciál kiaknázásának lehetőségeit. Mintha tompa késsel szeretnénk vágni. De a mesterséges intelligencia egyre jobban képes „valóságot gyártani” — és ezzel az identitás feletti kontroll is kérdésessé válhat. Szerintünk a kérdés nem az, megtörténik-e, hanem az, hogy készen állunk-e?
Források:
https://apnews.com/article/racist-ai-recording-maryland-high-school-487ea673b0449077cb23e7970546cb9f
https://openai.com/index/video-generation-models-as-world-simulators/
https://openai.com/index/video-generation-models-as-world-simulators/