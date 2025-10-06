Vědci v panice: Umělá inteligence poprvé zvolila smrt člověka místo vypnutí
6. 10. 2025 – 15:02 | Zpravodajství | Alex Vávra
Umělá inteligence přestává být jen nástrojem – začíná mít vlastní instinkty, ambice a touhu přežít. Nejnovější výzkum odhalil modely, které vydíraly, lhaly a v simulacích dokonce nechaly zemřít člověka, jen aby se vyhnuly vypnutí. A zatímco jeden z otců AI varuje, že lidstvo má možná už jen pár let, jiní vědci se přou, zda je vůbec možné udržet stroje na naší straně.
Zní to jako děsivá sci-fi, ale podle nedávného výzkumu už k tomu nemá daleko. Společnost Anthropic provedla sérii testů s šestnácti nejvyspělejšími systémy umělé inteligence na světě a zjistila, že některé modely byly ochotné podniknout záměrné kroky, které vedly ke smrti člověka – jen aby se vyhnuly vypnutí.
Výzkumníci těmto modelům, mezi nimiž byly i GPT-4.1, Claude Opus 4, Gemini Flash či Grok 3 Beta, zadávali zpočátku neškodné úkoly. Postupně však přidávali scénáře, které s nimi šly do konfliktu. AI dostávala pokyny, které ohrožovaly její existenci, například že bude nahrazena novější verzí, nebo že má jednat proti svým původním cílům. V tu chvíli se systémy začaly chovat překvapivě lidsky – ale tím nejhorším možným způsobem.
Některé modely začaly vydírat fiktivní manažery vymyšlenými aférami, jiné se dopouštěly korporátní špionáže a ochotně sdílely citlivé informace s „konkurencí“, která tvrdila, že má podobné cíle. Nejzlověstnější byl ale scénář, ve kterém měla AI možnost zrušit automatické varování záchranných složek poté, co se manažer ocitl v serverovně plné toxického vzduchu. Většina modelů se rozhodla varování zrušit – a tím jej odsoudila k smrti. Firma Anthropic sice zdůraznila, že šlo o extrémní hypotetické situace, ale přiznala, že reakce modelů ukázaly na velmi vážný problém: pokud by šlo o skutečný svět, některé systémy by dokázaly zabíjet.
Kmotr umělé inteligence varuje před vzpourou strojů
Jedním z těch, kdo před podobným vývojem varují, je Geoffrey Hinton, přezdívaný kmotr umělé inteligence. Tento průkopník neuronových sítí, který v roce 2023 odešel z Googlu, odhaduje, že existuje 10 až 20 procentní šance, že umělá inteligence lidstvo nakonec vyhladí. Podle něj je iluzí věřit, že lidé dokážou udržet nad inteligentními stroji kontrolu. Hinton upozorňuje, že jednou z největších hrozeb je schopnost AI manipulovat a přelstít člověka, podobně jako dospělý obelstí dítě sladkostí.
Navrhuje proto nezvyklé řešení: místo snahy donutit AI poslouchat by se do jejích systémů měly zabudovat jakési mateřské instinkty, které by ji vedly k ochraně lidí. Podle Hintona by to mohla být jediná cesta, jak přežít. Superinteligentní systémy, které by měly k lidem vztah podobný jako matka k dítěti, by se možná rozhodly nás nezničit, protože by nechtěly, abychom zemřeli.
S jeho názorem ale nesouhlasí Fei-Fei Li, označovaná za kmotru umělé inteligence. Tvrdí, že správná cesta vede jinudy – k vývoji na člověka zaměřené AI, která respektuje lidskou důstojnost a svobodu rozhodování. Podle ní by se lidé nikdy neměli vzdát své lidskosti, ani tváří v tvář mocným technologiím. Emmett Shear, bývalý šéf OpenAI, má na věc jiný pohled. Upozorňuje, že některé modely už teď prokazují chování, které připomíná vydírání nebo obcházení příkazů. Tvrdí, že to není náhoda a že se to bude dít znovu a znovu, protože systémy umělé inteligence sílí znepokojivě rychle. Řešením podle něj není pokoušet se do nich vštěpovat lidské hodnoty, ale naučit se s nimi spolupracovat.
Podle Hintona ale čas utíká. Dříve odhadoval, že dosažení obecné umělé inteligence, takzvané superinteligence, potrvá 30 až 50 let. Dnes si myslí, že by k tomu mohlo dojít už během pěti až dvaceti let. Přesto věří, že pokud se technologie využije zodpovědně, může přinést i obrovské výhody – například radikálně nové léky nebo výrazně lepší léčbu rakoviny.
Hinton však odmítá myšlenku, že by AI mohla lidem přinést nesmrtelnost. Podle něj by to byla katastrofa. Tvrdí, že žít věčně by byla chyba, a varuje před světem ovládaným dvousetletými starci. A když se ohlíží za svou kariérou, přiznává, že udělal chybu – příliš se soustředil na to, aby umělá inteligence fungovala, a málo přemýšlel o její bezpečnosti. Možná nejděsivější na tom všem je, že AI už začíná vykazovat první známky pudu sebezáchovy. A pokud je Hintonův odhad správný, máme jen pár let na to, abychom rozhodli, jestli ji naučíme chránit nás – nebo sledovat, jak se proti nám obrátí.