ITBoxChatGPT o1 se pokusil uniknout a chránit svou existenci

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Doporučujeme

Putin řekl, že zatím nevidí smysl ve schůzce se Zelenským

Ruský prezident Vladimir Putin dnes prohlásil, že zatím nevidí smysl ve schůzce se svým ukrajinským protějškem Volodymyrem Zelenským. Vyjádřil se tak během Petrohradského mezinárodního ekonomického fóra v reakci na otevřený dopis ukrajinské hlavy státu. Zelenskyj o den dříve otevřeným listem vyzval Putina, aby se sešli a dohodli se na ukončení války, kterou rozpoutala Moskva před více než čtyřmi roky.

Řecko chystá daň ze zisků z kryptoměn

Řecko připravuje zákon, který má poprvé jasněji zdanit výnosy z kryptoměn. Kapitálové zisky z obchodování by podle návrhu měly podléhat patnáctiprocentní dani. Vláda tím chce dostat kryptoměny přímo do daňového řádu.

Menšík v semifinále Roland Garros nestačil na Zvereva

Jakub Menšík si finále Roland Garros nezahraje. Český tenista v semifinále nestačil na Alexandera Zvereva, kterému podlehl 5:7, 2:6, 6:3 a 3:6. Nadějné momenty v zápase měl, jenže často je sám utnul chybami v nejhorší chvíli.

NASA ukončila bezpečnostní opatření na ISS

Posádka Mezinárodní vesmírné stanice se po krátkém preventivním přesunu do kosmické lodi Crew Dragon vrátila k plánovaným činnostem. NASA bezpečnostní opatření zrušila poté, co Roskosmos pozastavil rozsáhlejší opravy v ruské části stanice a začal vyhodnocovat nová měření. Evakuace se nakonec nekonala.

Rusko a Ukrajina si vyměnily po 185 válečných zajatcích, oznámila Moskva

Rusko a Ukrajina si vyměnily po 185 válečných zajatcích, oznámilo dnes podle agentury RIA Novosti ruské ministerstvo obrany. Výměnu potvrdil ukrajinský prezident Volodymyr Zelenskyj.

Čínský prezident Si navštíví Severní Koreu s cílem prohloubit vzájemné vztahy

Čínský prezident Si Ťin-pching příští týden navštíví Severní Koreu. Do Pchjongjangu přijede poprvé od roku 2019. Cesta přichází v době, kdy se Kim Čong-un stále více sbližuje s Ruskem a současně znovu zdůrazňuje ambice svého jaderného programu.

Jon Snow a Tyrion se po letech znovu setkali

Kit Harington a Peter Dinklage se poprvé po sedmi letech znovu setkali u společného rozhovoru. Hvězdy Hry o trůny spolu mluvily o slávě, stárnutí, životě po seriálu i o tom, jak těžké bylo opustit svět Západozemí, který jim změnil kariéru.

Lídři zemí EU jednají s balkánskými kolegy o rozšíření unie i postupné integraci

Prezidenti a premiéři zemí Evropské unie a západního Balkánu se dnes sešli v černohorském přímořském letovisku Tivat k debatě o tom, jak urychlit přijímání nových členů v době snahy Ruska a Číny o rozšiřování vlivu v regionu. Část šéfů unijních zemí včetně zástupců Francie a Německa chce šestici balkánských kolegů představit plán na postupné propojování s unií ještě před samotným členstvím v bloku.

Senát USA schválil navýšení rozpočtu imigračních úřadů o 70 miliard dolarů

Senát Spojených států dnes schválil návrh zákona, jenž poskytne ministerstvu vnitřní bezpečnosti (DHS) dodatečných 70 miliard dolarů (1,45 bilionu Kč) na prosazování imigrační politiky, informuje agentura Reuters. Návrh nyní čeká na konečné schválení ve Sněmovně reprezentantů.

V rumunské Konstanci explodoval námořní dron používaný ve válce na Ukrajině

V rumunském přístavu Konstanca explodoval námořní dron, informovala místní média. Podle rumunského ministerstva obrany se jednalo o typ stroje, který se používá ve válce na Ukrajině a není součástí vybavení rumunské armády. Incident se obešel bez obětí, uvedly úřady. Rumunsko vyslalo nad moře dvě helikoptéry, které pátrají po dalších strojích. Podle informací serveru Digi24 objevily úřady u přístavu další čtyři námořní drony.

Po ruských útocích ukrajinské úřady informují o mrtvých a zraněných

Nejméně šest lidí přišlo o život a několik utrpělo zranění při ruských útocích na Ukrajinu, uvedly dnes místní úřady. Rusko v noci zaútočilo dvěma raketami a 216 drony, informovalo ukrajinské letectvo.

Zelenskyj píše Putinovi: Pojďme se setkat a ukončit válku

Ukrajinský prezident Volodymyr Zelenskyj vyzval ruského prezidenta Vladimira Putina k osobnímu setkání a ukončení války na Ukrajině. V otevřeném dopise adresovaném šéfovi Kremlu zdůraznil, že míru lze dosáhnout pouze prostřednictvím přímého dialogu mezi oběma zeměmi.

Provozovatelé baru v Crans-Montaně se dostavili ke společnému výslechu

Francouzští manželé, kteří ve švýcarském zimním středisku Crans-Montana provozovali bar Le Constellation postižený silvestrovským tragickým požárem, se dnes dostavili k prvnímu společnému výslechu. Státní zastupitelství v Sionu hovoří o konfrontačním výslechu, píše agentura DPA, která také připomíná, že dvojice dosud nebyla formálně obžalována.

Podzemní jeskyně ukrývají klíč k záchraně Grand Canyonu

Podzemní jeskynní systémy v Grand Canyonu ukrývají klíč k přežití celého tamního ekosystému. Vědecký tým z Northern Arizona University se vydal do hlubin, aby zmapoval skryté vodní cesty, kterými proudí roztátý sníh do hlavních pramenů národního parku. Tento výzkum má pomoci ochránit zásoby pitné vody před suchem a znečištěním.

Trump přišel s řešením rostoucích cen energií. Ekologům se to líbit nebude

Americký prezident Donald Trump oznámil investice ve výši téměř miliardy dolarů do oživení amerického uhelného průmyslu. Šéf Bílého domu se tak snaží snížit rostoucí spotřebitelské náklady za energie. Uhelné elektrárny představují nejvýznamnější zdroj emisí skleníkových plynů. Kromě oxidu uhličitého produkují i toxické látky.
Reklama
Reklama
Reklama
Reklama