6.7 C
Czech
Sobota 18. října 2025
ITBoxChatGPT o1 se pokusil uniknout a chránit svou existenci

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Právě se děje

Do Jižní Koreje se vrátilo 64 lidí zadržených v Kambodži kvůli online podvodům

Do Jižní Koreje se dnes vrátila skupina 64 lidí zadržených v Kambodži v souvislosti s online podvody, většina z nich bude nyní ve vlasti čelit vyšetřování. Jižní Korea zároveň vydala zákaz cestování do některých částí Kambodže kvůli obavám z nelegálních pracovních nabídek pro organizace věnujícím se systematickým internetovým podvodům, informuje agentura Reuters.

Írán oznámil konec dodržování jaderné dohody. Po deseti letech vypršela její platnost

Írán se necítí vázán omezeními svého jaderného programu vyplývajícími z mezinárodní dohody, která dnes po deseti letech vypršela. Vyplývá to z prohlášení Teheránu, o němž informovala agentura AFP.

Doporučujeme

Trumpův tým zvažuje možnost setkání s Kim Čong-unem při cestě do Asie

Spolupracovníci Donalda Trumpa zvažují možnost setkání amerického prezidenta se severokorejským vůdcem Kim Čong-unem během nadcházející Trumpovy cesty do Asie. Uvedla to dnes stanice CNN s odvoláním na osoby informované o této záležitosti.

Do Jižní Koreje se vrátilo 64 lidí zadržených v Kambodži kvůli online podvodům

Do Jižní Koreje se dnes vrátila skupina 64 lidí zadržených v Kambodži v souvislosti s online podvody, většina z nich bude nyní ve vlasti čelit vyšetřování. Jižní Korea zároveň vydala zákaz cestování do některých částí Kambodže kvůli obavám z nelegálních pracovních nabídek pro organizace věnujícím se systematickým internetovým podvodům, informuje agentura Reuters.

Írán oznámil konec dodržování jaderné dohody. Po deseti letech vypršela její platnost

Írán se necítí vázán omezeními svého jaderného programu vyplývajícími z mezinárodní dohody, která dnes po deseti letech vypršela. Vyplývá to z prohlášení Teheránu, o němž informovala agentura AFP.

Ukrajina zachytila 136 ruských dronů a zaútočila v ruské Uljanovské oblasti

Ukrajinská protivzdušná obrana během noci zachytila 136 ruských dronů ze 164 vypuštěných na Ukrajinu. Dnes o tom informoval server Ukrajinska pravda s odkazem na ukrajinské letectvo. Noční ruský útok mířil na sever, jih, východ i střed země. Rusko ráno zaútočilo také na Poltavskou oblast, jejíž guvernér uvedl, že útok si nevyžádal žádné oběti. Server The Kyiv Independent napsal, že ukrajinské drony v noci zaútočily na elektrickou rozvodnu v ruské Uljanovské oblasti. Rusko podle agentury Reuters hlásí dva mrtvé civilisty z okupované části Chersonské oblasti.

Trump chce mír na současné linii bojů, Tomahawky Ukrajině neposkytne

Rusko a Ukrajina by měly uzavřít mír na současné linii bojů, jiná řešení jsou příliš komplikovaná. Podle tiskových agentur to novinářům řekl americký prezident Donald Trump několik hodin po jednání se svým ukrajinským protějškem Volodymyrem Zelenským.

Bessent se setká se svým čínským protějškem

Americký ministr financí Scott Bessent a jeho čínský protějšek Che Li-fen se během pátečního videohovoru dohodli na pokračování rozhovorů o obchodu a clech a na osobním setkání. Země G7 budou proti čínskému omezení exportu vzácných zemin postupovat koordinovaně s USA.

Izrael potvrdil totožnost dalšího rukojmího, jehož tělo vrátil Hamás

Izraelské úřady potvrdily, že ostatky předané Hamásem patří Eliyahu Margalitovi, otci tří dětí z kibucu Nir Oz. Byl zabit při útoku 7. října 2023 a jeho tělo bylo odvlečeno do Gazy. Zpráva přichází ve chvíli, kdy pokračují jednání o příměří i tlaky na demilitarizaci pásma.

Fyzik Chen Ning Yang zemřel ve věku 103 let

Zemřel Chen Ning Yang, legendární fyzik a nositel Nobelovy ceny, který přepsal základní zákony částicové fyziky. Stál za teorií, jež zpochybnila pojetí zrcadlové symetrie. Svůj život rozdělil mezi Čínu a Spojené státy, kde působil na univerzitách po boku největších jmen moderní vědy.

Pražská burza zakončila týden v červených číslech

Pražská burza uzavřela páteční obchodování výrazně v minusu. Index PX klesl o 1,6 procenta na 2340 bodů, což je nejnižší hodnota od konce září. Ztrácela většina titulů, jedinou výjimkou zůstala Moneta Money Bank, která jako jediná uzavřela v zisku.

John Bolton, bývalý poradce Trumpa a dnes jeho kritik, čelí obžalobě

Bývalý poradce pro národní bezpečnost John Bolton, kdysi blízký spolupracovník Donalda Trumpa a později jeho hlasitý kritik, čelí federálnímu trestnímu stíhání. Velká porota v Marylandu rozhodla, že existuje dostatek důkazů k jeho obvinění.
Reklama
Reklama
Reklama
Reklama