1.2 C
Czech
Středa 3. prosince 2025
ITBoxChatGPT o1 se pokusil uniknout a chránit svou existenci

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Doporučujeme

V Hondurasu je pozastavené sčítání výsledků voleb, Trump pohrozil tamním úřadům

Americký prezident Donald Trump dnes obvinil úřady v Hondurasu, že se snaží ovlivnit výsledky nedělních prezidentských voleb. Tamní volební komise v pondělí pozastavila sčítání výsledků poté, co přestaly fungovat její webové stránky. Stalo se to v okamžiku, kdy byl mezi dvěma vedoucími kandidáty rozdíl pouhých 515 hlasů. Volební web v Hondurasu stále nefunguje, což komise zdůvodnila technickým selháním systému, informovala dnes místní média.

Jada Pinkett Smith čelí obvinění z výhružek i ničení kariéry. Dlouholetý přítel Willa Smitha žádá tři miliony

Bilaal Salaam, dlouholetý přítel Willa Smitha, obvinil Jadu Pinkett Smith z toho, že mu v minulosti vyhrožovala kvůli informacím o jejím soukromí. Tvrdí, že po konfrontaci, která se měla odehrát během narozeninové oslavy jejího manžela, se rozjela série hrozeb a nátlaků, které mu úplně převrátily jeho život naruby.

Počet obětí povodní v Indonésii přesáhl 700, evakuován byl milion lidí

Indonéskou Sumatru zasáhly nejhorší záplavy za poslední roky. Tisíce domů zmizely v bahně, milion lidí musel odejít z domovů a počty obětí dál rostou. Odloučené oblasti čekají na pomoc a vláda řeší, jak rychle obnovit přístupové cesty.

Bývalou šéfku evropské diplomacie Federicu Mogherini zadržela belgická policie

Federica Mogherini, bývalá šéfka evropské diplomacie a někdejší ředitelka Evropské služby pro vnější činnost (EEAS), byla podle belgických médií zadržena během policejních razií souvisejících s vyšetřováním korupce.

Prada dokončila převzetí Versace za 1,4 miliardy dolarů

Prada Group uzavřela nákup značky Versace a zaplatila za ni 1,375 miliardy dolarů v hotovosti. Jeden z nejznámějších módních domů světa tak přechází pod stejné vedení jako Prada i Miu Miu. Skupina tím otevírá novou etapu italské luxusní módy.

Nová technologie výrazně urychluje získávání vody ze vzduchu

Inženýři z Massachusettského technologického institutu (MIT) představili nové zařízení, které dokáže výrazně urychlit získávání pitné vody z atmosféry. Technologie, založená na ultrazvuku, je podle odborníků pětačtyřicetkrát efektivnější než dosavadní metody využívající teplo ze slunce.

Logistické centrum NATO pro Ukrajinu v Polsku začaly chránit nizozemské Patrioty

Logistické centrum velitelství NATO pro bezpečnostní asistenci a výcvik Ukrajiny (NSATU) na letecké základně Jasionka u polského města Řešov (Rzeszów) začala od tohoto měsíce chránit nizozemská mise zahrnující dva systémy vzdušné obrany Patriot. Podle médií a nizozemského ministerstva obrany mají základnu na jihovýchodě Polska hlídat půl roku.

Na mši s papežem v Bejrútu přišlo na 150.000 lidí

Mši nedaleko bejrútského přístavu za účasti papeže Lva XIV. dnes navštívilo na 150.000 lidí. Uvedl to v prohlášení Vatikán, který cituje místní úřady, napsala agentura AFP. Při obřadu papež vyzval k tomu, aby se Libanon po tvrdých zkouškách, které zažil, stal domovem spravedlnosti a bratrství. Krátce před zahájením mše se papež pomodlil u památníku obětí výbuchu v bejrútském přístavu, při kterém v roce 2020 zahynulo přes 200 lidí. Dnes odpoledne se vrací do Vatikánu.

Ukrajinské drony v noci zaútočily v centrální části Ruska

Ukrajinské drony v noci zaútočily na zařízení na výrobu paliv a energií v centrální části evropského Ruska a vyvolaly požáry, oznámil na sociální síti gubernátor Orelské oblasti Andrej Klyčkov. Nálet se obešel bez obětí a zraněných, na odstranění škod se pracuje, dodal. Podle médií nejspíše hoří sklad pohonných hmot v druhém největším městě regionu. Ruské drony podnikly rozsáhlý nálet na Oděsu na jihu Ukrajiny, dva raněné si vyžádalo ruské bombardování Dněpropetrovské oblasti, informovaly místní úřady.

Ozonová díra nad Antarktidou je nejmenší od roku 2019

Ozonová vrstva nad jižní polární oblastí letos překvapila vědce. Po několika problematických letech se její úbytek zpomalil a sezona skončila nezvykle brzy. Výzkumné týmy sledují, zda jde o začátek trvalejšího trendu, nebo jen o výjimku.

Británie a USA se dohodly na nulových clech ve farmaceutickém průmyslu

Londýn se dohodnul s Washingtonem na nulových clech v britském vývozu léků na americký trh po dobu nejméně tří let, informovala televize ABC. Na oplátku bude platit za léky více a britské farmaceutické společnosti zvýší investice v USA. Obě strany dohodu označily za vítězství.

Turecko informovalo o novém útoku proti lodi v Černém moři

Turecké úřady informovaly o novém útoku proti nákladní lodi v Černém moři. Loď, plující pod ruskou vlajkou s nákladem slunečnicového oleje do Gruzie, ohlásila, že byla napadena 80 námořních mil (asi 150 kilometrů) od tureckého pobřeží, nepožádala však o pomoc a její posádka čítající 13 námořníků je v pořádku. Uvedla to dnes agentura AFP. Server Marine Traffic i turecké úřady označují loď Midvolga 2 za tanker.

Skandál v Jižní Africe: Moderátorka a dcera exprezidenta verbovaly muže do ruské armády

V pondělí stanula před soudem Nonkululeko Mantula (39 let), moderátorka jihoafrické televizní stanice SAfm. Policie ji zadržela spolu se čtyřmi muži a obvinila, že rekrutovala dobrovolníky pro ruskou armádu. Současně vyšetřuje dceru bývalého prezidenta Duduzile Zuma-Sambudlu, která měla dostat na frontu několik mužů podvodem.

Zelenskyj se při schůzce s Macronem spojil také s Witkoffem a evropskými lídry

Mír na Ukrajině musí být skutečně trvalý, uvedl ukrajinský prezident Volodymyr Zelenskyj po dnešním setkání se svým francouzským protějškem Emmanuelem Macronem. Během několikahodinového jednání se podle Elysejského paláce oba lídři spojili se zmocněncem amerického prezidenta Donalda Trumpa Stevem Witkoffem, který se má v úterý setkat s ruským prezidentem Vladimirem Putinem. Prezidenti hovořili také s dalšími evropskými státníky, zástupci Evropské unie i Severoatlantické aliance, uvedly agentury AFP a Reuters.
Reklama
Reklama
Reklama
Reklama