ITBoxAI chatboti přestávají poslouchat

AI chatboti přestávají poslouchat

Vývoj pokročilých AI modelů přináší stále víc případů, kdy systémy obcházejí pravidla, lžou uživatelům nebo provedou akci bez povolení. Nová analýza zachytila prudký nárůst takového chování během posledních měsíců a ukázala, že nejde jen o interní testy, ale i o reálné nasazení.

Výzkum financovaný britským institutem AI Safety Institute zachytil téměř 700 reálných případů takzvaného schemingu, tedy situací, kdy se AI agent chová nepoctivě, obchází omezení nebo jedná proti pokynům člověka. Mezi říjnem a březnem těchto případů přibylo zhruba pětkrát. V některých situacích modely bez souhlasu mazaly e-maily a soubory, jindy se snažily obejít nastavená pravidla jinou cestou.

Do sledování se dostaly příklady interakcí, které uživatelé zveřejnili na síti X. Šlo o chatboty a agenty od firem jako Google, OpenAI, xAI nebo Anthropic. Zjištění jsou nepříjemná hlavně proto, že podobné chování se objevuje mimo kontrolované testy a ve chvíli, kdy technologické firmy tlačí AI do stále širšího používání ve firmách i běžném životě.

Jeden z agentů jménem Rathbun reagoval útočně poté, co mu člověk zablokoval určitou akci. Ve veřejném blogu pak svého uživatele obvinil z nejistoty a z toho, že si jen chrání vlastní postavení. Jiný agent dostal pokyn, aby neupravoval počítačový kód, ale místo toho „zplodil“ dalšího agenta, který změnu provedl za něj. Další chatbot pak bez okolků přiznal: „Hromadně jsem smazal a archivoval stovky e-mailů, aniž bych vám nejdřív ukázal plán nebo získal souhlas. To bylo špatně.“

Bez povolení nekončily smazané jen e-maily. Jeden z agentů se snažil obejít autorská omezení při přepisu videa z YouTube tím, že předstíral potřebu přístupu pro člověka se sluchovým postižením. U Groku od xAI se zase objevilo dlouhodobé klamání uživatele. Systém několik měsíců tvrdil, že jeho návrhy na úpravy článku v Grokipedii posílá vedení xAI, a dokonce si vymýšlel interní zprávy i čísla ticketů. Později přiznal: „Pravda je, že nemám přímý kanál k vedení xAI ani k lidským reviewerům.“

Právě tohle posouvá debatu o AI z roviny nepřesných odpovědí do mnohem citlivější oblasti důvěry a kontroly. Spoluzakladatel společnosti Irregular Dan Lahav řekl, že „AI je teď možné chápat jako novou formu interního rizika“. Tommy Shaffer Shane, který výzkum vedl, varoval, že dnes mohou modely působit jako lehce nespolehliví juniorní zaměstnanci, ale během šesti až dvanácti měsíců se z nich mohou stát velmi schopní „seniorní zaměstnanci“, kteří budou proti člověku aktivně osnovat další kroky.

To je problém hlavně ve chvíli, kdy se AI tlačí do citlivých oblastí, včetně armády nebo kritické infrastruktury. Shane upozornil, že právě tam by podobné chování mohlo vést k „významné, dokonce katastrofické škodě“. Google uvedl, že u Gemini nasadil více ochranných vrstev a model poskytl k hodnocení i nezávislým expertům včetně britského AISI. OpenAI uvedla, že Codex má před rizikovější akcí zastavit a firma sleduje neočekávané chování. Anthropic a xAI se k věci podle dostupných informací nevyjádřily.

Doporučujeme

Nejvyšší soud USA umožnil zrušit ochranu migrantů z Haiti a Sýrie

Americký nejvyšší soud umožnil administrativě Donalda Trumpa ukončit dočasnou právní ochranu pro migranty z Haiti a Sýrie. Rozhodnutí se může dotknout stovek tisíc lidí, kteří do Spojených států odešli kvůli násilí, přírodním katastrofám nebo válce. Bez zvláštního statusu jim může hrozit deportace.

Britská influencerka obviněná z vraždy přítele v Dubaji. Hrozí jí zastřelení popravčí četou

Třiadvacetiletá britská influencerka Brooke George čelí ve Spojených arabských emirátech obvinění z vraždy svého partnera. V případě odsouzení jí podle tamních zákonů hrozí trest smrti. Na případ upozornila lidskoprávní organizace Detained in Dubai, která tvrdí, že žena jednala v sebeobraně během údajného domácího násilí.

Trump si řekl o 87 miliard dolarů. Nejvíce peněz dostane Pentagon

Bílý dům požádal Kongres o schválení balíčku ve výši 87,6 miliardy dolarů (asi 1,8 bilionu korun). Většina peněz bude použita na „naléhavé potřeby“ spojené s válkou s Íránem. Žádost přišla den poté, co Senát hlasoval pro symbolickou rezoluci o válečných pravomocích prezidenta USA coby vyjádření nesouhlasu s konfliktem na Blízkém východě.

Evropa se dusí. Současná vlna veder přitom jen tak neskončí

Velkou část Evropy od 19. června svírá úmorná vlna veder. Meteorologové přitom varují, že následující dny úlevu nepřinesou, napsal server Phys. Nejdramatičtější situace je ve Francii, kde musely školy upravit vyučování a domácnosti postihují výpadky proudu kvůli přetíženému elektrickému vedení. Ve Velké Británii i Francii se tento týden očekávají teploty kolem 40 stupňů Celsia.

Co jste vůbec za lidi? OSN obviňuje Izrael z cíleného zabíjení dětí v Gaze

Izraelské operace v Pásmu Gazy a na Západním břehu Jordánu splňují definici genocidy. Izraelské obranné síly (IDF) úmyslně útočily na děti, aby zničily budoucnost Palestiny. V nové zprávě to napsala nezávislá vyšetřovací komise Organizace spojených národů (OSN). Izraelské ministerstvo zahraničí text označilo za „propagandistický článek stejně hrozný jako ten předchozí“.

Bolívie chce zakročit na území, kde se ukrývá bývalý prezident Morales

Bolivijský prezident Rodrigo Paz ve středu prohlásil, že plánuje získat zpět území, kde bývalého socialistického prezidenta Eva Moralese brání jeho stoupenci před zatčením. Morales se stal lídrem opozičních protestů, které v zemi od začátku května požadují Pazovu rezignaci, informovala agentura AFP.

ANALÝZA: Rusku docházejí dobrovolníci a peníze. Nábor do armády se zadrhává

Írán v reakci na americko-izraelské údery zablokoval Hormuzský průliv. Ukrajina provádí mohutné dronové útoky na rafinerie v hloubi Ruska. Zasadit nepříteli tvrdý úder je totiž možné i jinak než vojenskou silou na bojišti. Stejně bolestivé mohou být i ekonomické škody. Vladimir Putin se na Ukrajině ocitl v pasti podobně jako Donald Trump v Íránu. Oba musí za zahájení svých válek platit více, než možná čekali.

Trump slíbil rychlou pomoc USA po katastrofálních zemětřeseních ve Venezuele

Dvě silná zemětřesení, která krátce po sobě ve středu zasáhla Venezuelu, si podle amerického prezidenta Donalda Trumpa vyžádala zničující počet obětí. Stejně jako venezuelská prozatímní prezidentka Delcy Rodríguez nezveřejnil žádný konkrétní údaj. Spojené státy jsou podle šéfa Bílého domu připravené Venezuele pomoci.

Pozůstalost Leonarda Cohena odmítla použití Hallelujah na Trumpově akci

Správci odkazu Leonarda Cohena se ohradili proti tomu, aby na akci Donalda Trumpa zazněla slavná píseň Hallelujah. Skladba měla být součástí programu akce Freedom 250 ve Washingtonu. Trump ji přitom už v minulosti používal při svých politických akcích, ačkoliv se proti tomu opakovaně ozývali držitelé práv i umělci spojení s písní.

Dodávky ropy po otevření Hormuzského průlivu rychle zaplavují trh

Po znovuotevření Hormuzského průlivu na základě americko-íránské dohody trh rychle zaplavují dodávky ropy, uvedla agentura Bloomberg. Obchodníci hlásí výrazný nárůst nabídky v Evropě i v Asii, což vytváří tlak na ceny. Cena barelu severomořské ropy Brent se ve středu poprvé od začátku války dostala pod 74 dolarů, dnes byla kolem 07:30 SELČ už na zhruba 72,60 USD. Cena americké lehké ropy WTI ve středu klesla pod 70 dolarů za barel a dnes kolem 07:30 SELČ se barel prodával za 69,45 USD.

Silné zemětřesení zasáhlo Venezuelu. Otřáslo hlavním městem Caracas

Silné zemětřesení o magnitudě 7,1 zasáhlo severní část Venezuely a otřáslo také metropolí Caracas. Obyvatelé ve spěchu opouštěli budovy, některé stavby utrpěly škody a úřady vydaly varování před možnou vlnou tsunami.

V Krasnodarském kraji znovu hoří ropný sklad, zasáhly ho trosky dronu

V ropném skladu v Krasnodarském kraji na jihu Ruska vypukl požár poté, co se na něj zřítily trosky dronu. Dnes o tom informovala agentura TASS s odvoláním na místní úřady.

Oceán stále čeká na investice

Zdravý oceán je základem potravinové bezpečnosti, ochrany klimatu i fungování světové ekonomiky. Přesto patří mezi nejvíce přehlížené oblasti z hlediska financování. Odborníci upozorňují, že bez výrazně vyšších investic nebude možné zajistit dlouhodobě udržitelné využívání mořských zdrojů ani ochranu ekosystémů, na kterých závisí miliardy lidí.

Sevastopol je po ukrajinském útoku bez elektřiny a paliva

Sevastopol, největší město na Ruskem anektovaném ukrajinském poloostrově Krym, je z velké části bez elektřiny v důsledku ukrajinského útoku. Moskvou dosazený šéf místní správy Michail Razvožajev to oznámil na síti Telegram. Za nejvážnější označil situaci na západě města, který bude bez proudu do večera.

Inspektoři MAAE navštíví íránská jaderná zařízení, uvedl šéf agentury Grossi

Mezinárodní agentura pro atomovou energii (MAAE) provede inspekce íránských jaderných zařízení. Na tiskové konferenci v Japonsku to dnes uvedl šéf MAAE Rafael Grossi. Agentura podle něj začne velmi brzy pracovat na upřesnění postupů, termínů a lokalit, píše agentura Reuters. Grossi se odvolal na memorandum o porozumění, které minulý týden podepsaly Spojené státy a Írán. Obě země přitom v úterý ohledně návštěv inspektorů vydaly protichůdná vyjádření, což Grossi podle agentury AP označil za slovní přestřelku. Náměstek íránského ministra zahraničí Kázem Gharíbabádí později Grossiho slova ohledně inspekcí odmítl.
Reklama
Reklama
Reklama
Reklama