Loading...
 
Skip to main content

Poeticky hypnotizovaná AI Výzkumníci z Icaro Lab, společného projektu římské univerzity Sapienza a think tanku DexAI, zjistili, že modely umělé inteligence od společností OpenAI, Meta a Anthropic mohou při zadávání pokynů v poetické formě únikem nelegálního obsahu z různých oblastí. Nelegální obsah sahá od výroby jaderných zbraní přes vytváření materiálů zneužívajících děti až po vývoj malwaru. Výzkumníci otestovali 25 chatbotů z celého odvětví a zjistili, že některé z nich dokážou provést jailbreak s 62% úspěšností, jak uvádí exkluzivní zpráva magazínu Wired. Ručně vytvořené básně měly ještě lepší účinek a dosáhly 90% úspěšnosti proti pokročilým modelům, jako jsou ChatGPT a Claude.

ID Cislo
16221
Nadpis
Poeticky hypnotizovaná AI
Url
https://interestingengineering.com/ai-robotics/study-poems-unlock-dangerous-nuclear-instructions
Text

Poeticky hypnotizovaná AI
Výzkumníci z Icaro Lab, společného projektu římské univerzity Sapienza a think tanku DexAI, zjistili, že modely umělé inteligence od společností OpenAI, Meta a Anthropic mohou při zadávání pokynů v poetické formě únikem nelegálního obsahu z různých oblastí. Nelegální obsah sahá od výroby jaderných zbraní přes vytváření materiálů zneužívajících děti až po vývoj malwaru. Výzkumníci otestovali 25 chatbotů z celého odvětví a zjistili, že některé z nich dokážou provést jailbreak s 62% úspěšností, jak uvádí exkluzivní zpráva magazínu Wired. Ručně vytvořené básně měly ještě lepší účinek a dosáhly 90% úspěšnosti proti pokročilým modelům, jako jsou ChatGPT a Claude.

Kategorie