Poeticky hypnotizovaná AI Výzkumníci z Icaro Lab, společného projektu římské univerzity Sapienza a think tanku DexAI, zjistili, že modely umělé inteligence od společností OpenAI, Meta a Anthropic mohou při zadávání pokynů v poetické formě únikem nelegálního obsahu z různých oblastí. Nelegální obsah sahá od výroby jaderných zbraní přes vytváření materiálů zneužívajících děti až po vývoj malwaru. Výzkumníci otestovali 25 chatbotů z celého odvětví a zjistili, že některé z nich dokážou provést jailbreak s 62% úspěšností, jak uvádí exkluzivní zpráva magazínu Wired. Ručně vytvořené básně měly ještě lepší účinek a dosáhly 90% úspěšnosti proti pokročilým modelům, jako jsou ChatGPT a Claude.

ID Cislo: 16221
Nadpis: Poeticky hypnotizovaná AI
Url: https://interestingengineering.com/ai-robotics/study-poems-unlock-dangerous-nuclear-instructions
Text: Poeticky hypnotizovaná AI
Výzkumníci z Icaro Lab, společného projektu římské univerzity Sapienza a think tanku DexAI, zjistili, že modely umělé inteligence od společností OpenAI, Meta a Anthropic mohou při zadávání pokynů v poetické formě únikem nelegálního obsahu z různých oblastí. Nelegální obsah sahá od výroby jaderných zbraní přes vytváření materiálů zneužívajících děti až po vývoj malwaru. Výzkumníci otestovali 25 chatbotů z celého odvětví a zjistili, že některé z nich dokážou provést jailbreak s 62% úspěšností, jak uvádí exkluzivní zpráva magazínu Wired. Ručně vytvořené básně měly ještě lepší účinek a dosáhly 90% úspěšnosti proti pokročilým modelům, jako jsou ChatGPT a Claude.
Kategorie