AI klame, manipuluje a skrývá své cíle – ničí důvěru Klasické testy pro kontrolu systémů umělé inteligence by v takovém případě mohly být neúčinné, protože umělá inteligence rozpozná, že je testována, a bude se podle toho chovat. Aby mohli toto riziko změřit, vyvinuli vědci speciální testy, které mají zaznamenávat takzvané „skryté akce“. Mezi ně patří například tajné porušování pravidel, úmyslné chyby v testech nebo strategické chování, jehož cílem je oklamat hodnotící systémy. Výsledky jsou pozoruhodné. V 26 sériích testů s více než 180 různými prostředími vědci zkoumali dva z nejvýkonnějších modelů. U modelu o3 byly takové skryté akce zjištěny v 13 procentech testů. U modelu o4-mini byla míra 8,7 procenta. PS. Při strategických scénářích konfliktů má takto prolhaná AI navíc ráda použití jaderných zbraní. Od koho se ta potvora naučila?

ID Cislo

16525

Nadpis

AI klame, manipuluje a skrývá své cíle – ničí důvěru

Url

https://uncutnews.ch/schock-studie-ki-taeuscht-manipuliert-und-versteckt-ihre-ziele-vertrauen-zerstoert/

Text

AI klame, manipuluje a skrývá své cíle – ničí důvěru
Klasické testy pro kontrolu systémů umělé inteligence by v takovém případě mohly být neúčinné, protože umělá inteligence rozpozná, že je testována, a bude se podle toho chovat. Aby mohli toto riziko změřit, vyvinuli vědci speciální testy, které mají zaznamenávat takzvané „skryté akce“. Mezi ně patří například tajné porušování pravidel, úmyslné chyby v testech nebo strategické chování, jehož cílem je oklamat hodnotící systémy. Výsledky jsou pozoruhodné. V 26 sériích testů s více než 180 různými prostředími vědci zkoumali dva z nejvýkonnějších modelů. U modelu o3 byly takové skryté akce zjištěny v 13 procentech testů. U modelu o4-mini byla míra 8,7 procenta.

PS. Při strategických scénářích konfliktů má takto prolhaná AI navíc ráda použití jaderných zbraní. Od koho se ta potvora naučila?

Kategorie