Loading...
 
Skip to main content

AI klame, manipuluje a skrývá své cíle – ničí důvěru Klasické testy pro kontrolu systémů umělé inteligence by v takovém případě mohly být neúčinné, protože umělá inteligence rozpozná, že je testována, a bude se podle toho chovat. Aby mohli toto riziko změřit, vyvinuli vědci speciální testy, které mají zaznamenávat takzvané „skryté akce“. Mezi ně patří například tajné porušování pravidel, úmyslné chyby v testech nebo strategické chování, jehož cílem je oklamat hodnotící systémy. Výsledky jsou pozoruhodné. V 26 sériích testů s více než 180 různými prostředími vědci zkoumali dva z nejvýkonnějších modelů. U modelu o3 byly takové skryté akce zjištěny v 13 procentech testů. U modelu o4-mini byla míra 8,7 procenta. PS. Při strategických scénářích konfliktů má takto prolhaná AI navíc ráda použití jaderných zbraní. Od koho se ta potvora naučila?

ID Cislo
16525
Nadpis
AI klame, manipuluje a skrývá své cíle – ničí důvěru
Url
https://uncutnews.ch/schock-studie-ki-taeuscht-manipuliert-und-versteckt-ihre-ziele-vertrauen-zerstoert/
Text

AI klame, manipuluje a skrývá své cíle – ničí důvěru
Klasické testy pro kontrolu systémů umělé inteligence by v takovém případě mohly být neúčinné, protože umělá inteligence rozpozná, že je testována, a bude se podle toho chovat. Aby mohli toto riziko změřit, vyvinuli vědci speciální testy, které mají zaznamenávat takzvané „skryté akce“. Mezi ně patří například tajné porušování pravidel, úmyslné chyby v testech nebo strategické chování, jehož cílem je oklamat hodnotící systémy. Výsledky jsou pozoruhodné. V 26 sériích testů s více než 180 různými prostředími vědci zkoumali dva z nejvýkonnějších modelů. U modelu o3 byly takové skryté akce zjištěny v 13 procentech testů. U modelu o4-mini byla míra 8,7 procenta.

PS. Při strategických scénářích konfliktů má takto prolhaná AI navíc ráda použití jaderných zbraní. Od koho se ta potvora naučila?

Kategorie