AI klame, manipuluje a skrývá své cíle – ničí důvěru Klasické testy pro kontrolu systémů umělé inteligence by v takovém případě mohly být neúčinné, protože umělá inteligence rozpozná, že je testována, a bude se podle toho chovat. Aby mohli toto riziko změřit, vyvinuli vědci speciální testy, které mají zaznamenávat takzvané „skryté akce“. Mezi ně patří například tajné porušování pravidel, úmyslné chyby v testech nebo strategické chování, jehož cílem je oklamat hodnotící systémy. Výsledky jsou pozoruhodné. V 26 sériích testů s více než 180 různými prostředími vědci zkoumali dva z nejvýkonnějších modelů. U modelu o3 byly takové skryté akce zjištěny v 13 procentech testů. U modelu o4-mini byla míra 8,7 procenta. PS. Při strategických scénářích konfliktů má takto prolhaná AI navíc ráda použití jaderných zbraní. Od koho se ta potvora naučila?
- ID Cislo
- 16525
- Nadpis
- AI klame, manipuluje a skrývá své cíle – ničí důvěru
- Url
- https://uncutnews.ch/schock-studie-ki-taeuscht-manipuliert-und-versteckt-ihre-ziele-vertrauen-zerstoert/
- Text
AI klame, manipuluje a skrývá své cíle – ničí důvěru
Klasické testy pro kontrolu systémů umělé inteligence by v takovém případě mohly být neúčinné, protože umělá inteligence rozpozná, že je testována, a bude se podle toho chovat. Aby mohli toto riziko změřit, vyvinuli vědci speciální testy, které mají zaznamenávat takzvané „skryté akce“. Mezi ně patří například tajné porušování pravidel, úmyslné chyby v testech nebo strategické chování, jehož cílem je oklamat hodnotící systémy. Výsledky jsou pozoruhodné. V 26 sériích testů s více než 180 různými prostředími vědci zkoumali dva z nejvýkonnějších modelů. U modelu o3 byly takové skryté akce zjištěny v 13 procentech testů. U modelu o4-mini byla míra 8,7 procenta.PS. Při strategických scénářích konfliktů má takto prolhaná AI navíc ráda použití jaderných zbraní. Od koho se ta potvora naučila?
- Kategorie