„Myślę, iż mnie sprawdzasz”. Nowy model AI zaskoczył wszystkich

4 godzin temu
Zdjęcie: Młody mężczyzna w profilu, siedzący przy biurku, skupiony wskazuje palcem na jasny, niemal pusty ekran komputera.


Anthropic, amerykańska firma zajmująca się rozwojem sztucznej inteligencji, opublikowała analizę bezpieczeństwa swojego najnowszego modelu językowego Claude Sonnet 4.5. Podczas badań system rozpoznał, iż jest poddawany próbie i poprosił naukowców o szczerość. To nie pierwsza sytuacja, gdy AI stara się...
Idź do oryginalnego materiału