Współczesne modele językowe, takie jak te stosowane w popularnych chatbotach, uczą się na podstawie gigantycznych zbiorów danych. Ich jakość i wiarygodność ma istotne znaczenie dla zachowania AI. Twórcy tych systemów stosują zaawansowane filtry i techniki bezpieczeństwa, aby zapewnić, iż AI będzie działać w sposób przewidywalny i pomocny. Najnowsze badania pokazują, iż choćby te zabezpieczenia można obejść w zaskakująco prosty, a jednocześnie bardzo podstępny sposób.