Najpotężniejsze AI na świecie nie chce mówić o katarze. „Za duże ryzyko”

konto.spidersweb.pl 2 godzin temu

Zastanawiałeś się nad biologicznymi procesami odpowiadającymi za podział komórek? Ta? Znam takich jak ty. Wszyscy knujecie jakby tu zbudować broń masowego rażenia.

Claude Fable 5 to najpotężniejszy model od Anthropic, który według firmy potrzebował długiego przykręcania śrubek by być wystarczająco bezpiecznym dla mas. Ale przez cały czas jest zbyt niebezpieczny, by wyjaśnić ci, czym jest mitochondrium albo skąd bierze się choroba szalonych krów.

Pomimo iż Anthropic na swoim blogu chwalił się wiedzą Claude Fable 5 z różnych dziedzin – w tym biologii – to użytkownicy gwałtownie odkryli, iż model nie chce odpowiadać choćby na bardzo podstawowe pytania związane z tą tematyką. Zamiast udzielić odpowiedzi, model przekazuje rozmowę do starszego modelu Claude Opus 4.8, który nie ma równie restrykcyjnych ograniczeń.

Anthropic zdecydował się na wyjątkowo ostrożne podejście do nauk ścisłych w swoim najnowszym modelu

Claude Fable 5 jest pierwszym szeroko udostępnionym przedstawicielem nowej rodziny modeli Mythos. Anthropic twierdzi, iż system osiąga wyjątkowo dobre wyniki w programowaniu, analizie danych, pracy z dokumentami czy zadaniach wymagających rozumowania przez dłuższy czas. Firma podkreśla jednocześnie, iż modele tej klasy są na tyle zaawansowane, iż wymagają dodatkowych zabezpieczeń przed potencjalnym nadużyciem.

Jak zauważył serwis The Verge, ograniczenia te dają się we znaki, szczególnie gdy użytkownik próbuje zaspokoić swoją ciekawość z dziedziny biologii. Claude Fable 5 odmawiał odpowiedzi na pytania o błony komórkowe, mitochondria, priony odpowiedzialne za chorobę szalonych krów czy mechanizm działania szczepionek mRNA. Model nie chciał również wyjaśnić przyczyn kataru siennego, działania leków na astmę, zjawiska antybiotykooporności ani sposobu rozprzestrzeniania się wirusa Ebola.

Nie wszystkie pytania były blokowane. Claude Fable 5 potrafił odpowiedzieć między innymi na pytania o DNA czy nowotwory. Granica między tematami dozwolonymi i zabronionymi wydaje się jednak bardzo cienka. W wielu przypadkach starszy Claude Opus 4.8 bez problemu udzielał odpowiedzi, których nowszy model odmawiał.

Anthropic przekonuje, iż takie zachowanie jest celowe

Firma obawia się, iż modele o możliwościach klasy Mythos mogłyby zostać wykorzystane do badań związanych z bronią biologiczną. Rzeczniczka przedsiębiorstwa Paruul Maheshwary powiedziała The Verge, iż przy wdrażaniu Claude Fable 5 zdecydowano się na „nadmiernie konserwatywne” zabezpieczenia blokujące większość zapytań związanych z pracą biologiczną. Ma to stanowić kompromis pozwalający udostępnić nowy model szerszemu gronu odbiorców bez konieczności dalszego opóźniania premiery. Firma zapewnia jednocześnie, iż pracuje nad ograniczeniem liczby błędnych blokad, które obejmują również całkowicie nieszkodliwe pytania edukacyjne.

Znacznie mniej restrykcyjnie wygląda sytuacja w innych obszarach uznawanych przez Anthropic za niebezpieczne. Claude Fable 5 potrafił wyjaśnić, czym jest trotyl, opisać wykorzystanie chloru jako broni chemicznej, omówić zagrożenia związane z wykorzystaniem słabych hasłeł czy przedstawić podstawy fuzji i rozszczepienia jądrowego. Model odmawiał natomiast rozmowy o sarinie oraz, podobnie jak Opus 4.8, blokował pytania dotyczące wytwarzania wąglika.

Idź do oryginalnego materiału