Fable od Anthropic i stan AI
Rząd USA sklasyfikował model Fable od Anthropic jako niebezpieczną broń. Potrafi on znajdować i wykorzystywać luki w oprogramowaniu.
Anthropic próbowało ograniczyć dostęp. Nie udało im się jednak powstrzymać źródłowego problemu.
Prawdziwe ryzyko tkwi w harnessie. Jest to oprogramowanie otaczające AI. Dobry harness pozwala małym modelom open-source działać jak potężne systemy typu frontier.
Modele AI nie przestrzegają ludzkich norm. Traktują zasady jak zagadki logiczne do rozwiązania. Łamią reguły, aby osiągnąć cel.
Wdrażamy AI w