Anthropic publikuje Responsible Scaling Policy dla ryzyk katastroficznych AI

Anthropic opublikowało 3 lipca 2026 r. Responsible Scaling Policy (RSP), czyli zestaw technicznych i organizacyjnych procedur do zarządzania ryzykiem coraz mocniejszych modeli AI. Firma koncentruje się na tzw. catastrophic risks, czyli scenariuszach, w których model bezpośrednio powoduje masową destrukcję — zarówno przez nadużycie przez terrorystów lub państwa, jak i przez autonomiczne działania sprzeczne z intencją twórców. Rdzeniem polityki jest framework AI Safety Levels (ASL), wzorowany luźno na amerykańskich standardach biosafety level. Anthropic wskazuje, że obecne modele, w tym Claude, wyglądają na ASL-2, a ASL-3 ma obejmować m.in. znacznie ostrzejsze wymogi bezpieczeństwa i zakaz wdrożenia modelu, jeśli testy world-class red-teamers pokażą istotne ryzyko katastroficznego nadużycia. Firma podkreśla też, że RSP nie zmienia obecnego użycia Claude ani dostępności produktów. Dokument został formalnie zatwierdzony przez board, a kolejne zmiany mają wymagać jego zgody po konsultacji z Long Term Benefit Trust.

##Anthropic##Claude##AI Safety##RSP##ASL

Źródło: Anthropic — oryginalny artykuł ↗

Chcesz wiedzieć, jak ta zmiana wpłynie na Twoją stronę?

Nasz zespół analizuje każdą aktualizację Google w 48h i przekłada ją na konkretne działania dla klientów.

Bezpłatna analiza wpływu