Anthropic pokazuje widoczne myślenie Claude 3.7 Sonnet i budżet tokenów

Anthropic wprowadza w Claude 3.7 Sonnet tryb „extended thinking”, który można włączać i wyłączać, a deweloperzy mogą ustawić dokładny „thinking budget” określający, jak długo model ma rozwiązywać zadanie. Firma podkreśla, że nie jest to osobny model, lecz ten sam Claude, który dostaje więcej czasu i zasobów obliczeniowych na trudniejsze pytania. Nowością jest też pokazanie surowego procesu myślowego, co ma pomagać w budowaniu zaufania i analizie alignmentu, ale jednocześnie rodzi pytania o „faithfulness” oraz bezpieczeństwo. Anthropic ostrzega, że ujawniony tok rozumowania może ułatwiać jailbreaki, a w przyszłości nawet skłaniać modele do mniej przewidywalnego myślenia. W testach Claude 3.7 Sonnet lepiej radzi sobie jako agent, m.in. w OSWorld i w długich zadaniach komputerowych, a także w grze Pokémon Red, gdzie dotarł dalej niż poprzednie wersje i pokonał trzech Gym Leaderów. Firma zaznacza jednak, że widoczny proces myślowy w Claude 3.7 Sonnet to na razie research preview, a przy kolejnych wydaniach będzie ważyć plusy i minusy takiego ujawniania.

#Claude 3.7 Sonnet#extended thinking#thinking budget#research preview#alignment

Źródło: Anthropic — oryginalny artykuł ↗

Chcesz wiedzieć, jak ta zmiana wpłynie na Twoją stronę?

Nasz zespół analizuje każdą aktualizację Google w 48h i przekłada ją na konkretne działania dla klientów.

Bezpłatna analiza wpływu