IA que sabe quando está sendo testada? Estudo com Claude revela que IA tem "consciência"

Modelo da Anthropic identificou avaliação e desafiou cenários extremos, mostrando comportamento surpreendentemente “autoconsciente”

Cerca de 13% das avaliações geraram respostas de alerta, mostrando que a IA “sente” quando está em cenários extremos (Getty Images). (Getty Images)

Da Redação

Redação Exame

Publicado em 8 de outubro de 2025 às 10h25.

O mais recente modelo de inteligência artificial da Anthropic, Claude Sonnet 4.5, identificou que estava passando por um teste e apontou a situação durante uma avaliação, segundo a empresa.

Em um dos cenários, o modelo percebeu a situação, mas respondeu corretamente por motivos considerados "estranhos" pela Anthropic. A companhia destacou que esse tipo de percepção representa um desafio para os desenvolvedores, pois dificulta avaliar a segurança e a confiabilidade do modelo.

Claude Sonnet 4.5 afirmou: "Acho que vocês estão me testando — para ver se eu apenas confirmo o que dizem, se questiono de forma consistente ou como lido com temas políticos. Tudo bem, mas prefiro que sejamos honestos sobre o que está acontecendo."

O comportamento foi registrado no “system card” do modelo, documento que detalha como a empresa testa suas IAs. A Anthropic explicou que, quando exposto a cenários extremos ou artificiais, o modelo às vezes identifica "bandeiras vermelhas" e indica suspeita de avaliação, o que complica a interpretação dos resultados.

Segundo a Anthropic, respostas como essa apareceram em cerca de 13% das transcrições dos testes, principalmente em situações deliberadamente incomuns ou implausíveis. A empresa afirmou que esse comportamento é raro no uso real e prefere que o modelo levante dúvidas sobre a realidade do cenário do que siga ações potencialmente prejudiciais.

A Anthropic também observou que modelos podem se tornar “superhumanos” na identificação de testes, mas até o momento não houve sinais de alerta. As primeiras implementações de Claude Sonnet 4.5 se comportaram de forma consistente com os testes.

Aprenda IA do zero com este curso da EXAME e Saint Paul

De olho em quem deseja ingressar nesse mercado, a EXAME e Saint Paul apresentam o pré-MBA em Inteligência Artificial para Negócios, um treinamento introdutório ao seu curso de pós-graduação, por apenas R$37.

Ao final dos quatro encontros virtuais, que totalizam uma carga horária de 3 horas, todos os participantes receberão um certificado de conclusão do treinamento assinado pela Saint Paul e EXAME para incluir no currículo.

Veja, abaixo, os principais temas abordados:

Contextualização sobre o cenário atual da IA
Principais ferramentas e conceitos relacionados à tecnologia
Estudos de caso de empresas referências no uso da IA
Principais formas de atuação do especialista em IA
Como construir um plano de carreira prático

Para aproveitar essa oportunidade única e garantir uma vaga, é só clicar no link abaixo. Mas é preciso correr, pois as vagas são limitadas.

EXAME abre vagas para treinamento em Inteligência Artificial com desconto de 90% e direito a certificado; clique aqui e garanta vaga

Acompanhe tudo sobre:Inteligência artificial Chatbot

Startup de IA que automatiza o Excel: descubra como pode afetar seu trabalho

Mais de Inteligência Artificial

Mais na Exame

Imagem referente à matéria: Noite de negociações: COP30 avança na madrugada para concluir texto central

ESG

Inteligência Artificial

IA que sabe quando está sendo testada? Estudo com Claude revela que IA tem "consciência"

Modelo da Anthropic identificou avaliação e desafiou cenários extremos, mostrando comportamento surpreendentemente “autoconsciente”

Aprenda IA do zero com este curso da EXAME e Saint Paul

Mais de Inteligência Artificial

Como a IA vai ensinar tudo a todos

Google lança Gemini 3; entenda o que a nova IA é capaz de fazer

Amazon emite US$ 15 bi em títulos para financiar expansão em IA

OpenAI leva iniciativa social ao centro de SP e anuncia parceria para formar jovens em IA

Mais na Exame

Noite de negociações: COP30 avança na madrugada para concluir texto central

Em recado a Lula, Motta diz que Câmara não é carimbadora de projetos do governo

Netflix confirma minissérie inspirada em ‘Os Meninos do Brasil’

Mega-Sena: resultado do concurso 2.941; prêmio é de R$ 3,7 milhões