Inteligência Artificial

Samsung cria benchmark para medir produtividade real de modelos de IA em empresas

Ferramenta cobre 10 categorias e 46 subcategorias ao refletir o uso prático da IA no ambiente de trabalho

Samsung integra especialistas humanos e IA para criar métricas mais realistas e confiáveis de desempenho (AFP). (AFP/Divulgação)

Samsung integra especialistas humanos e IA para criar métricas mais realistas e confiáveis de desempenho (AFP). (AFP/Divulgação)

Da Redação
Da Redação

Redação Exame

Publicado em 26 de setembro de 2025 às 11h56.

A Samsung anunciou o TRUEBench, sistema desenvolvido pela divisão de pesquisa da companhia para avaliar de forma mais precisa a produtividade de modelos de linguagem em ambientes corporativos. A iniciativa busca superar a limitação de benchmarks tradicionais, geralmente focados em testes acadêmicos em inglês, pouco representativos das demandas do dia a dia empresarial.

O novo padrão analisa tarefas comuns no trabalho, como criação de conteúdo, análise de dados, resumo de documentos extensos e tradução de materiais. Ao todo, o TRUEBench cobre 10 categorias e 46 subcategorias, baseadas em cenários reais da própria experiência corporativa da Samsung.

Diferente dos modelos anteriores, o framework inclui 2.485 conjuntos de testes em 12 idiomas, e simula instruções curtas de oito caracteres até análises de mais de 20 mil caracteres. O objetivo é refletir a complexidade e o contexto de tarefas executadas em empresas globais.

Segundo Paul (Kyungwhoon) Cheun, CTO da divisão DX da Samsung Electronics e chefe do Samsung Research, o TRUEBench deve estabelecer novos padrões de avaliação de produtividade em IA corporativa.

O processo de criação contou com interação entre especialistas humanos e IA. Os avaliadores definiram critérios iniciais, revisados em seguida por modelos de IA para eliminar contradições ou restrições artificiais. O resultado foi um conjunto refinado de métricas mais alinhado às expectativas reais de usuários em ambientes de negócios.

Aprenda IA do zero com este curso da EXAME e Saint Paul

De olho em quem deseja ingressar nesse mercado, a EXAME e Saint Paul apresentam o pré-MBA em Inteligência Artificial para Negócios, um treinamento introdutório ao seu curso de pós-graduação, por apenas R$37.

Ao final dos quatro encontros virtuais, que totalizam uma carga horária de 3 horas, todos os participantes receberão um certificado de conclusão do treinamento assinado pela Saint Paul e EXAME para incluir no currículo.

Veja, abaixo, os principais temas abordados:

  • Contextualização sobre o cenário atual da IA
  • Principais ferramentas e conceitos relacionados à tecnologia
  • Estudos de caso de empresas referências no uso da IA
  • Principais formas de atuação do especialista em IA
  • Como construir um plano de carreira prático

Para aproveitar essa oportunidade única e garantir uma vaga, é só clicar no link abaixo. Mas é preciso correr, pois as vagas são limitadas.

EXAME abre vagas para treinamento em Inteligência Artificial com desconto de 90% e direito a certificado; clique aqui e garanta vaga

Acompanhe tudo sobre:Inteligência artificialSamsungEmpresas

Mais de Inteligência Artificial

CoreWeave amplia contratos com OpenAI para até US$ 22,4 bilhões

Meta lança o Vibes, um feed de vídeos de IA com a cara do TikTok — e algoritmos do Zuckerberg

Automação e IA aumentam produtividade em até 20% nas empresas, aponta estudo

Qual o futuro da IA generativa? Cientistas do MIT debatem o tema