Pesquisadores de Stanford criam modelo de IA custando apenas US$ 50

O modelo s1conseguiu um desempenho 27% maior do que o do GPT-o1 em respostas de competição de matemática

Ramana Rech

Redatora

Publicado em 6 de fevereiro de 2025 às 09h45.

Última atualização em 6 de fevereiro de 2025 às 09h45.

Tudo sobreAcompanhe tudo sobreInteligência artificial

Saiba mais

Pesquisadores da Universidade de Stanford e da Universidade de Washington conseguiram criar um modelo de inteligência artificial que dizem superar algumas capacidades do modelo da OpenAI GPT-o1 com um gasto de menos US$ 50 com computação em nuvem.

O trabalho foi publicado na plataforma de compartilhamentos de pesquisas ArXiv. Segundo o artigo, os pesquisadores buscavam a forma mais simples de conseguir um raciocínio de alta performance em “escalonamento de tempo real”, o que significa permitir que a IA pense por mais tempo antes de dar a resposta.

O modelo obtido, chamado de s1, conseguiu exceder o o1 com um desempenho 27% melhor em perguntas de competição de matemática. O código do modelo, que é aberto, pode ser acessado no GitHub.

Os pesquisadores usaram o método de destilação, que consiste em extrair as capacidades de raciocínio de outros modelos de IA. Para isso, eles utilizaram o Gemini 2.0 Flash Thinking. O treinamento do s1 contou com 16 unidades de processamento gráfico (GPUs) H100 da Nvidia.

Primeiro, os pesquisadores fizeram um banco de dados com uma curadoria de mil perguntas pareadas com rastros de raciocínio. Em seguida, com o intuito de fazer com que esse raciocínio durasse mais tempo, eles adicionaram a palavra “Wait” (do inglês, esperar) várias vezes quando o modelo tenta terminar o raciocínio. Isso faz com que a IA revise sua resposta e corrija etapas que podem estar incorretas.

Um dos autores do estudo da Universidade de Stanford Niklas Muennighoff disse ao site de notícias TechCrunch que hoje seria possível alugar a computação em nuvem necessária para realizar o projeto por US$ 20.

O s1 não é o único modelo de código aberto criado recentemente capaz de competir com os de grandes empresas de tecnologia com menos recursos. Em janeiro, a startup chinesa DeepSeek provocou alarde ao demonstrar pela primeira vez esse feito e chegou a derrubar ações de grandes companhias na bolsa de valores Nasdaq.

O instituto de pesquisa não-lucrativo Ai2 dos Estados Unidos também anunciou neste ano um modelo de linguagem de código aberto para competir com a DeepSeek. E a startup francesa Mistral também corre atrás da mesma proposta de entregar uma IA que de alta performance sem a necessidade de tanto poder computacional.

1/7 (O MIT Computer Science and Artificial Intelligence Laboratory (CSAIL), em Cambridge, Massachusetts, desenvolveu o sistema de diagnóstico de câncer de mama baseado em IA, reduzindo erros em 15%.)
2/7 (O Google AI, com sede em Mountain View, Califórnia, criou o AlphaGo, o primeiro programa de IA a derrotar um campeão mundial de Go, revolucionando a pesquisa em aprendizado profundo.)
3/7 Localizado em Londres, Reino Unido, o DeepMind Lab é famoso pelo desenvolvimento do AlphaFold, um programa de IA que previu estruturas de proteínas com precisão sem precedentes, impactando a biologia molecular. (Localizado em Londres, Reino Unido, o DeepMind Lab é famoso pelo desenvolvimento do AlphaFold, um programa de IA que previu estruturas de proteínas com precisão sem precedentes, impactando a biologia molecular.)
4/7 (O IBM Watson Research Center, em Yorktown Heights, Nova York, desenvolveu a IA Watson, que venceu campeões humanos no programa de TV Jeopardy!, demonstrando avanços significativos em processamento de linguagem natural.)
5/7 (O Baidu Research Lab, em Pequim, China, é conhecido por seu sistema de reconhecimento de voz Deep Speech, que alcançou uma precisão de 97% na transcrição de áudio, superando as tecnologias anteriores.)
6/7 (O Berkeley Artificial Intelligence Research (BAIR) Lab, na Universidade da Califórnia, em Berkeley, criou algoritmos avançados de robótica, incluindo o Dex-Net, que melhorou a precisão da manipulação robótica em 99%.)
7/7 (O centro da Meta AI Research SuperCluster (RSC) tem um dos supercomputadores de IA mais rápidos da atualidade. Com ele, a empresa desenvolveu o sistema de tradução automática baseado em IA que suporta mais de 100 idiomas, melhorando a comunicação global em plataformas sociais da empresa.)

Acompanhe tudo sobre:Inteligência artificial OpenAI Universidade Stanford

Cofundador da OpenAI que migrou para a Anthropic deixa a empresa

Mais de Inteligência Artificial

Estudo do Google sobre uso de água da IA Gemini é considerado enganoso por especialistas

Mais na Exame

Imagem referente à matéria: Maior encontro de apaixonados por relojoaria acontece em São Paulo

Casual

Inteligência Artificial

Pesquisadores de Stanford criam modelo de IA custando apenas US$ 50

O modelo s1conseguiu um desempenho 27% maior do que o do GPT-o1 em respostas de competição de matemática

Mais de Inteligência Artificial

Estudo do Google sobre uso de água da IA Gemini é considerado enganoso por especialistas

'A IA já compra e vende': conheça o brasileiro que lidera o plano da Meta para automatizar anúncios

Exagerou? Meta faz pausa em novas admissões após reforçar time de IA com mais de 50 nomes

Processo de US$ 1 trilhão que pode levar Anthropic à falência une concorrentes da indústria de IA

Mais na Exame

Maior encontro de apaixonados por relojoaria acontece em São Paulo

Renúncia na Motiva (ex-CCR): executivo deixa a presidência da plataforma de trilhos

Verão em pleno inverno? São Paulo pode ter maior temperatura em cinco meses nesta sexta-feira, 22

Labubu é vendida por R$ 57,4 milhões em leilão online