9 de maio de 2025 às 17:20
O Alibaba apresentou o ZeroSearch, técnica que permite treinar LLMs sem usar APIs de busca como a do Google. A abordagem simula buscas por meio de geração textual, reduzindo custos e dando mais controle ao treinamento.
O método substitui consultas reais por documentos simulados. Com isso, o custo de um experimento com 64 mil buscas caiu de US$ 586,70 para US$ 70,80 — uma redução de 88%.
A técnica usa aprendizado por reforço com degradação gradual da qualidade dos textos. Isso ajuda os modelos a aprenderem a diferença entre documentos mais ou menos relevantes.
Em testes, um modelo com 14 bilhões de parâmetros superou a precisão da Busca Google. Os pesquisadores destacam que os LLMs já armazenam conhecimento amplo e geram textos relevantes sem depender da web.
A proposta busca reduzir dependência de buscadores comerciais e suas limitações técnicas e legais. Mesmo com possíveis restrições, o ZeroSearch aponta para uma maior autonomia dos modelos de IA.