Chief Artificial Intelligence Officer da Exame
Publicado em 30 de janeiro de 2025 às 14h00.
O mais recente terremoto do mundo da tecnologia não teve origem no Vale do Silício, mas na China, e suas ondas de choque ainda reverberam pelo mercado. Falo do DeepSeek, o modelo de IA open source que derrubou as ações da Nvidia e tem provocado manifestações de todos, desde Mark Andersen até Satya Nadella.
O que torna o DeepSeek fascinante não é apenas seu desempenho – que já é impressionante por si só – mas o que ele representa: a democratização de uma tecnologia que os gigantes do setor gastaram bilhões tentando controlar.
O DeepSeek alega ter treinado seu modelo usando GPUs H800 – chips menos poderosos aos quais a China tem acesso devido às restrições de exportação americanas – e fez isso em 95% menos tempo que o treinamento do GPT-4. Se verdadeiro, isso é revolucionário. Mas vamos com calma.
Alguns colegas do mercado estão céticos. Eles questionam se o DeepSeek realmente alcançou esses resultados sem acesso a chips mais avançados. O CEO da Scale AI, Alexander Wang, sugere que a empresa chinesa pode estar subestimando seus recursos computacionais devido a preocupações com controles de exportação. São pontos válidos, mas podem estar perdendo o quadro maior.
A verdadeira história aqui não é sobre especificações de hardware – é sobre o modelo open source que o DeepSeek representa. Pense nisso como o momento Linux da IA. Assim como o Linux democratizou os sistemas operacionais, o DeepSeek está tornando a IA de alto desempenho acessível a qualquer pessoa com conhecimento técnico para usá-la.
O que é particularmente inteligente é como o DeepSeek tornou seu modelo compatível com a infraestrutura existente da OpenAI. Desenvolvedores podem mudar para o DeepSeek com alterações mínimas no código, potencialmente economizando milhões em custos de API. É uma jogada clássica de disrupção: custos mais baixos, acesso mais amplo, desempenho satisfatório.
Paradoxalmente, esse avanço em eficiência pode aumentar a demanda por computação de alto desempenho. Se isso for verdade, as ações da NVidia entraram em promoção e logo voltam ao patamar de antes. É um fenômeno que os economistas chamam de paradoxo de Jevons – conforme a eficiência do recurso melhora, o consumo total frequentemente aumenta devido ao acesso expandido e novos casos de uso. Nadella entende isso, o que pode explicar por que a Microsoft não está em pânico. O tempo dirá.
A história de origem é igualmente fascinante. O DeepSeek começou como um projeto paralelo em uma empresa de trading quantitativo, usando GPUs ociosas originalmente compradas para mineração de criptomoedas e trading. A inovação frequentemente vem de lugares inesperados.
As implicações para a indústria de IA são profundas. Estamos passando de um mundo de escassez de IA para um de abundância. Isso não significa que OpenAI e outros líderes vão desaparecer – eles ainda têm vantagens em experiência do usuário, recursos de segurança e conformidade regulatória. Mas seu monopólio sobre capacidades fundamentais está se erodindo.
E agora o DeepSeek está expandindo para geração de imagens com seu modelo Janus, desafiando líderes como DALL-E 3 e Midjourney. O ritmo da inovação é impressionante.
Apesar do pânico inicial do mercado, sigo otimista em relação a empresas como a Nvidia. Custos mais baixos de treinamento não reduzirão a demanda por poder computacional – expandirão o mercado para desenvolvimento de IA. Mais players entrarão no campo, cada um empurrando os limites do possível.
Os verdadeiros vencedores? Desenvolvedores e empresas que agora podem acessar recursos de IA de ponta sem quebrar o banco. Os perdedores? Qualquer um apostando que o desenvolvimento de IA permaneceria nas mãos de algumas empresas bem financiadas.
O código aberto sempre vence no longo prazo.
Fiz um video explorando o assunto: