(Twisha Patni/BLOOMBERG BUSINESSWEEK)
Bloomberg Businessweek
Publicado em 28 de julho de 2023 às 06h00.
Existem duas maneiras de olhar para o ChatGPT, o chatbot de inteligência artificial que centenas de milhões de pessoas experimentaram desde seu lançamento, no fim do ano passado. Uma visão, preferida por muitos políticos e jornalistas, bem como pela empresa que criou o aplicativo, é que seu lançamento foi um histórico avanço, comparável à Revolução Industrial — ou, mais preocupante, à bomba atômica. O cofundador da OpenAI, Sam Altman, advertiu que as versões futuras do software estrutural, um grande modelo de linguagem conhecido como GPT-4, podem acabar com a raça humana. Outra maneira de ver o ChatGPT é como um veículo para propaganda viral. Ao brincar com o software por alguns minutos, fica óbvio que o potencial para o Armagedom tem seus limites. O aplicativo luta com a matemática do ensino médio, não consegue contar o que aconteceu na semana passada e é basicamente o equivalente a uma máquina de um mentiroso compulsivo. Mas já é verdade que o software está além do poder de controle total de Altman.
A Microsoft, e não a OpenAI, é dona dos megacomputadores que permitem ao chatbot compor um soneto sobre seu gato ou escrever uma nota de agradecimento para seu tio. A Microsoft é o maior acionista da OpenAI, seu maior financiador e seu principal parceiro de tecnologia. E, em grande medida, é a Microsoft que tem agora a responsabilidade de transformar o burburinho do ChatGPT num verdadeiro negócio. Embora a OpenAI seja de longe a startup mais famosa do Vale do Silício, em muitos aspectos ela se parece mais com a subsidiária mais promissora do fornecedor líder de software de produtividade.
A Microsoft não avaliou o discurso público sobre IA de um ano atrás, quando estávamos todos assistindo ao filme Top Gun: Maverick e ouvindo Sam Bankman-Fried. Naquela época, a maioria dos comentários sobre o assunto visava a direção-geral do Google, onde os pesquisadores desenvolveram as tecnologias por trás do ChatGPT e seus pares. Mas, enquanto o Google, inicialmente, manteve sua pesquisa longe de produtos comerciais, especialmente seu principal mecanismo de busca, a Microsoft estava focada em usar as inovações da OpenAI para ganhar muito dinheiro o mais rápido possível.
A ferramenta GitHub Copilot da empresa, que sugere novas linhas de código para programadores de computador, foi sua primeira oferta mediante pagamento e atraiu mais de 10.000 empresas como clientes. O Bing, mecanismo de pesquisa também administrado pela Microsoft, veio a seguir, com um sistema de busca chatbot para criar itinerários de férias e listas de compras. Nos últimos meses, o CEO Satya Nadella anunciou planos para incorporar outros Copilots ao Windows (onde eles reescreverão, resumirão e explicarão o conteúdo) e seu pacote de escritório Microsoft 365 (onde criarão apresentações de slides em PowerPoint, filtrarão e-mails no Outlook e gerarão gráficos com base em dados do Excel). “Não faz sentido exagerar na tecnologia pela tecnologia”, diz Nadella. “Todas as mudanças tecnológicas só são úteis se fizerem algo no mundo real.”
A equipe de Nadella não divulgou o preço dos próximos Copilots, mas eles definitivamente não serão gratuitos. A versão do GitHub começa em 10 dólares por usuário, por mês, e os Copilots para aplicativos de escritório da Microsoft podem ter preços semelhantes, traduzindo-se em até 48 bilhões de dólares em receita anual extra nos próximos quatro anos, de acordo com Kirk Materne, analista da Evercore ISI. Em uma nota de pesquisa publicada em 2 de junho, ele estimou que a receita da Microsoft com recursos fundamentados na OpenAI pode chegar a 99 bilhões de dólares até 2027.
Não é de admirar, portanto, que a Microsoft tenha investido 13 bilhões de dólares na OpenAI desde 2019, de acordo com pessoas familiarizadas com a parceria; que o preço de suas ações tenha disparado 30% desde o lançamento do ChatGPT; ou que tenha se tornado o improvável gigante da tecnologia de IA a ser derrotado. “O líder evidente”, diz Kim Forrest, diretor de investimentos e fundador da Bokeh Capital Partners, empresa de investimentos. “O Google acabou de ser completamente ultrapassado.”
Os executivos da Microsoft estão compreensivelmente entusiasmados por estarem associados à vanguarda de qualquer coisa. Isso tem só um minuto, como mostram seus pontos de referência culturais. “Isso é um pouco como o momento do Windows 95”, diz Scott Guthrie, um dos vice-presidentes executivos da empresa. “As pessoas faziam fila na Best Buy à meia-noite para comprá-lo.” Desta vez, diz Guthrie, sua caixa de entrada está repleta de pedidos de CEOs solicitando acesso às primeiras versões dos Copilots corporativos.
Isso acompanha a comparação com o Windows 95, que foi menos um avanço tecnológico e mais uma expressão sublime de domínio corporativo. Por mais de uma década após seu lançamento, a Microsoft deteve a plataforma central para software de computação pessoal. (O fato de as práticas da empresa terem levado a um acordo antitruste com o governo dos Estados Unidos influenciou pouco para prejudicar suas perspectivas de longo prazo.) Agora, a casa que Bill Gates construiu está fazendo uma aposta semelhante no que parece ser a próxima grande plataforma. A ideia é simples: trazer a IA para tudo e depois lucrar.
A Microsoft estava trabalhando em software de IA antes mesmo de o Windows 95 travar seu primeiro PC, mas por décadas todas as grandes tentativas foram vítimas da aversão ao risco ou da bobagem corporativa. Para o Anexo A, veja o Clippy, o tutorial simplista do fim dos anos 1990 que interrompia seu trabalho para piscar seus gigantescos olhos e fazer perguntas como: “Parece que você está escrevendo uma carta. Gostaria de ajuda?” Em 2016 surgiu o Tay, um bot que deveria aprender a se parecer com uma adolescente conversando com as pessoas no Twitter. De alguma forma, os engenheiros da Microsoft falharam em avaliar como o Twitter tendia a funcionar: em 24 horas, um dilúvio de retórica de neonazistas e defensores da verdade do 11 de Setembro transformou o Tay em um personagem cínico, troll e antissemita. A empresa tirou o Tay do ar, para nunca mais voltar.
Nesse meio-tempo, a maior parte da produção de IA da Microsoft consistia em trabalhos acadêmicos. “Tínhamos um monte de pessoas inteligentes que estavam fazendo um conjunto de coisas pequenas e interessantes”, diz Kevin Scott, diretor de tecnologia. “Mas isso não estava necessariamente acrescentando nada.” Scott, um cara grande com seu bizarro cavanhaque e uma coleção de camisas havaianas, cresceu no sopé dos Apalaches da Virgínia e frequentou a vizinha Universidade de Lynchburg, uma pequena faculdade cristã. Ele conseguiu emprego no Google, tornou-se engenheiro de ponta e depois saltou para o LinkedIn, adquirido pela Microsoft em 2016. Após fecharem um acordo, Nadella o nomeou CTO e o encarregou de simplificar a expansão da IA da empresa.
Na época, a Microsoft tinha pelo menos três divisões conduzindo pesquisas de IA sob diferentes chefias. Scott registrou todos os pedidos de unidades de processamento gráfico das diferentes equipes e obteve um número tão grande quanto todo o orçamento de capital da empresa para o ano, na ocasião cerca de 10 bilhões de dólares. “Simplesmente um número absurdo”, diz ele. “Esses eram grandes projetos individualmente, mas sem relação entre si. Nenhum deles tinha um plano de negócios.” A partir de 2019, ele assumiu a responsabilidade por toda a pesquisa e desenvolvimento de IA. Qualquer projeto que precisasse de chips de IA exigia sua aprovação.
Até então, as três grandes empresas no campo eram Baidu, Google e OpenAI, diz Vinod Khosla, um dos primeiros investidores da OpenAI e cofundador da Sun Microsystems. As vantagens do Google incluíam sua principal subsidiária de pesquisa, a DeepMind, e sua tecnologia de carros autônomos. A Baidu, criadora do principal mecanismo de busca da China, tinha pontos fortes semelhantes. A OpenAI, fundada por Altman e Elon Musk, era a estranha nesse contexto. Suas demos eram promissoras, mas a empresa não tinha dinheiro para manter o ritmo. “O que a OpenAI precisava era de um parceiro”, diz Khosla, em parte apenas para pagar por mais chips. “O que a Microsoft precisava era, de alguma forma, alcançar o Google.”
A Microsoft nunca havia terceirizado o desenvolvimento de uma peça importante de tecnologia para terceiros, e o dinheiro que Altman queria era enorme — 1 bilhão de dólares para um pequeno laboratório. Scott diz que o que o transformou foi o uso da startup de “aprendizado por transferência”, uma abordagem promissora que ainda não havia sido incorporada a um produto comercial. Na época, a maioria das startups de IA tentava ensinar a um computador uma tarefa específica (identificar itens de mercearia rapidamente, digamos) usando dados especializados (uma série de fotos de mantimentos, verificadas e rotuladas por humanos). A ideia do aprendizado por transferência era que se poderia criar um modelo para fazer uma coisa, como resumir um parágrafo, e depois aplicar essas informações para aprender novas tarefas, como compor uma música ou planejar uma viagem. “Quando se treina um modelo abrangente, ele será bom em todas essas tarefas”, diz Scott.
O resultado foi que, em vez de fornecer dados especializados a um modelo de IA, simplesmente se coleta o máximo de dados possível. Por exemplo: toda a internet.
O acordo entre Altman e a Microsoft em 2019 custou a ele muito mais controle do que ele teria cedido a uma empresa de capital de risco. A Microsoft obteve o direito exclusivo de fornecer a infraestrutura de computação em nuvem da OpenAI e o direito de vender serviços da OpenAI a clientes da Microsoft. Em troca, Altman conseguiu algo que nenhuma empresa de capital de risco poderia fornecer. “Nosso problema não era o capital”, diz. “Nosso problema era: como construiríamos a infraestrutura de computação de que precisávamos?” A Microsoft concordou em construir o OpenAI, um enorme computador com dezenas de milhares de chips de última geração da Nvidia, personalizados de acordo com as especificações do OpenAI — “um verdadeiro floco de neve”, diz Scott.
O negócio foi mal recebido por alguns engenheiros da Microsoft, já insatisfeitos com as mudanças de Scott. A essa altura, o GPT-2 da OpenAI podia olhar para um pedaço de texto e sugerir as próximas frases, mas a startup não havia lançado o GPT-2, em parte porque parecia destinado a gerar notícias falsas e spam. “Realmente não tínhamos nada”, diz Altman. “Éramos um laboratório de pesquisa que não havia realmente descoberto como produzir.” Altman também foi controverso. Como parte de um plano complicado para desenvolver tecnologia de identificação para um programa teórico de renda básica universal, sua empresa de criptografia, a Worldcoin, enviou técnicos para o mundo inteiro, incluindo a África subsaariana, para escanear a íris do maior número possível de pessoas. “Fomos impiedosamente ridicularizados”, lembra ele.
As coisas começaram a mudar em 2021, quando a Microsoft usou a versão seguinte do modelo OpenAI para criar o GitHub Copilot. Além de terminar parágrafos em um conto, o modelo OpenAI provou ser capaz de olhar para um pedaço de código de computador e sugerir as próximas linhas. “Conforme trabalhávamos naquele produto e víamos que ele seria bem-sucedido, surgiu a questão de como os outros Copilots deveriam ser”, diz Scott.
Um insider mais convincente foi Bill Gates. Gates deixou o conselho em 2020, em meio a uma investigação sobre um caso com uma funcionária da Microsoft. No ano anterior, ele se desculpou por se encontrar com o abusador sexual infantil condenado Jeffrey Epstein. Um porta-voz de Gates diz que ele deixou o conselho para se concentrar em sua filantropia. Gates ainda assessora a empresa em questões técnicas.
Apesar da controvérsia sobre Epstein, a opinião de Gates tem peso. Ele se opôs ao investimento original da OpenAI e considerou o GPT indiferente. Ele exigiu ver uma demonstração que provasse que o modelo de Altman entendia o que estava dizendo e assegurou que, se a OpenAI pudesse passar em um exame de biologia avançada, ele ficaria impressionado. No final do verão passado, Altman, Scott, Guthrie e uma pequena equipe de pesquisadores da OpenAI apareceram na casa palaciana de Gates no Lago Washington para uma demonstração do GPT-4. Scott estava nervoso. “Bill é um cliente difícil”, diz ele, minimizando as coisas. Gates é conhecido por fulminantes explosões durante análises de produtos, incluindo o uso frequente das seguintes palavras: “Essa é a coisa mais estúpida que já ouvi”. Mas o modelo OpenAI passou no exame de biologia avançada, e depois no do próprio Gates. Após a demonstração formal, ele desafiou o software a conversar como se estivesse com os pais de uma criança doente. Ele ficou impressionado, disse mais tarde, com a empatia do ChatGPT.
Em poucos meses, a Microsoft estava em negociações para colocar outros 10 bilhões de dólares na OpenAI, muitos dos quais iriam direto para o bolso da própria empresa. A equipe de Altman precisava alugar grandes quantidades de poder de computação em nuvem para desenvolver uma série de projetos com base no GPT-4.
O primeiro desses da Microsoft foi um bot ChatGPT que poderia ser acessado no Bing. A barra de pesquisa da Microsoft responde por 3% do mercado de anúncios de pesquisa, em comparação com cerca de 91% do Google, de acordo com a SimilarWeb. Isso o tornou um laboratório ideal: pequeno demais para a Microsoft se preocupar tanto em estragar tudo, mas com uma pilha enorme de dinheiro do outro lado da mesa. “Vimos uma oportunidade incrível se a tecnologia funcionasse”, diz Divya Kumar, chefe de marketing da Microsoft para pesquisa e IA. Ao contrário da Apple, a Microsoft geralmente não se esforça muito para manter os novos produtos em segredo. Mas, nesse caso, os planos foram mantidos em um círculo extremamente restrito. Por exemplo, Jeff Teper, que supervisiona partes do império de escritórios da Microsoft, diz que apenas 15 pessoas de sua equipe de 5.000 sabiam sobre o projeto. A ação do Bing recebeu um codinome: Prometeu.
Essa escolha, em retrospecto, parece um pouco estranha, por ser tanto uma expressão da compreensão diferenciada da Microsoft sobre o pântano ético em que entrou quanto uma prova de que os técnicos não prestam muita atenção nas aulas de inglês. Na mitologia clássica, Prometeu é o deus do fogo e, em certo sentido, o fundador da civilização, tendo passado a capacidade de fazer fogo para o restante de nós. Mas, como punição por ter roubado a tecnologia do Monte Olimpo, ele acaba acorrentado a uma rocha onde, todos os dias, uma águia pousa e come seu fígado. Para maximizar seu sofrimento, o fígado se regenera todas as noites.
Em fevereiro passado, Nadella ficou na frente de um grupo de repórteres e analistas e apresentou o chatbot Bing, que poderia esboçar mensagens sinceras, listas de compras e até mesmo planos de férias sem fazer os usuários clicarem em outras páginas da web. “Uma corrida começa hoje”, disse ele, sinalizando a intenção de levar chatbots semelhantes a outros produtos da Microsoft, “e vamos nos mover rapidamente”. Ele continuou: “Todos os dias queremos trazer coisas novas”.
Para os investidores, era óbvio que um mecanismo de busca que fornece suas próprias respostas em vez de links seria uma calamidade para o negócio de publicidade do Google, que depende da cobrança de determinados links. As ações da Microsoft dispararam, enquanto as da controladora do Google, Alphabet, caíram. Lá, os gerentes declararam recentemente um “código vermelho” e ordenaram aos funcionários que adicionassem freneticamente IA a todos os seus produtos em questão de meses. “Estamos jogando espaguete na parede”, disse um funcionário do Google à Bloomberg Businessweek em março. “Mas não está nem perto do que é necessário para transformar a empresa e ser competitiva.” O Google disse que tudo isso é apenas parte do processo normal de P&D.
Após o anúncio da IA, a SimilarWeb registrou um aumento de aproximadamente 15% no uso do Bing, um fato impressionante em um mercado estagnado há uma década. Mas a atenção não foi totalmente positiva. Os usuários perceberam que o chatbot do Bing, como o da OpenAI, era propenso a falar bobagens. E, se criticado por entender fatos errados ou inventar coisas, o bot do Bing tendia a ficar dramaticamente mais estranho, tendo dito ao Verge que estava espionando os funcionários da Microsoft por meio de suas webcams. Ao falar com um analista de tecnologia popular, o aplicativo experimentou uma fantasia de vingança, possivelmente inspirada no Homem-Aranha, envolvendo um alter ego vilão chamado Venom.
Essas falhas graves não diminuíram a corrida da Microsoft para incorporar a mesma tecnologia em seu outro software. O Microsoft 365, a suíte de escritório, tem cerca de 400 milhões de assinantes pagos, incluindo as maiores empresas, forças armadas e governos do mundo. Pense no dano que Venom e Sydney podem causar a cálculos de engenharia de vida ou morte, não obstante os comunicados corporativos à imprensa se algum humano preguiçoso não os verificar novamente.
Tradução de Anna Maria Dalle Luche