A revolução da IA está devorando seus filhos
A empresa chinesa de IA Deepseek está sacudindo o modelo de negócios da indústria emergente.
16.02.2025, Tomasz Konicz
As ondas de choque que o modelo de IA chinês DeepSeek enviou à indústria de alta tecnologia americana também produziram momentos irônicos e totalmente cômicos. O desenvolvedor do ChatGPT, OpenAI, que é apoiado pela Microsoft, acusou a startup chinesa de roubo de dados e espionagem. O modelo de negócios do pioneiro americano em IA é baseado em “roubar dados de toda a Internet” e agora “reclamar que o DeepSeek está sendo treinado na saída do OpenAI”, disse o crítico de tecnologia Ed Zitron, citado pela PC Gamer. 1 A equipe liderada pelo guru da IA Sam Altman agora receberia uma dose do seu próprio remédio, Zitron trovejou. A OpenAI projetou uma “máquina de plágio” apenas para reclamar que seus plágios estavam sendo usados para gerar novas máquinas de plágio.
A indústria chama esse processo de destilação de conhecimento, onde muito dinheiro e recursos podem ser economizados usando a saída de um grande modelo de linguagem especificamente para treinar um modelo menor e mais barato. Não é por acaso que a OpenAI, em particular, está reclamando alto sobre seus concorrentes chineses baratos, que supostamente concluíram seu modelo por pouco menos de seis milhões de dólares – ironicamente, a pioneira da indústria de IA, que gosta de promover agressivamente seu potencial geral de racionalização econômica, simplesmente parece estar perdendo seu modelo de negócios. Os sistemas de IA proprietários e fechados deveriam poder ser monopolizados e vendidos pelos gigantes da tecnologia do Vale do Silício devido aos seus custos gigantescos de treinamento, já que o aprendizado de máquina até agora conseguiu absorver bilhões de dólares. O OpenAI em sua forma atual se tornaria obsoleto assim que as inovações do modelo de língua chinesa, que é em grande parte de código aberto, fossem generalizadas.
O DeepSeek desencadeou um choque disruptivo no qual o software proprietário foi superado pelo princípio de código aberto, que permite colaboração e inovação globais muito mais rápidas (apenas o recém-formado Meta também adotou uma abordagem de código aberto com seu grande modelo de linguagem Llama – precisamente porque o Facebook e companhia não dependem da receita do negócio de IA). 2 – Os sonhados lucros de software dos gigantes da indústria de IA seriam, portanto, amplamente destruídos, porque em breve todas as empresas de médio porte estarão encantando seus clientes com ferramentas de IA igualmente irritantes, como a Microsoft demonstrou a um custo de bilhões com seu já profundamente odiado Copilot – o Clippy 3 da era da IA, por assim dizer. 4 – Uma analogia do mercado de sistemas operacionais pode ilustrar a ruptura que está ocorrendo agora: a indústria de IA queria seguir um modelo como o que a Microsoft vinha praticando com seu sistema operacional Windows desde a década de 1990, onde o software em si é o produto monopolizado. Com o DeepSeek, o software se torna gratuito e/ou mais barato, enquanto os serviços e personalizações, o “serviço”, por assim dizer, agora precisam ser monetizados – semelhante ao que a Red Hat faz com seu Enterprise Linux. Este é um princípio comercial realista, mas o volume potencial do mercado de IA é muito menor, mesmo antes de ser amplamente implementado.
Mas mesmo os produtores de hardware cujas capacidades de computação tornaram possível o boom da IA tiveram que aceitar perdas severas nos mercados de ações após o choque do DeepSeek. A fabricante de placas de vídeo Nvidia não apenas descobriu uma fonte de ouro com suas placas de computação preparadas para processos de IA, mas também a monopolizou amplamente, aumentando o preço de suas ações quase dez vezes em dois anos – após o DeepSeek, elas despencaram 20%. Todo o boom da IA, que na verdade apenas mantém o mercado financeiro dos EUA em um boom especulativo (a UE já está amplamente dissociada), corre o risco de perder força. E se as esperanças por um novo regime de acumulação, por novos mercados e indústrias geradoras de empregos explodissem tão abruptamente quanto aconteceu durante a deflação da bolha das pontocom na virada do milênio? Um dos pilares mais importantes da economia dos EUA, que só consegue manter sua posição excepcional graças ao dólar americano, sofreu rachaduras significativas como resultado de um massacre de preços de cerca de um trilhão de dólares 5 em fevereiro.
O DeepSeek não apenas prejudica o boom do mercado financeiro dos EUA, a ferramenta de IA também representa um desafio geopolítico-militar ao domínio de Washington, que agora só pode ser mantido devido ao poder da máquina militar dos EUA. É por isso que a Casa Branca – além das platitudes de Trump sobre o efeito promotor da inovação da competição – imediatamente agiu para minimizar o alcance do aplicativo e simplesmente proibir seu uso em agências governamentais.
O momento do lançamento do DeepSeek provavelmente também teve como objetivo humilhar a gigantomania de terawatts de Trump e seus tecno-oligarcas, que poucos dias antes anunciaram o Stargate, um programa de investimento em IA de US$ 500 bilhões que agora parece simplesmente ridículo. 6 – O sinal enviado pelo capitalismo de estado chinês é claro: a eficiência chinesa supera a abordagem de força bruta americana. A China também demonstrou a ineficácia das sanções americanas a produtos de alta tecnologia, que tinham como objetivo impedir o desenvolvimento de uma IA chinesa competitiva no contexto da luta hegemônica entre Washington e Pequim — precisamente por causa do potencial assustador de aplicações militares dos sistemas de IA.
Pelo contrário, a DeepSeek alega ter transformado a necessidade em virtude, com uma série de inovações nas fases de treinamento da IA, o que levou à capacidade de limitar o uso de chips Nvidia a 2.048 modelos H800 mais antigos (a DeepSeek não confirmou a suposta destilação de conhecimento que escandalizou a OpenAI). 7 – No entanto, essas mesmas vantagens de custo da concorrência chinesa estão agora sendo amplamente questionadas por um estudo do grupo de estudos de TI SemiAnalysis. 8 – O fundo de hedge chinês High-Flyer, que financiou o DeepSeek, teria fazendas de computadores com cerca de 60.000 placas Nvidia, e os custos com a equipe altamente qualificada e o desenvolvimento de métodos de treinamento inovadores não estão incluídos no cálculo de custos dos criadores do DeepSeek, de modo que as verdadeiras despesas do fundo de hedge High-Flyer na “República Popular” seriam estimadas em um bilhão de dólares.
Mesmo que grandes partes dessa contabilidade de custos ocidental correspondam à realidade, sua lógica implícita está errada. O DeepSeek é de código aberto, seus custos de desenvolvimento são irrelevantes para uso futuro, as inovações de processo que foram usadas em seu desenvolvimento não permanecem em segredo, elas se tornam de conhecimento comum – e inevitavelmente reduzem o preço dos serviços baseados em IA que a indústria de TI dos Estados Unidos queria monopolizar. O bolo da IA está derretendo. E essas inovações são reais; não são apenas cópias baratas, como reconheceu a MIT Technology Review 9 – A concorrência dos EUA está agora a trabalhar arduamente para copiar essas inovações, que estão a ser promovidas pelas sanções de Washington. Novos métodos de compressão, como a Atenção Latente Multicabeça, tornaram possível reduzir o consumo de memória e minimizar os gargalos resultantes da largura de banda de memória insuficiente.
10 – Outro passo crucial de inovação que a DeepSeek tomou foi a ampla automação da fase de treinamento em vários estágios das máquinas de automação. De acordo com o Financial Times (FT), 11 – A “grande inovação” do DeepSeek é minimizar o uso de trabalho humano na “rotulação” correta dos dados. Essa técnica, que é usada na fase final do treinamento e é conhecida na indústria como “aprendizagem por reforço a partir do feedback humano” (RLHF), é cara e demorada, de acordo com o FT, pois requer um “pequeno exército de rotuladores de dados”. 12 – Os trabalhadores diaristas da era da IA, que recebem, em sua maioria, salários por hora inferiores a dois dólares americanos e são recrutados principalmente em regiões periféricas como América Latina ou África, passam o dia de trabalho repetidamente rotulando dados digitais para a IA – não muito diferente dos captchas em semáforos, bicicletas ou cães que costumavam ser solicitados ao digitar senhas.
E esses empregos miseráveis, que somam centenas de milhares, por meio de cuja exploração, sob a RLHF, a indústria de alta tecnologia do século XXI está, de certa forma, revivendo o século XVIII, logo se tornarão obsoletos. De acordo com o FT, o DeepSeek foi capaz de automatizar o “aprendizado por reforço” por meio de mecanismos de recompensa digital que são ativados quando o sistema de IA dá respostas corretas. Quando esse processo é repetido com frequência suficiente, o grande modelo de linguagem começa a “resolver problemas espontaneamente, sem supervisão humana”, quando um ponto crítico é excedido, disse. Um “momento aha” ocorreu, a partir do qual o DeepSeek começou a avaliar as perguntas novamente e a adaptar seu tempo de computação às diferentes perguntas, de acordo com o jornal financeiro, citando relatórios de pesquisadores chineses de IA. Para replicar isso, não são mais necessários trabalhadores de IA, mas sim “seu modelo muito forte e pré-treinado” e uma infraestrutura muito boa para realizar “o processo de aprendizado reforçado em escala”.
A IA também come seus pobres filhos. Mas os assalariados na periferia do sistema mundial capitalista tardio, que agora correm o risco de perder seus empregos precários e miseráveis, logo serão seguidos pela obsolescência por milhões de empregados nos centros. Embora a IA revolucione radicalmente as sociedades dos centros tanto quanto a Internet e a primeira fase da digitalização, ela não produzirá um boom econômico de longo prazo no sentido de um novo regime de acumulação que exploraria o trabalho em grande escala no processo de produção de capital.
O oposto será o caso. A dessubstancialização do capital e o deslocamento do trabalho assalariado da produção de commodities e do setor de serviços continuarão a progredir. Portanto, os temores de um colapso na demanda por chips de IA são infundados; pelo menos a Nvidia continuará a desfrutar de uma demanda saudável. Onde quer que “hoje as pessoas rotineiras ainda estejam competindo para apertar os mesmos botões repetidamente” (FAZ), a pressão mediada pelo mercado para a racionalização prevalecerá primeiro. 13 As reduções de preços para unidades de treinamento para grandes modelos de linguagem só levarão a uma adaptação acelerada dessa tecnologia no processo de valorização do capital, que já conseguiu manter sua existência zumbi por décadas apenas graças à produção de demanda gerada por crédito e capital fictício nos mercados financeiros mundiais. O último eco dessa bolha econômica global da era neoliberal em declínio é a bolha da IA nos EUA.
Em:https://www.konicz.info/2025/02/16/die-ki-revolution-frisst-ihre-kinder/?fbclid=IwY2xjawIfc2FleHRuA2FlbQIxMQABHYKFmJ3Uo_Yb3VVjCNqZ2uSlpfhkDuLaeX-gtHR9g3nY58adiuRDBgudvA_aem_RUWMGMicFw9sVS8jykjYIQ
Eu financio meu trabalho principalmente por meio de doações. Se você gosta dos meus textos, você é bem-vindo para participar – seja via Patreon, via Substack, ou por transferência bancária direta após consulta via e-mail: