Startup que cresce muito, cresce 10x ao ano. Por isso as 80x que a Anthropic cresceu só no primeiro trimestre é algo tão assustador invejável. Mas se a receita cresce, a demanda vai junto e aumentar a infra é BEM mais difícil que apertar um “sign up”. Para sustentar, a saída foi pedir socorro para quem tem servidores, chips e energia sobrando: a xAI.
A Anthropic assinou um contrato para usar todo o poder computacional da SpaceXAI (fruto da fusão da xAI com a SpaceX) e imediatamente anunciou que:
(i) dobrou o limite de uso de 5 horas do Claude Code;
(ii) removeu as restrições de uso durante horários de pico e;
(iii) aumentou os limites da API do modelo Opus.
A xAI foi a última a entrar na corrida da IA (é o mais novo dos labs), mas já entrou sabendo que os finalistas seriam aqueles com maior poder computacional. Logo, a construção desses data centers virou a principal obsessão da SpaceXAI:
- Colossus 1: os especialistas disseram que levaria 24 meses para construí-lo. A xAI levou apenas 122 dias e hoje ele é considerado o data center de larga escala mais rápido já construído – com 300 MW e 220.000 GPUs Nvidia.
- Colossus 2: também construído no tempo recorde de seis meses (comparado aos +15 meses das concorrentes), a xAI precisou importar turbinas a gás de outro estado para abastecer esse prédio massivo com +1 GW e ~555.000 GPUs Nvidia.
- Colossus 3: vai usar o mesmo playbook dos demais (buscar por fábricas em desuso, gerar energia localmente, usar infra temporária para reduzir custos e expandir o mais rápido possível) para chegar a 2 GW de capacidade com +1 milhão de GPUs Nvidia.
Para Musk, o inimigo do seu inimigo é seu amigo… E se ele levar grana, então!
Enquanto a SpaceXAI usa o Colossus 2 para treinar os novos modelos do Grok, aproveita e transforma a ociosidade do Colossus 1 em uma fonte de renda extra alugando a capacidade excedente para a Anthropic – que estava faminta por mais servidores para inferência.
| O gargalo de crescimento… |
| → das startups de IA não é atrair mais clientes, é servi-los com mais poder computacional. → dos data centers de IA não é atrair mais clientes, é comprar mais chips e gerar mais energia. → das fabricantes de chips de IA não é atrair mais clientes, é acesso a memórias e outras matérias primas. |
| Ou seja: a demanda existe (vai aumentar) e a oferta está limitada mais por infraestrutura física e processo regulatório de aprovações do que interesse de compra dos usuários. |
Fonte: newsletter@mail.techdrop.news