Vazamento do DeepSeek R2 revela impulso de 512 PetaFLOPS em IA doméstica

DeepSeek Lança o Poderoso Modelo R2 de IA

A DeepSeek, que já chamou atenção no mundo da inteligência artificial com seu modelo R1, está se preparando para o lançamento do aprimorado modelo DeepSeek R2. Essa informação vem de uma fonte confiável no setor de IA, o @iruletheworldmo no X.

Tecnologia de Ponta

O modelo R2 é equipado com clusters de chips Ascend 910B da Huawei, que talvez sejam combinados com o Huawei Atlas 900, além do framework de treinamento distribuído desenvolvido internamente pela DeepSeek. O R2 promete uma utilização impressionante de 82% desses aceleradores, resultando em 512 PetaFLOPS de desempenho em FP16. Para contextualizar, isso representa cerca de 91% do que os clusters A100 da NVIDIA conseguem, mas, surpreendentemente, a DeepSeek afirma que os custos de treinamento por unidade são reduzidos em impressionantes 97,3%.

Um Ecossistema Colaborativo

Por trás do R2, existe um ecossistema de parcerias muito bem estruturado:

  • Tuowei Information: um dos principais fabricantes de equipamentos originais (OEM) da linha Ascend, que gerencia mais da metade dos pedidos de hardware de supercomputing da DeepSeek.
  • Sugon: fornece racks de servidores resfriados a líquido, suportando até 40 kW por unidade para garantir eficiência.
  • Innolight: seus transceivers de fotônica de silício ajudam a reduzir o consumo de energia em 35% em comparação com soluções tradicionais.

Operações Geográficas e Infraestrutura

As operações da DeepSeek estão divididas em importantes centros:

  • Runjian Shares: administra o centro de supercomputação no Sul da China, com contratos anuais que superam ¥5 bilhões.
  • Zhongbei Communications: mantém uma reserva de 1.500 PetaFLOPS no Noroeste para atender demandas de pico.

Software e Implementação

O DeepSeek R2 já permite a implementação privada e o ajuste fino, apoiando iniciativas de cidades inteligentes em 15 províncias através da plataforma Yun Sai Zhilian. O nó no Norte da China, supervisionado pela Yingbo Digital da Runjian Shares, adiciona mais 3.000 PetaFLOPS ao sistema.

Alternativa às Soluções Atuais

Se a demanda por poder computacional aumentar, a Huawei está pronta para lançar seu sistema CloudMatrix 384 como uma alternativa doméstica ao NVIDIA GB200 NVL72. O CloudMatrix 384 conta com 384 aceleradores Ascend 910C, oferecendo 1,7 vezes mais PetaFLOPS e 3,6 vezes a capacidade total de HBM do cluster NVL72, embora consuma quase quatro vezes mais energia.

Expectativas para o Lançamento

O lançamento do modelo R2 está previsto para ser realizado sem contratempos, e estamos ansiosos pelo anúncio oficial e pelos benchmarks que mostrarão o real desempenho desta inovadora tecnologia.

Assista ao vídeo aqui para mais detalhes sobre o DeepSeek R2 e suas capacidades impressionantes.


A DeepSeek está, sem dúvida, desbravando o futuro da computação e muito nos ensinará sobre a evolução da inteligência artificial nos próximos meses.

Duilio Luz
Duilio Luz um gamer muito conhecido no youtube, com o canal Dluz Games com dicas e tutoriais sobre jogos mobile e de pc. Apaixonado por games e animes.

Últimos Artigos

Veja mais