DeepSeek Lança o Poderoso Modelo R2 de IA
A DeepSeek, que já chamou atenção no mundo da inteligência artificial com seu modelo R1, está se preparando para o lançamento do aprimorado modelo DeepSeek R2. Essa informação vem de uma fonte confiável no setor de IA, o @iruletheworldmo no X.
Tecnologia de Ponta
O modelo R2 é equipado com clusters de chips Ascend 910B da Huawei, que talvez sejam combinados com o Huawei Atlas 900, além do framework de treinamento distribuído desenvolvido internamente pela DeepSeek. O R2 promete uma utilização impressionante de 82% desses aceleradores, resultando em 512 PetaFLOPS de desempenho em FP16. Para contextualizar, isso representa cerca de 91% do que os clusters A100 da NVIDIA conseguem, mas, surpreendentemente, a DeepSeek afirma que os custos de treinamento por unidade são reduzidos em impressionantes 97,3%.
Um Ecossistema Colaborativo
Por trás do R2, existe um ecossistema de parcerias muito bem estruturado:
- Tuowei Information: um dos principais fabricantes de equipamentos originais (OEM) da linha Ascend, que gerencia mais da metade dos pedidos de hardware de supercomputing da DeepSeek.
- Sugon: fornece racks de servidores resfriados a líquido, suportando até 40 kW por unidade para garantir eficiência.
- Innolight: seus transceivers de fotônica de silício ajudam a reduzir o consumo de energia em 35% em comparação com soluções tradicionais.
Operações Geográficas e Infraestrutura
As operações da DeepSeek estão divididas em importantes centros:
- Runjian Shares: administra o centro de supercomputação no Sul da China, com contratos anuais que superam ¥5 bilhões.
- Zhongbei Communications: mantém uma reserva de 1.500 PetaFLOPS no Noroeste para atender demandas de pico.
Software e Implementação
O DeepSeek R2 já permite a implementação privada e o ajuste fino, apoiando iniciativas de cidades inteligentes em 15 províncias através da plataforma Yun Sai Zhilian. O nó no Norte da China, supervisionado pela Yingbo Digital da Runjian Shares, adiciona mais 3.000 PetaFLOPS ao sistema.
Alternativa às Soluções Atuais
Se a demanda por poder computacional aumentar, a Huawei está pronta para lançar seu sistema CloudMatrix 384 como uma alternativa doméstica ao NVIDIA GB200 NVL72. O CloudMatrix 384 conta com 384 aceleradores Ascend 910C, oferecendo 1,7 vezes mais PetaFLOPS e 3,6 vezes a capacidade total de HBM do cluster NVL72, embora consuma quase quatro vezes mais energia.
Expectativas para o Lançamento
O lançamento do modelo R2 está previsto para ser realizado sem contratempos, e estamos ansiosos pelo anúncio oficial e pelos benchmarks que mostrarão o real desempenho desta inovadora tecnologia.
Assista ao vídeo aqui para mais detalhes sobre o DeepSeek R2 e suas capacidades impressionantes.
A DeepSeek está, sem dúvida, desbravando o futuro da computação e muito nos ensinará sobre a evolução da inteligência artificial nos próximos meses.