Com o rápido crescimento das aplicações de IA, lideradas por modelos como o ChatGPT, a procura por poder computacional disparou. Para atender às crescentes demandas computacionais da era da IA, o Grupo H3C, sob a égide do Tsinghua Unigroup, revelou recentemente 11 novos produtos das séries H3C UniServer G6 e HPE Gen11 no 2023 NAVIGATE Leader Summit. Esses novos produtos de servidor criam uma matriz abrangente para IA em vários cenários, fornecendo uma poderosa plataforma subjacente para lidar com dados massivos e algoritmos de modelo, além de garantir um amplo fornecimento de recursos de computação de IA.
Matriz diversificada de produtos para atender às diversas necessidades de computação de IA
Como líder em computação inteligente, o Grupo H3C está profundamente engajado na área de IA há muitos anos. Em 2022, a H3C alcançou a maior taxa de crescimento no mercado chinês de computação acelerada e acumulou um total de 132 primeiras classificações mundiais no benchmark de IA de renome internacional MLPerf, demonstrando sua forte experiência e capacidades técnicas.
Aproveitando uma arquitetura de computação avançada e recursos de gerenciamento de energia de computação inteligente construídos com base na computação inteligente, a H3C desenvolveu o carro-chefe da computação inteligente H3C UniServer R5500 G6, projetado especificamente para treinamento de modelos em larga escala. Eles também introduziram o H3C UniServer R5300 G6, um mecanismo de computação híbrido adequado para cenários de inferência/treinamento em grande escala. Esses produtos atendem ainda mais aos diversos requisitos de computação em diferentes cenários de IA, fornecendo cobertura abrangente de computação de IA.
Carro-chefe da computação inteligente projetada para treinamento de modelos em larga escala
O H3C UniServer R5500 G6 combina resistência, baixo consumo de energia e inteligência. Em comparação com a geração anterior, oferece três vezes mais poder computacional, reduzindo o tempo de treinamento em 70% para cenários de treinamento de modelo em grande escala GPT-4. É aplicável a vários cenários de negócios de IA, como treinamento em larga escala, reconhecimento de fala, classificação de imagens e tradução automática.
Força: O R5500 G6 suporta até 96 núcleos de CPU, proporcionando um aumento de 150% no desempenho do núcleo. Ele é equipado com o novo módulo NVIDIA HGX H800 de 8 GPU, fornecendo 32 PFLOPS de poder computacional, resultando em uma melhoria de 9x na velocidade de treinamento de IA de modelo em grande escala e uma melhoria de 30x no desempenho de inferência de IA de modelo em grande escala. Além disso, com o suporte de redes PCIe 5.0 e 400G, os usuários podem implantar clusters de computação de IA de alto desempenho, acelerando a adoção e aplicação de IA nas empresas.
Inteligência: O R5500 G6 suporta duas configurações de topologia, adaptando-se de forma inteligente a vários cenários de aplicações de IA e acelerando aplicações de aprendizagem profunda e computação científica, melhorando significativamente a utilização de recursos da GPU. Graças ao recurso de GPU de múltiplas instâncias do módulo H800, um único H800 pode ser dividido em 7 instâncias de GPU, com a possibilidade de até 56 instâncias de GPU, cada uma com recursos independentes de computação e memória. Isto aumenta significativamente a flexibilidade dos recursos de IA.
Baixa pegada de carbono: O R5500 G6 oferece suporte total ao resfriamento líquido, incluindo resfriamento líquido para CPU e GPU. Com um PUE (Power Usage Effectiveness) inferior a 1,1, permite uma “computação fria” no calor do aumento computacional.
Vale ressaltar que o R5500 G6 foi reconhecido como um dos “10 melhores servidores de alto desempenho de 2023″ no “2023 Power Ranking for Computational Performance” após seu lançamento.
Mecanismo de computação híbrida para correspondência flexível de demandas de treinamento e inferência
O H3C UniServer R5300 G6, como servidor de IA de próxima geração, oferece melhorias significativas nas especificações de CPU e GPU em comparação com seu antecessor. Ele possui excelente desempenho, topologia inteligente e recursos integrados de computação e armazenamento, tornando-o adequado para treinamento de modelo de aprendizagem profunda, inferência de aprendizagem profunda e outros cenários de aplicação de IA, combinando com flexibilidade as necessidades de treinamento e computação de inferência.
Desempenho excepcional: O R5300 G6 é compatível com a última geração de GPUs NVIDIA de nível empresarial, proporcionando uma melhoria de desempenho de 4,85x em comparação com a geração anterior. Ele oferece suporte a vários tipos de placas de aceleração de IA, como GPUs, DPUs e NPUs, para atender aos requisitos heterogêneos de poder de computação da IA em diferentes cenários, capacitando a era da inteligência.
Topologia inteligente: O R5300 G6 oferece cinco configurações de topologia de GPU, incluindo HPC, IA paralela, IA serial, acesso direto de 4 placas e acesso direto de 8 placas. Essa flexibilidade sem precedentes aumenta muito a adaptabilidade a diferentes cenários de aplicativos do usuário, aloca recursos de forma inteligente e impulsiona uma operação eficiente de poder de computação.
Computação e armazenamento integrados: o R5300 G6 acomoda com flexibilidade placas de aceleração de IA e NICs inteligentes, combinando recursos de treinamento e inferência. Ele suporta até 10 GPUs de largura dupla e 24 slots de disco rígido LFF (Large Form Factor), permitindo treinamento e inferência simultâneos em um único servidor e fornecendo um mecanismo de computação econômico para ambientes de desenvolvimento e teste. Com capacidade de armazenamento de até 400 TB, atende totalmente aos requisitos de espaço de armazenamento de dados de IA.
Com o boom da IA avançando, o poder da computação está sendo constantemente remodelado e desafiado. O lançamento dos servidores de IA da próxima geração marca outro marco no compromisso do Grupo H3C com a tecnologia de “inteligência inerente” e seu impulso contínuo para a evolução da computação inteligente.
Olhando para o futuro, guiado pela estratégia “Cloud-Native Intelligence”, o Grupo H3C adere ao conceito de “pragmatismo meticuloso, dotando a era de inteligência”. Eles continuarão a cultivar o solo fértil da computação inteligente, a explorar cenários de aplicação de IA de nível profundo e a acelerar a chegada de um mundo inteligente com poder de computação adaptável e pronto para o futuro.
Horário da postagem: 04/07/2023