Após meses de rumores, foi confirmado que a Microsoft começará a construir seus próprios chips de IA. O primeiro deles os chips Azure Maia 100 e Cobalt 100 chegará em 2024.
Esta mudança por parte da Microsoft provavelmente visa evitar uma dependência excessiva da Nvidia, cujas GPUs H100 são comumente usadas para operar ferramentas de geração de imagens de IA e modelos de linguagem.
O chip Azure Cobalt 100 foi projetado especificamente para a Microsoft para alimentar os serviços baseados em nuvem do Azure, e seu design permitirá o controle do desempenho e do consumo de energia por núcleo.
Para este fim, a Microsoft está procurando reformular o Infraestrutura de nuvem Azure de acordo com declarações feitas pelo chefe de sistemas de hardware e infraestrutura do Azure na Microsoft, Rani Borker, em uma entrevista recente. Borker disse em parte: “Estamos repensando a infraestrutura em nuvem para a era da IA e literalmente otimizando cada camada dessa infraestrutura”.
O chip acelerador de IA Maia 100 é, como o próprio nome sugere, projetado para executar operações de IA baseadas em nuvem, como treinamento de modelos de linguagem. O chip Maia 100 está sendo testado no GPT 3.5 Turbo. Como Borkar acrescentou,
“Maia é o primeiro processador de servidor completo com refrigeração líquida construído pela Microsoft. O objetivo aqui era permitir maior densidade de servidores com maior eficiência. Como estamos reimaginando toda a pilha, pensamos propositalmente em cada camada, para que esses sistemas realmente se ajustem à nossa área atual de data center.”
Neste ponto, as especificações completas e benchmarks de desempenho dos chips Maia 100 e Cobalt 100 não foram divulgados. No entanto, já se sabe que estes chips são apenas os primeiros de uma série, e que a segunda geração dos chips Maia 100 e Cobalt 100 já está em fase de design.