Après des mois de rumeurs, il a été confirmé que Microsoft commencerait à construire ses propres puces IA. La première d'entre elles, les puces Azure Maia 100 et Cobalt 100, arrivera dans le courant de 2024.
Cette décision de la part de Microsoft vise probablement à éviter une dépendance excessive à l'égard de Nvidia, dont les GPU H100 sont couramment utilisés pour faire fonctionner les outils de génération d'images d'IA et de modèle de langage.
La puce Azure Cobalt 100 est conçue sur mesure pour que Microsoft puisse alimenter les services cloud Azure, et sa conception permettrait de contrôler les performances et la consommation d'énergie par cœur.
À cette fin, Microsoft envisage de remanier le Infrastructure cloud Azure selon les déclarations faites par le responsable des systèmes matériels et de l'infrastructure Azure chez Microsoft Rani Borker dans une récente interview. Borker a déclaré en partie: « Nous repensons l’infrastructure cloud pour l’ère de l’IA et optimisons littéralement chaque couche de cette infrastructure. »
La puce accélératrice Maia 100 AI est, comme son nom l'indique, conçue pour exécuter des opérations d'IA basées sur le cloud telles que la formation de modèles de langage. La puce Maia 100 est actuellement testée sur GPT 3.5 Turbo. Comme l'a ajouté Borkar,
« Maia est le premier processeur serveur complet refroidi par liquide construit par Microsoft. L’objectif ici était de permettre une plus grande densité de serveurs avec une efficacité plus élevée. Parce que nous réinventons l’ensemble de la pile, nous réfléchissons délibérément à chaque couche, de sorte que ces systèmes vont réellement s’adapter à l’empreinte actuelle de notre centre de données.
À ce stade, les spécifications complètes et les références de performances des puces Maia 100 et Cobalt 100 n'ont pas été rendues publiques. Cependant, on sait déjà que ces puces ne sont que les premières d’une série et que la deuxième génération des puces Maia 100 et Cobalt 100 est déjà en phase de conception.