Notre puce d'inférence Maia 200, annoncée aujourd'hui, est le silicium de première partie le plus performant de tous les hyperscalers. 3 fois la performance FP4 de l'Amazon Trainium v3, et une performance FP8 supérieure à celle du TPUv7 de Google.