DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Nous annonçons nos premiers travaux sur l’inférence FP4 pour les LLM ! - QuTLASS : prise en charge du noyau de faible précision pour les GPU Blackwell - FP-Quet : un harnais de quantification flexible pour Lama/Qwen Nous atteignons une accélération de 4x par rapport à BF16, avec une bonne précision grâce à la micro-mise à l’échelle MXFP4 + rotations Hadamard fusionnées.

22,57K

Meilleurs

Classement

Favoris

Tendance on-chain

Tendance sur X

Récents financements de premier plan

Les plus notables