我們能否建造出能以今天 GPU 能源的 10,000 倍更少的能量生成高品質圖像的 AI 晶片? 研究論文:《一種高效的概率硬體架構用於擴散類模型》 這項工作揭示了一種完整的 CMOS(全晶體管)架構,能原生運行擴散風格的生成模型——不是使用耗能的神經網絡,而是使用基於能量的概率取樣。通過鏈接緊湊的去噪模型(DTMs)並利用標準 65 nm 晶片中的物理隨機性,該系統生成的圖像與 GPU 相當,但每個 Fashion-MNIST 樣本僅消耗 1.6 奈焦耳——將能量削減了四個數量級。通過一種新穎的自適應懲罰來穩定訓練,該方法可擴展到毫米級的矽片,而無需特殊硬體。 結果:在約 10,000 倍更低的能量下,質量匹配或超越 GAN/VAE/擴散;70×70 網格,8 層堆疊,開源工具已發布。 在這裡獲取完整分析: // alpha identified // $yne