4090 のamd_uop_matmul.pyをコピーして微調整すると、300 ドルの GEMM スピード バウンティを獲得できるはずです。AIが(ほぼ)できるほど簡単です。