Kopiering og justering av amd_uop_matmul.py for 4090 bør gi deg $ 300 GEMM hastighetspremie. Det er så enkelt at AI (nesten) kan gjøre det.