Kjør en 70B-inferens med ett enkelt 4GB GPU