Voer een 70B inferentie uit met een enkele 4GB GPU