Spusť 70B inferenci s jednou 4GB GPU