Ejecuta una inferencia de 70B con una sola GPU de 4GB