La formación posterior de Visual Jigsaw mejora los MLLMs