视觉拼图后训练改善了多语言大模型(MLLMs)