使用UpHub AI在纯CPU上运行Gemma3 4B多模态大模型（Vision）对图片进行描述

Gemma3 4B是Google公司发布的开源、多模态大模型（Vision），它可以对图片进行描述和分析，比如可用于辅助分析X光片、风景等。

在UpHub AI中，如果运行了Google的Gemma 3（4B或12B或27B），可以在对话中提交一张图片，然后提问“请使用XXX语言描述这张图片。”，为了让AI使用使用特定的语言描述，在提问时建议加入希望的语言。比如：请使用中文描述这张图片。否则它可能是纯英文描述。

使用Gemma3 4B Vision多模态大模型描述图片（UpHub AI中运行）