使用UpHub AI在纯CPU上运行Gemma3 4B多模态大模型(Vision)对图片进行描述 Gemma3 4B是Google公司发布的开源、多模态大模型(Vision),它可以对图片进行描述和分析,比如可用于辅助分析X光片、风景等。 在UpHub AI中,如果运行了Google的Gemma 3(4B或12B或27B),可以在对话中提交一张图片,然后提问“请使用XXX语言描述这张图片。”,为了让AI使用使用特定的语言描述,在提问时建议加入希望的语言。比如:请使用中文描述这张图片。否则它可能是纯英文描述。 下载本地大模型部署推理软件UpHub AI,请点击这里。