前不久Google大善人发布了Gemma3开源(大)模型,其中270M的版本非常吸引人。与之前动辄几十G几百G的开源大模型相比(不考虑2bit瘸腿量化),在个人设备上部署私有化AI终于成为可能。

楼主用前上个月买的阿三4c6g amd小鸡试了一下,it_Q8_0量化版本可以流畅运行(模型实际292 MB),相比于it_Q6_K量化版本,Q8还会使用emoj:

(没想到Gemma3中文能力居然还算理想,隔壁FB号称投入数亿的Llama2的中文能力可是跟我的德语水平一样)

唯一美中不足是量化版本数学处理能力堪忧:

(其实长文本也是,聊天一长就开始胡说八道)

📢:原始模型才500M还要什么自行车,巨硬的Phi-3-mini还得1G以上呢

评价:可玩性强,期待Gemini-3