Gemma-3-270m-it量化版本部署体验-墙外贴吧

前不久Google大善人发布了Gemma3开源(大)模型，其中270M的版本非常吸引人。与之前动辄几十G几百G的开源大模型相比（不考虑2bit瘸腿量化），在个人设备上部署私有化AI终于成为可能。

楼主用前上个月买的阿三4c6g amd小鸡试了一下，it_Q8_0量化版本可以流畅运行（模型实际292 MB），相比于it_Q6_K量化版本，Q8还会使用emoj：

（没想到Gemma3中文能力居然还算理想，隔壁FB号称投入数亿的Llama2的中文能力可是跟我的德语水平一样）

唯一美中不足是量化版本数学处理能力堪忧：

（其实长文本也是，聊天一长就开始胡说八道）

📢：原始模型才500M还要什么自行车，巨硬的Phi-3-mini还得1G以上呢

评价：可玩性强，期待Gemini-3

Gemma-3-270m-it量化版本部署体验