前不久Google大善人发布了Gemma3开源(大)模型,其中270M的版本非常吸引人。与之前动辄几十G几百G的开源大模型相比(不考虑2bit瘸腿量化),在个人设备上部署私有化AI终于成为可能。
楼主用前上个月买的阿三4c6g amd小鸡试了一下,it_Q8_0量化版本可以流畅运行(模型实际292 MB),相比于it_Q6_K量化版本,Q8还会使用emoj:
(没想到Gemma3中文能力居然还算理想,隔壁FB号称投入数亿的Llama2的中文能力可是跟我的德语水平一样)
唯一美中不足是量化版本数学处理能力堪忧:
(其实长文本也是,聊天一长就开始胡说八道)
📢:原始模型才500M还要什么自行车,巨硬的Phi-3-mini还得1G以上呢
评价:可玩性强,期待Gemini-3
评论 (0)