微软新出击!iPhone上跑得飞起的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

阿菜 热点要闻 2024-04-23 15:45:09

刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的Phi-3-mini在iPhone14pro和iPhone15使用的苹果A16芯片上跑到每秒12token。这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。

Phi-3系列不仅有Phi-3-mini,还有Phi-3-small和Phi-3-medium。Phi-3-small参数为7B,支持多语言,并增加了多语种数据;Phi-3-medium参数为14B,在多项测试中已超越了GPT-3.5和Mixtral8x7b MoE。

微软团队在训练模型时注重数据的质量,利用大语言模型生成合成数据,并严格过滤高质量数据,让中小模型的能力大幅提升。Phi-3系列投喂了多达3.3万亿token的训练数据,强化了数据的“教育水平”,提升了对话和安全性。

尽管Phi-3系列表现出色,但也存在一些弱点,比如模型本身参数存储能力有限。微软团队计划继续增强小模型的多语言能力和安全性等指标。

不少网友认为,微软的小模型已经超过了ChatGPT,OpenAI需要赶快推出GPT-3.5的继任者。微软研究院团队在小模型+数据工程领域铁了心要走下去,未来将继续增强小模型的能力。