Meta推出开源大模型Llama 3

2024-04-19 12:30

中文 EN

当地时间4月18日，AI领域迎来重磅消息，Meta正式发布了人们等待已久的开源大模型Llama 3。马克·扎克伯格表示，Meta提供的生成式AI能力在免费产品中性能是最强大的。该助理可以回答问题、制作动画和生成图像。 | 相关阅读（每日经济新闻）

东木

执大象天下往

从刚发出的博客来看，Llama 3已帮Meta重夺开源大模型的魁首，并无限接近或者超过GPT、Gemini和Claude等闭源大模型。

这个消息的振奋程度，对于AI圈来说，甚至不亚于所谓的GPT4.5。毕竟，meta 才是真正的那个"OpenAI。有多少大模型的生态，是建立在Llama上的，大家都懂。

这次还是meta的老规矩，虽然写的是特定条件下商业使用，但是基本等于完全免费商用了。而且这次开源了2个模型，8B和70B。我看网上博客里的评测结果显示：8B版本优于Mistral 7B和Gemma 7B，70B版本优于Gemini Pro 1.5和Claude 3 Sonnet。

不过Llama 3也存在两个可提升的点，一个是知识库时间，一个是上下文长度。知识库这块，8B只到2023年3月，70B到了2023年12月。而上下文长度更是只有8K。知识库的时间还好说，但是这个上下文长度，在现在动不动200k的时代里，属实是有点不够了。

不过，瑕不掩瑜，估计接下来学术界做模型训练相关的实验大多会切换到Llama 3的8B版本，而等400B版本出来后如果效果接近甚至超过GPT-4，大家在数据标注和评测等难任务上也会逐渐倒向免费的Llama系列。让子弹再飞一会儿。

撰写或查看更多观点, 请打开财富Plus APP