东木评《Meta推出开源大模型Llama 3》 - 观点

东木

从刚发出的博客来看，Llama 3已帮Meta重夺开源大模型的魁首，并无限接近或者超过GPT、Gemini和Claude等闭源大模型。

这个消息的振奋程度，对于AI圈来说，甚至不亚于所谓的GPT4.5。毕竟，meta 才是真正的那个"OpenAI。有多少大模型的生态，是建立在Llama上的，大家都懂。

这次还是meta的老规矩，虽然写的是特定条件下商业使用，但是基本等于完全免费商用了。而且这次开源了2个模型，8B和70B。我看网上博客里的评测结果显示：8B版本优于Mistral 7B和Gemma 7B，70B版本优于Gemini Pro 1.5和Claude 3 Sonnet。

不过Llama 3也存在两个可提升的点，一个是知识库时间，一个是上下文长度。知识库这块，8B只到2023年3月，70B到了2023年12月。而上下文长度更是只有8K。知识库的时间还好说，但是这个上下文长度，在现在动不动200k的时代里，属实是有点不够了。

不过，瑕不掩瑜，估计接下来学术界做模型训练相关的实验大多会切换到Llama 3的8B版本，而等400B版本出来后如果效果接近甚至超过GPT-4，大家在数据标注和评测等难任务上也会逐渐倒向免费的Llama系列。让子弹再飞一会儿。 #Meta推出开源大模型Llama 3#

572024-04-19 12:04 · 著作权归作者所有，未经授权禁止转载