立即打开
东木评《Meta推出开源大模型Llama 3》
东木
执大象 天下往

从刚发出的博客来看,Llama 3已帮Meta重夺开源大模型的魁首,并无限接近或者超过GPT、Gemini和Claude等闭源大模型。

这个消息的振奋程度,对于AI圈来说,甚至不亚于所谓的GPT4.5。毕竟,meta 才是真正的那个"OpenAI。有多少大模型的生态,是建立在Llama上的,大家都懂。

这次还是meta的老规矩,虽然写的是特定条件下商业使用,但是基本等于完全免费商用了。而且这次开源了2个模型,8B和70B。我看网上博客里的评测结果显示:8B版本优于Mistral 7B和Gemma 7B,70B版本优于Gemini Pro 1.5和Claude 3 Sonnet。

不过Llama 3也存在两个可提升的点,一个是知识库时间,一个是上下文长度。知识库这块,8B只到2023年3月,70B到了2023年12月。而上下文长度更是只有8K。知识库的时间还好说,但是这个上下文长度,在现在动不动200k的时代里,属实是有点不够了。

不过,瑕不掩瑜,估计接下来学术界做模型训练相关的实验大多会切换到Llama 3的8B版本,而等400B版本出来后如果效果接近甚至超过GPT-4,大家在数据标注和评测等难任务上也会逐渐倒向免费的Llama系列。让子弹再飞一会儿。 #Meta推出开源大模型Llama 3#

572024-04-19 12:04 · 著作权归作者所有,未经授权禁止转载
最新:
热读文章
热门视频
扫描二维码下载财富APP
>