Meta发布开源Llama 3模型

全球科技巨头Meta于近日正式推出了两个版本的开源Llama 3模型——Llama 3 8B和Llama 3 70B,这一创新成果不仅为外部开发者提供了强大的工具,更在业界引发了广泛关注。

据了解,Llama 3模型是在24K GPU集群上经过精心训练而成的,使用了高达15T的数据量,确保了其强大的性能和广泛的应用潜力。该模型不仅提供了预训练版本,还提供了指令微调版本,以满足不同领域的需求。在广泛的行业基准测试中,Llama 3展现出了卓越的性能,达到了SOTA水平,为人工智能的应用开辟了新的道路。

值得一提的是,Llama 3在发布后不久就迅速登顶了全球开源AI社区Hugging Face排行榜,这一成绩不仅彰显了其强大的实力,也进一步证明了Meta在人工智能领域的领先地位。Meta的CEO马克·扎克伯格对Llama 3给予了高度评价,他表示:“Llama 3无疑是市场上目前免费提供的同类产品中最智能、性能最出色的大模型。”

基准测试结果显示,Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试的得分远超 Google Gemma 7B 以及 Mistral 7B Instruct。用扎克伯格的话来说,最小的 Llama 3 基本上与最大的 Llama 2 一样强大。

Llama 3 70B 则跻身于顶尖 AI 模型的行列,整体表现全面碾压 Claude 3 大杯,与 Gemini 1.5 Pro 相比则是互有胜负。

Meta AI 首席科学家、图灵奖得主 Yann LeCun 不仅为 Llama 3 的发布摇旗呐喊,并再次预告未来几个月将推出更多版本。就连马斯克也现身于该评论区,用一句简洁而含蓄的「Not bad 不错」,表达了对 Llama 3 的认可和期待。

英伟达高级科学家 JIm Fan 则将注意力投向了即将推出的 Llama 3 400B+,在他看来,Llama 3 的推出已经脱离了技术层面的进步,更是开源模型与顶尖闭源模型并驾齐驱的象征。



微信扫描下方的二维码阅读本文


已发布

分类

来自

标签:

评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注