Meta发布开源Llama 3模型

全球科技巨头Meta于近日正式推出了两个版本的开源Llama 3模型——Llama 3 8B和Llama 3 70B，这一创新成果不仅为外部开发者提供了强大的工具，更在业界引发了广泛关注。

据了解，Llama 3模型是在24K GPU集群上经过精心训练而成的，使用了高达15T的数据量，确保了其强大的性能和广泛的应用潜力。该模型不仅提供了预训练版本，还提供了指令微调版本，以满足不同领域的需求。在广泛的行业基准测试中，Llama 3展现出了卓越的性能，达到了SOTA水平，为人工智能的应用开辟了新的道路。

值得一提的是，Llama 3在发布后不久就迅速登顶了全球开源AI社区Hugging Face排行榜，这一成绩不仅彰显了其强大的实力，也进一步证明了Meta在人工智能领域的领先地位。Meta的CEO马克·扎克伯格对Llama 3给予了高度评价，他表示：“Llama 3无疑是市场上目前免费提供的同类产品中最智能、性能最出色的大模型。”

基准测试结果显示，Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试的得分远超 Google Gemma 7B 以及 Mistral 7B Instruct。用扎克伯格的话来说，最小的 Llama 3 基本上与最大的 Llama 2 一样强大。

Llama 3 70B 则跻身于顶尖 AI 模型的行列，整体表现全面碾压 Claude 3 大杯，与 Gemini 1.5 Pro 相比则是互有胜负。

Meta AI 首席科学家、图灵奖得主 Yann LeCun 不仅为 Llama 3 的发布摇旗呐喊，并再次预告未来几个月将推出更多版本。就连马斯克也现身于该评论区，用一句简洁而含蓄的「Not bad 不错」，表达了对 Llama 3 的认可和期待。

英伟达高级科学家 JIm Fan 则将注意力投向了即将推出的 Llama 3 400B+，在他看来，Llama 3 的推出已经脱离了技术层面的进步，更是开源模型与顶尖闭源模型并驾齐驱的象征。

微信扫描下方的二维码阅读本文

评论

发表回复 取消回复

发表回复取消回复