您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
业界 正文
发私信给董子博
发送

0

Llama 3受美国市场冷落,开源模型还香吗?

本文作者:董子博 2024-08-25 13:12
导语:据报道,Llama3.1上线一个月后,下载量仅为360万,比上一代模型降低了40%。

Llama 3受美国市场冷落,开源模型还香吗?

作为开源大模型的顶梁柱,Llama3正在遭遇冷落。 

近日,据美国媒体The Information报道,Llama在全球最大的云计算服务供应商亚马逊的AWS平台上备受冷落,与之相对,Anthropic的闭源模型Claude才是该平台上最受欢迎的模型。报道称,在另一家云平台微软Azure上,Llama也并非微软的销售首选。

 Llama 3受美国市场冷落,开源模型还香吗?

一个月前,Meta发布了最新的开源大模型Llama 3.1 405B,在测试中性能追平GPT-4o。可惜,测评中的优异成绩没能反映在市场上,据报道,Llama3.1上线一个月后,下载量仅为360万,比上一代模型降低了40%。

门槛高效率低,开源模型“才是最贵的”

这一现象早有预兆。早在今年4月,Llama 3推出70B和400B模型之后,就有开发者反馈“免费的才是最贵的”,Llama 3“根本用不起”的现象。

 当时,一位美国AI创业者Arsenii Shatokhin的采访视频在网上流传,这位创业者表示,“我们只有一两个客户有足够资源,来精调或运行700亿参数的Llama开源模型。”

Llama 3受美国市场冷落,开源模型还香吗?

访谈中,这位AI智能体公司VRSEN的创始人指出,企业自己运行开源大模型的效率远低于使用闭源大模型。他分析出两个原因:

1) 首先,开源模型多数需要企业自己下载后运行,随着模型参数向百亿、千亿不断攀升,对本地IT设施要求也随之提高,大量企业并不具备与之匹配的充足资源;

2) 其次,与做好精调和商业化适配的闭源模型不同,如果使用开源模型,企业还要再做优化,需要公司内部有足够的技术人才和技术设施,对企业的技术能力无疑是提出了更高要求。

“我们只会向具备数据专业知识的客户推销Llama,比如内部有工程师和数据科学家的公司。”据The Information报道中,微软员工这样向媒体表示。

正如百度创始人李彦宏在近期的上海世界人工智能大会上表示,开源模型在学术研究、教学领域有一定价值,能够让学术界更熟悉大模型的工作机制、形成理论;但在大多数的应用场景中,开源模型并不合适,尤其是在激烈的商业化竞争中,只有闭源模型,才能让企业的业务效率更高、成本更低。

缺乏商业验证,开源模型将越来越落后

近期,开源和闭源模型之争一直备受行业关注,尤其是在时时更新的“测评跑分”上,每当新一代大模型诞生、领跑测评榜时,就会爆出“开源大模型超越闭源”或“闭源大模型保持领先”的各类说法。

但迄今为止,闭源模型性能整体领先于开源。在斯坦福大学7月公布的大规模多任务语言理解 (MMLU)测试排名中,排名前十的模型中,仅有Llama 3.1为开源,其余9款上榜模型均为闭源。

Llama 3受美国市场冷落,开源模型还香吗?

某种程度上,这与开源模型并非“真开源”有关。有多位开发者表示,当前的开源大模型并非与开源软件不同,仅仅是开放了参数和调用接口,在使用中既存在需要SFT精调、优化的问题,还无法像真开源的Linux那样看到底层代码。

因此,大模型的开源并不能带来模型效果的提高。“开源模型和闭源模型相比,存在性能差距,这种差距将继续扩大。”谷歌前CEO施密特在采访中指出。据介绍,谷歌投资的法国Mistral公司此前推出过开源模型,但从今年2月起,已经转向了闭源模型。

在实用性方面,伴随着Llama 3的“叫好不叫座”,开源模型更是与闭源模型拉开了差距。有多位开发者表示,大模型的进步与实际应用密不可分,只有真实应用才能不断为模型提供反馈,让模型在响应速度、参数大小等方面不断优化。

随着商业化的失速,缺乏商业验证的开源模型,势必会逐步掉队。


雷峰网(公众号:雷峰网)


雷峰网版权文章,未经授权禁止转载。详情见转载须知

分享:
相关文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说