AI“源神”启动！影响多大？

开源还是闭源(yuán)？这是属于大模型的时代之问。

今年(nián)年(nián)初，埃隆·马斯克在对OpenAI及其(qí)CEO萨姆·奥特曼提起诉讼时，就对OpenAI逐渐不公开其模型研究相关细(xì)节的行为(wèi)大加(jiā)谴外资公募最新持仓曝光！贝莱德、富达第一大重仓都是它责。“时至今日(rì)，OpenAI公司(sī)网站还(hái)宣称，它的宗旨是确保通用人工智能造福全(quán)人类。然而，在现实中，OpenAI已(yǐ)经转变为科(kē)技巨头微软事实上的闭源子公司。”这位曾经的(de)OpenAI联合创始人如(rú)此(cǐ)表示(shì)。

OpenAI不够“Open”，Meta却“Open”了自己最新的开源人工(gōng)智能模型。

4月(yuè)18日，Meta 发布了其最新版本的开源(yuán)大模型 Llama 3，引(yǐn)起开源AI社区的一(yī)阵欢呼。巧合(hé)的是，Llama 3发(fā)布当天(tiān)正好是AI领域顶尖学者、AI开源倡导者吴恩达的生日。“（Llama 3是）至(zhì)今为止最好的礼物，谢感谢Meta！”他说(shuō)。

行至2024，开闭(bì)源之争日渐白热化。闭源阵营以目前最(zuì)强的(de)OpenAI为(wèi)代表，开源阵(zhèn)营Meta的LLaMa、Mistral和Google等也在不断(duàn)迭代。闭源(yuán)阵(zhèn)营坚持对Scaling Law的(de)信仰，押注在更强通(tōng)用(yòng)模型的打造上；开源阵(zhèn)营模型能(néng)力不断(duàn)提(tí)升，并且强调以更垂直的性(xìng)能、更(gèng)灵(líng)活的(de)配(pèi)置来推动大模型商业化落地。

关于应该选择模型开源还是闭源讨(tǎo)论经久不(bù)息。

对于(yú)局内人，这一选择这(zhè)不仅决定了他们将如何点亮AI“科技树”，更将影响他们的商业路线选择。换言之，这很有可能是这(zhè)个残(cán)酷竞争市场下的生存(cún)问题。

两个(gè)版(bǎn)本，多重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和指令(lìng)微调版本。

据Meta官网信息(xī)，Llama 3 模型(xíng)将数据和(hé)规模提升到新的高度。它在两个定制24K GPU集群上基于超(chāo)过 15T 的数据(jù)进行了训练——训练数据集是Llame 2使用量的7倍有余。它支(zhī)持 8K 上(shàng)下文长度，是 Llama 2 容量(liàng)的两倍。

除了 Llama 3，Meta 还发布了新的信任和安全工具(jù)，包括(kuò)Llama Guard 2、Code Shield和 CyberSec Eval 2。

据(jù)悉，Llama 3 即将(jiāng)在AWS（Amazon web service）、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等(děng)主要云(yún)提(tí)供商、模(mó)型 API 提供商平台上线(xiàn)，Llama还得到AMD、AWS、戴尔、英(yīng)特尔、NVIDIA和(hé)高通提供的硬件平台的支持。

在(zài)官网上，Meta还放出了(le)Llama3两个版本(běn)与谷歌Gemma、谷(gǔ)歌Gemini、Mistral、Anthropic的Claude 3等(děng)竞争对手的参数对比。据(jù)Meta官网，Llame3在MMLU（学(xué)科知识理(lǐ)解(jiě)）、GPQA（一般问题）、HumanEval（代(dài)码能力）、GSM—8K（数学能力）、MATH（比较难的(de)数学问题）5个评测集(jí)上均表现良好。

值得注意的是，Llama3的代(dài)码能力非常优秀。在(zài)AI领域公(gōng)众号“数字生(shēng)命卡兹克(kè)”主理人卡兹克分享的(de)用(yòng)户实测(cè)中，Llama3—8B能(néng)够给出(chū)国际(jì)象棋中(zhōng)经典皇(huáng)后问题的解题代码。而其前代(dài)版本Llama2需(xū)要专门的代码模型才能(néng)实现(xiàn)。

市场的反应速度很快。18日当天，Meta股价逆势(shì)收涨1.54%。次日，百度智能(néng)云千帆大模型(xíng)平台开放邀约测试(shì)，提供针对Llama 3的训练推(tuī)理(lǐ)方案，帮助开发者训练专属大模型。

8B和70B 两个型号的(de)模(mó)型，仅(jǐn)仅标志着 Llama 3 系列的开端，Meta AI首席科学家杨立昆在其(qí)社交媒体透露，在接下来(lái)的几个月，还会(huì)有(yǒu)更多(duō)版本(běn)陆续发布。

英(yīng)伟达高级科学(xué)家Jim Fan认(rèn)为之后可能会发布的Llama 3-400B以(yǐ)上的版本将成为某种“分水岭”，开源社区将能用(yòng)上GPT-4级别的模型。

不下牌桌，各显神通

上一(yī)轮元宇宙竞争中被认为(wèi)可能跌进(jìn)坑里的Meta，在人工(gōng)智能的牌桌上(shàng)打出了Llama系列这把(bǎ)好牌(pái)。要讨(tǎo)论Llama3带来的行业震荡，首先要明白，什么是大模型领域的(de)开源？

大(dà)模型领域的开源通常意味着模型的(de)架构(gòu)、训练代码和(hé)预训练权重等都被公开，允(yǔn)许研究人(rén)员和开发(fā)者自由地访问和使用。

不过，开源的程度因(yīn)模型而异。“有些可能只提供有限(xiàn)的访问权限或部分代码。”郭(guō)涛指出，判断大模型(xíng)是否真正(zhèng)开源的基准可能包括：代码和数据的可访问(wèn)性(xìng)、使用(yòng)许可的宽松程度(dù)、社区支持(chí)的活跃度(dù)以及对改进和新应用的开放性。

放眼(yǎn)AI界，两条(tiáo)路径上(shàng)都各有“头号玩家”分布。闭源自不必说(shuō)，海(hǎi)外有OpenAI旗下(xià)的(de)ChatGPT，国内是百度的文(wén)心一言以及风头正(zhèng)劲的(de)月之暗面Kimi。

而开(kāi)源方面，除了Llama系列，目前应用较广的开源大模型(xíng)还包括非(fēi)营利组织LAION推出的OpenFlamingo、Databricks的Dolly，以及MosaicML的MPT等。国内(nèi)则包括，阿里巴巴的通(tōng)义千问，智谱的ChatGLM-4、百川智能的baichuan-7B中英文大模(mó)型、北京智(zhì)源悟道3.0大模(mó)型(xíng)系列和(hé)面壁智能的CPM-Bee 10B中文基座大模型等。

形成这样的分化，很多时候是(shì)受技(jì)术进步和商业模(mó)式迭代等的多重影响。

天使投资人、资深人工智能专家郭涛认为，从技术角度(dù)来看，开源可以促进学术界的研究和创新，而(ér)闭源则有助于在(zài)一定时(shí)间内保持技术领先(xiān)优势。

从商(shāng)业角度来看(kàn)，开源可以(yǐ)吸引开发者社区的(de)贡献，促(cù)进技术的快速迭代和应用的广(guǎng)泛传播，但可(kě)能会(huì)影响到公司的(de)盈利模式。闭源(yuán)则可以保护知识产权，为公司创造直接的收入来源，但可能会限制技(jì)术的普及和生态的建(jiàn)设。

事实上，在Llama3发布之前，中文互联网刚刚经历了一轮开闭源论(lùn)战。

据媒体报道，百度CEO李彦(yàn)宏近日表态，认为(wèi)大模型开源意义不大(dà)，闭源模型性能会不断提升。“有了文心大模(mó)型4.0，我们可以根(gēn)据需要兼顾效果(guǒ)、响应速度、推理成本(běn)等各(gè)种考虑，裁剪出适合各种场景的更小尺寸模(mó)型，且支持精(jīng)调和post pretrain。通过降维裁剪出的模型，比直接拿开源调出来(lái)的模型，同等尺寸下效果(guǒ)更好，同等效果下成本明显更低。”

李彦(yàn)宏一直是闭源路线的忠实拥趸，理由包括但不限(xiàn)于认可闭源商业模式可以更好(hǎo)地聚集(jí)人力和财力等。

而其反对者——360创始人周鸿祎言简意赅，“一句话，今天没有开源就没有 Linux，没有 Linux 就没有互联网。”

“源神”启动，影响(xiǎng)几何？

“Llama 3的发布会带来市场格局的(de)改(gǎi)变。”郭(guō)涛在(zài)接受21记者采访时指出，其优异表现可能吸引更多的用户和(hé)投资者(zhě)，从而增加其(qí)市场份额。

官网显示，Llama 3将有条件地开源(yuán)给商业使用（月活(huó)用户超过(guò)7亿需要单独申请(qǐng)）。“不(bù)过这基本等于完全免费商用了。”卡(kǎ)兹克表示。

此前，投资人朱啸虎曾经就人工智能(néng)市场相关话题接受腾讯新闻采访。当被(bèi)问及2023年大模型发(fā)展的关键节点时，他给出的回答正(zhèng)是Llama上线(xiàn)。这让中国(guó)在应用层面创新(xīn)有了基础，降低了商业(yè)化门槛。

当然，朱啸(xiào)虎提到的变现是指开源生态内(nèi)的(de)用户。对于开(kāi)源大模型发(fā)布者的能否盈利，或者能等(děng)来盈利机会，很多时候并没有确定的答(dá)案。

闭源大模型通常通过授(shòu)权使用、订阅服务或者直接销售产品来盈利(lì)。其中的(de)代表便是AI领(lǐng)域的领跑(pǎo)者OpenAI，虽然其一直(zhí)有推(tuī)进开源项目的动作(zuò)，但(dàn)其处在核心地位的ChatGPT却一(yī)直采取收取API许可费的方式向其(qí)他公司提供服务。在API服务过程，其(qí)他公司不会接触到(dào)ChatGPT模型的细节和源代(dài)码，仅(jǐn)仅(jǐn)通过API接口进行调用。

创业者服务平台GoDaddy对全美1003家小型企业的调查数据(jù)显示，ChatGPT以70%的应(yīng)用率成为美国小型(xíng)企业应用最多的生成式AI产品，这说(shuō)明OpenAI选(xuǎn)择的闭源模式的商(shāng)业化之(zhī)路在一(yī)定(dìng)程度已经跑通。

开源模型如何寻(xún)求生存和发展的机(jī)会？

首(shǒu)先是以开放的生(shēng)态吸(xī)引用户。国盛证券研(yán)报就指出，开源大模型借助更(gèng)大标识(shí)符训练数据集、DeepSpeed、RLHF等方式(shì)，实现低训练(liàn)成本和高性能，超大模(mó)型以(yǐ)下大模型的壁垒正在消失。

“在拥有用户后，开源(yuán)大模型通常通过(guò)提(tí)供(gōng)增值服务、定制开发、技(jì)术支持等方式(shì)来实现盈(yíng)利”。郭涛(tāo)指出，公司(sī)可以在开源模型(xíng)的(de)基础上提(tí)供专(zhuān)业的训练服务或者(zhě)定制化的应用解决方(fāng)案。

对于Meta甚至众多开源者而言，开源的野心不仅是短期的商业变现，其更想引领规则设计(jì)以(yǐ)及搭建生态。有业内专家分(fēn)析，开源后壁垒并没有那么(me)容易破(pò)除，高质量、标(biāo)注过的训练数据集尤其是(shì)专业模型的壁垒。

星纪魅族(zú)集团数据合规执行总监朱玲(líng)凤(fèng)表示，目前有(yǒu)些开源AI由(yóu)头部公(gōng)司主导，“越多人使用，就越(yuè)能强化网格效应，而(ér)且不是真正的开放，后续(xù)需要使用它们的配(pèi)套工具、配套服(fú)务。头部公司还可能利用(yòng)监管豁免的方式，获得寻租空间。”换言之，以开源(yuán)为噱头的巨头游戏，可能会进一步强化大公司的垄断(duàn)地位(wèi)，反而不利于产(chǎn)业竞(jìng)争。

据(jù)报道，去(qù)年4月，在扎克伯格(gé)与分析师(shī)的一次电话会议中，他就谈到，如果行业能够在Meta使(shǐ)用(yòng)的基(jī)础工(gōng)具(jù)上达(dá)成标准化，那么meta就能从其他(tā)人的改进中受益(yì)。同年5月，谷歌内部泄露的文(wén)件《我们没有护城河，OpenAI也没有》在SemiAnalysis网站上传播，其中外资公募最新持仓曝光！贝莱德、富达第一大重仓都是它的观点包括(kuò)，比起开源社(shè)区需要谷(gǔ)歌，谷歌更需要开源社区等等。文(wén)章作者(zhě)指出，不同开源(yuán)模型所组成的生态系统永远是OpenAI的潜在竞争(zhēng)对手，与开源AI竞争的(de)结果(guǒ)必然是失败(bài)。

Meta落子，战局生变。大模型的路线之(zhī)争会不会迎来真正的胜利者？

“开源与(yǔ)闭(bì)源大模型之间不太可(kě)能分出绝对的输赢(yíng)，因为它们各自适合不同(tóng)的应用和场景。”郭涛(tāo)认为，开源(yuán)大模(mó)型更(gèng)适合那些(xiē)需要快速创新和大规(guī)模协作的项目，而闭源大模型可能更适合那些对性能和安(ān)全性有极高要求的商业应用。

未经允许不得转载：珠海业勤税务师事务所有限公司外资公募最新持仓曝光！贝莱德、富达第一大重仓都是它