珠海业勤税务师事务所有限公司珠海业勤税务师事务所有限公司

AI“源神”启 动!影响多大?

AI“源神”启 动!影响多大?

开源还是闭源(yuán)?这是属于大模型的时代之问。

今年(nián)年(nián)初,埃隆·马斯克在对OpenAI及其(qí)CEO萨姆·奥特曼提起诉讼时,就对OpenAI逐渐不公开其模型研究相关细(xì)节的行为(wèi)大加(jiā)谴外资公募最新持仓曝光!贝莱德、富达第一大重仓都是它责。“时至今日(rì),OpenAI公司(sī)网站还(hái)宣称,它的宗旨是确保通用人工智能造福全(quán)人类。然而,在现实中,OpenAI已(yǐ)经转变为科(kē)技巨头微软事实上的闭源子公司。”这位曾经的(de)OpenAI联合创始人如(rú)此(cǐ)表示(shì)。

OpenAI不够“Open”,Meta却“Open”了自己最新的开源人工(gōng)智能模型。

4月(yuè)18日,Meta 发布了其最新版本的开源(yuán)大模 型 Llama 3,引(yǐn)起开源AI社区的一(yī)阵欢呼。巧合(hé)的是,Llama 3发(fā)布当天(tiān)正好是AI领域顶尖学者、AI开源倡导者吴恩达的生日。“(Llama 3是)至(zhì)今为止最好的礼物,谢感谢Meta!”他说(shuō)。

行至2024,开闭(bì)源之争日渐白热化。闭源阵营以目前最(zuì)强的(de)OpenAI为(wèi)代表,开源阵(zhèn)营 Meta的LLaMa、Mistral和Google等也在不断(duàn)迭代。闭源(yuán)阵(zhèn)营坚持对Scaling Law的(de)信仰,押注在更强通(tōng)用(yòng)模型的打造上;开源阵(zhèn)营模型能(néng)力不断(duàn)提(tí)升,并且强调以更垂直的性(xìng)能、更(gèng)灵(líng)活的(de)配(pèi)置来推动大模型商业化落地。

关于应该选择模型开源还是闭源讨(tǎo)论经久不(bù)息。

对于(yú)局内人,这一选择这(zhè)不仅决定了他们将如何点亮AI“科技树”,更将影响他们的商业路线选择。换言之,这很有可能是这(zhè)个残(cán)酷竞争市场下的生存(cún)问题。

两个(gè)版(bǎn)本,多重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和指令(lìng)微调版本。

据Meta官网信息(xī),Llama 3 模型(xíng)将数据和(hé)规模提升到新的高度。它在两个定制24K GPU集群上基于超(chāo)过 15T 的数据(jù)进行了训练——训练数据集是Llame 2使用量的7倍有余。它支(zhī)持 8K 上(shàng)下文长度,是 Llama 2 容量(liàng)的两倍。

除了 Llama 3,Meta 还发布了新的信任和安全工具(jù),包括(kuò)Llama Guard 2、Code Shield和 CyberSec Eval 2。

据(jù)悉,Llama 3 即将(jiāng)在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等(děng)主要云(yún)提(tí)供商、模(mó)型 API 提供商平台上线(xiàn),Llama还得到AMD、AWS、戴尔、英(yīng)特尔、NVIDIA和(hé)高通提供的硬件平台的支持。

在(zài)官网上,Meta还放出了(le)Llama3两个版本(běn)与谷歌Gemma、谷(gǔ)歌Gemini、Mistral、Anthropic的Claude 3等(děng)竞争对手的参数对比。据(jù)Meta官网,Llame3在MMLU(学(xué)科知识理(lǐ)解(jiě))、GPQA(一般问题)、HumanEval(代(dài)码能力)、GSM—8K(数学能力)、MATH(比较难的(de)数学问题)5个评测集(jí)上均表现良好。

值得注意的是,Llama3的代(dài)码能力非常优秀。在(zài)AI领域公(gōng)众号“数字生(shēng)命卡兹克(kè)”主理人卡兹克分享的(de)用(yòng)户实测(cè)中,Llama3—8B能(néng)够给出(chū)国际(jì)象棋中(zhōng)经典皇(huáng)后问题的解题代码。而其前代(dài)版本Llama2需(xū)要专门的代码模型才能(néng)实现(xiàn)。

市场的反应速度很快。18日当天,Meta股价逆势(shì)收涨1.54%。次日,百度智能(néng)云千帆大模型(xíng)平台开放邀约测试(shì),提供针对Llama 3的训练推(tuī)理(lǐ)方案,帮助开发者训练专属大模型。

8B和70B 两个型号的(de)模(mó)型,仅(jǐn)仅标志着 Llama 3 系列的开端,Meta AI首席科学家杨立昆在其(qí)社交媒体透露,在接下来(lái)的几个月,还会(huì)有(yǒu)更多(duō)版本(běn)陆续发布。

英(yīng)伟达高级科学(xué)家Jim Fan认(rèn)为之后可能会发布的Llama 3-400B以(yǐ)上的版本将成为某种“分水岭”,开源社区将能用(yòng)上GPT-4级别的模型。

不下牌桌,各显神通

上一(yī)轮元宇宙竞争中被认为(wèi)可能跌进(jìn)坑里的Meta,在人工(gōng)智能的牌桌上(shàng)打出了Llama系列这把(bǎ)好牌(pái)。要讨(tǎo)论Llama3带来的行业震荡,首先要明白,什么是大模型领域的(de)开源?

大(dà)模型领域的开源通常意味着模型的(de)架构(gòu)、训练代码和(hé)预训练权重等都被公开,允(yǔn)许研究人(rén)员和开发(fā)者自由地访问和使用。

不过,开源的程度因(yīn)模型而异。“有些可能只提供有限(xiàn)的访问权限或部分代码。”郭(guō)涛指出,判断大模型(xíng)是否真正(zhèng)开源的基准可能包括:代码和数据的可访问(wèn)性(xìng)、使用(yòng)许可的宽松程度(dù)、社区支持(chí)的活跃度(dù)以及对改进和新应用的开放性。

放眼(yǎn)AI界,两条(tiáo)路径上(shàng)都各有“头号 玩家 ”分布。闭源自不必说(shuō),海(hǎi)外有OpenAI旗下(xià)的(de)ChatGPT,国内是百度的 文(wén)心一言以及风头正(zhèng)劲的(de)月之暗面Kimi。

而开(kāi)源方面,除了Llama系列,目前应用较广的开源大 模型(xíng)还包括非(fēi)营利组织LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。国内(nèi)则包括,阿里巴巴的通(tōng)义千问,智谱的ChatGLM-4、百川智能的baichuan-7B中英文大模(mó)型、北京智(zhì)源悟道3.0大模(mó)型(xíng)系列和(hé)面壁智能的CPM-Bee 10B中文基座大模型等。

形成这样的分化,很多时候是(shì)受技(jì)术进步和商业模(mó)式迭代等的多重影响。

天使投资人、资深人工智能专家郭涛认为,从技术角度(dù)来看,开源可以促进学术界的研究和创新,而(ér)闭源则有助于在(zài)一定时(shí)间内保持技术领先(xiān)优势。

从商(shāng)业角度来看(kàn),开源可以(yǐ)吸引开发者社区的(de)贡献,促(cù)进技术的快速迭代和应用的广(guǎng)泛传播,但可(kě)能会(huì)影响到公司的(de)盈利模式。闭源(yuán)则可以保护知识产权,为公司创造直接的收入来源,但可能会限制技(jì)术的普及和生态的建(jiàn)设。

事实上,在Llama3发布之前,中文互联网刚刚经历了一轮开闭源论(lùn)战。

据媒体报道,百度CEO李彦(yàn)宏近日表态,认为(wèi)大模型开源意义不大(dà),闭源模型性能会不 断提升。“有 了文心大模(mó)型4.0,我们可以根(gēn)据 需要兼顾效果(guǒ)、响应速度、推理成本(běn)等各(gè)种考虑,裁剪出适合各种场景的更小尺寸 模(mó)型,且支持精(jīng)调和post pretrain。通过降维裁剪出的模型,比直接拿开源调出来(lái)的模型,同等尺寸下效果(guǒ)更好,同等效果下成本明显更低。”

李彦(yàn)宏一直是闭源路线的忠实拥趸,理由包括但不限(xiàn)于认可闭源商业模式可以更好(hǎo)地聚集(jí)人力和财力等。

而其反对者——360创始人周鸿祎言简意赅,“一句话,今天没有开源就没有 Linux,没有 Linux 就没有互联网。”

“源神”启动,影响(xiǎng)几何?

“Llama 3的发布会带来市场格局的(de)改(gǎi)变。”郭(guō)涛在(zài)接受21记者采访时指出,其优 异表现可能吸引更多的用户和(hé)投资者(zhě),从而增加其(qí)市场份额。

官网显示,Llama 3将有条件地开源(yuán)给商业使用(月活(huó)用户超过(guò)7亿需要单独申请(qǐng))。“不(bù)过这基本等于完全免费商用了。”卡(kǎ)兹克表示。

此前,投资人朱啸虎曾经就人工智能(néng)市场相关话题接受腾讯新闻采访。当被(bèi)问及2023年大模型发(fā)展的关键节点时,他给出的回答正(zhèng)是Llama上线(xiàn)。这让中国(guó)在应用层面创新(xīn)有了基础,降低了商业(yè)化门槛。

当然,朱啸(xiào)虎提到的变现 是指开源生态内(nèi)的(de)用户。对于开(kāi)源大模型发(fā)布者的能否盈利,或者能等(děng)来盈利机会,很多时候并没有确定的答(dá)案。

闭源大模型通常通过授(shòu)权使用、订阅服务或者直接销售产品来盈利(lì)。其中的(de)代表便是AI领(lǐng)域的领跑(pǎo)者OpenAI,虽然其一直(zhí)有推(tuī)进开源项目的动作(zuò),但(dàn)其处在核心地位的ChatGPT却一(yī)直采取收取API许可费的方式向其(qí)他公司提供服务。在API服务过程,其(qí)他公司不会接触到(dào)ChatGPT模型的细节和源代(dài)码,仅(jǐn)仅(jǐn)通过API接口进行调用。

创业者服务平台GoDaddy对全美1003家小型企业的调查数 据(jù)显示,ChatGPT以70%的应(yīng)用率成为美国小型(xíng)企业应用最多的生成式AI产品,这说(shuō)明OpenAI选(xuǎn)择的闭源模式的商(shāng)业化之(zhī)路在一(yī)定(dìng)程 度已经跑通。

开源模型如何寻(xún)求生存和发展的机(jī)会?

首(shǒu)先是以开放的生(shēng)态吸(xī)引用户。国盛证券研(yán)报就指出,开源 大模 型借助更(gèng)大标识(shí)符训练数据集、DeepSpeed、RLHF等方式(shì),实现低训练(liàn)成本和高性能,超大模(mó)型以(yǐ)下 大模型的壁垒正在消失。

“在拥有用户后,开源(yuán)大模型通常通过(guò)提(tí)供(gōng)增值服务、定制开发、技(jì)术支持等方式(shì)来实现盈(yíng)利”。郭涛(tāo)指出,公司(sī)可以在开源模型(xíng)的(de)基础上提(tí)供专(zhuān)业的训练服 务或者(zhě)定制化的应用解决方(fāng)案。

对于Meta甚至众多开源者而言,开源的野心不仅是短期的商业变现,其更想引领规则设计(jì)以(yǐ)及搭建生 态。有业内专家分(fēn)析,开源后壁垒并没有那么(me)容易破(pò)除,高质量、标(biāo)注 过的训练数据集尤其是(shì)专业模型的壁垒。

星纪魅族(zú)集团数据 合规执行总监朱玲(líng)凤(fèng)表示,目前有(yǒu)些开源AI由(yóu)头部公(gōng)司主导,“越多人使用,就越(yuè)能强化网格效应,而(ér)且不是真正的开放,后续(xù)需要使用它们的配(pèi)套工具、配套服(fú)务。头部公司还可能利用(yòng)监管豁免的方式,获得寻租空间。”换言之,以开源(yuán)为噱头的巨头游戏,可能会进一步强化大公司的垄断(duàn)地位(wèi),反而不利于产(chǎn)业竞(jìng)争。

据(jù)报道,去(qù)年4月,在 扎克伯格(gé)与分析师(shī)的一次电话会议中,他就 谈到,如果行业能够在Meta使(shǐ)用(yòng)的基(jī)础工(gōng)具(jù)上达(dá)成标准化,那么meta就能从其他(tā)人的改进中受益(yì)。同年5月,谷歌内部泄露的文(wén)件《我们没有护城河,OpenAI也没有》在 SemiAnalysis网站上传播,其中外资公募最新持仓曝光!贝莱德、富达第一大重仓都是它的观点包括(kuò),比起开源社(shè)区需要谷(gǔ)歌,谷歌更需要开源社区等等。文(wén)章作者(zhě)指出,不同开源(yuán)模型所组成的生态系统永远是OpenAI的潜在竞争(zhēng)对手,与开源AI竞争的(de)结 果(guǒ)必然是失败(bài)。

Meta落子,战局生变 。大模型的路线之(zhī)争会不会迎来 真正的胜利者?

“开源与(yǔ)闭(bì)源大模型之间不太可(kě)能分出绝对的输赢(yíng),因为它们各自适合不同(tóng)的应用 和场景。”郭涛(tāo)认为,开源(yuán)大模(mó)型更(gèng)适合那些(xiē)需要快速创新和大规(guī)模协作的项目,而闭源大模型可能更适合那些对性能和安(ān)全性有极高要求的商业应用。

未经允许不得转载:珠海业勤税务师事务所有限公司 外资公募最新持仓曝光!贝莱德、富达第一大重仓都是它

评论

5+2=