AI“源神”启动！影响多大？

开(kāi)源还是闭源？这是属于大模型的时(shí)代之问(wèn)。

今年年初，埃(āi)隆·马斯克在对OpenAI及其CEO萨姆·奥特曼(màn)提起诉讼时，就对OpenAI逐(zhú)渐(jiàn)不公开其模(mó)型研究相关细(xì)节(jié)的行为(wèi)大加谴(qiǎn)责。“时(shí)至今日，OpenAI公司网(wǎng)站还宣称，它的宗(zōng)旨是(shì)确保通用人工智(zhì)能造福全人类(lèi)。然而，在现实中，OpenAI已经转变为(wèi)科技巨头微软事实上的闭源子公司。”这位曾经的OpenAI联合创始(shǐ)人如此表示。

OpenAI不够“Open”，Meta却“Open”了自(zì)己最(zuì)新的(de)开源人工智能模型。

4月18日，Meta 发(fā)布了其最新版(bǎn)本的开源大模型 Llama 3，引起开源AI社区的一阵欢呼。巧合的是，Llama 3发布当天正好是AI领域顶尖学者、AI开(kāi)源倡导者吴恩达(dá)的生日。“（Llama 3是）至今为止最好的礼物，谢感谢Meta！”他说。

行至2024，开闭源之争日渐白热化。闭源阵营以(yǐ)目(mù)前最(zuì)强(qiáng)的OpenAI为代表，开源阵营Meta的LLaMa、Mistral和Google等也在不断迭代。闭(bì)源(yuán)阵营坚持对Scaling Law的信仰，押注在更(gèng)强通用(yòng)模(mó)型的打造上；开源阵营模型能力不断(duàn)提升，并且强调以更垂(chuí)直的性能、更灵活的配置来(lái)推动大模型商业化(huà)落地。

关于(yú)应该选择模(mó)型开源(yuán)还是闭源讨论(lùn)经久不息。

对于局内人，这一选择这不仅决定(dìng)了(le)他们将如何点亮AI“科技树”，更(gèng)将影响他们的商业路线选(xuǎn)择。换(huàn)言之(zhī)，这很(hěn)有可能是这个残酷竞争市场下的生存问题。

两个版本，多(duō)重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和指令微调版本。

据Meta官网信息，Llama 3 模型将(jiāng)数据和规(guī)模提升到新的高度。它在两个定(dìng)制24K GPU集群上基于超过 15T 的数(shù)据进行(xíng)了训练——训练数据集是Llame 2使用量(liàng)的7倍有余。它支持 8K 上下文长度，是 Llama 2 容量的两倍。

除了 Llama 3，Meta 还发布了(le)新(xīn)的信任和安全(quán)工(gōng)具，包(bāo)括Llama Guard 2、Code Shield和(hé) CyberSec Eval 2。

据悉，Llama 3 即将(jiāng)在AWS（Amazon web service）、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模型 API 提供商平(píng)台上线(xiàn)，Llama还得到(dào)AMD、AWS、戴尔、英特尔、NVIDIA和高通(tōng)提供的硬件平台的支持。

在官网上，Meta还放出了Llama3两个版(bǎn)本(běn)与谷歌 Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等(děng)竞争对手(shǒu)的(de)参数对比(bǐ)。据Meta官网，Llame3在MMLU（学科知识理解）、GPQA（一般问题）、HumanEval（代码能力）、GSM—8K（数学能力）、MATH（比较难的数学问题）5个评测集(jí)上均表现(xiàn)良好。

值(zhí)得注意的是，Llama3的代码能力非常优秀。在AI领域公众号“数字生命卡兹克(kè)”主理人卡兹克分享的用户实测中，Llama3—8B能够给出国(guó)际象棋中经典(diǎn)皇后问(wèn)题的解题代码。而(ér)其前代版(bǎn)本Llama2需要(yào)专门的代码模型才能实现。

市场的反应速度很快。18日当天，Meta股价逆势收涨1.54%。次日，百度智能云千帆大模(mó)型平台开放邀约测试，提(tí)供针对Llama 3的训练推(tuī)理方案，帮助开发者训练专属大模型。

8B和70B 两个型号的模型，仅仅标志着 Llama 3 系(xì)列的开端，Meta AI首席科学家杨(yáng)立昆在其社交(jiāo)媒体透露，在接下来的几个月(yuè)，还会有更(gèng)多版(bǎn)本(běn)陆续发(fā)布。

英(yīng)伟(wěi)达高级科(kē)学家Jim Fan认为之后可能会发布的(de)Llama 3-400B以上的版本将成为(wèi)某种(zhǒng)“分水岭”，开源社区将能用上GPT-4级别的模型。

不下牌桌，各显神通

上一轮元宇(yǔ)宙竞争中(zhōng)被认为可能跌进(jìn)坑里的Meta，在人工智能的牌(pái)桌上打出了Llama系列这把好牌。要讨论Llama3带来的行业(yè)震荡(dàng)，首先要(yào)明白，什么是大(dà)模型领域的(de)开源？

大模(mó)型领(lǐng)域的开源通常意味着模型的架构、训练代码和预训练权重等都被公开(kāi)，允许研究(jiū)人员和(hé)开(kāi)发者自由地访(fǎng)问和使用。

不过，开源的程度因模(mó)型而异。“有些可能(néng)只提供有限的访问权限或部分代码。”郭(guō)涛指出，判(pàn)断(duàn)大模型(xíng)是否真正开源的基准可能包括：代码和数据的可访问性、使用许(xǔ)可(kě)的宽(kuān)松程度、社区(qū)支(zhī)持的活跃度以及对改进和新应用的开放性。

放眼AI界(jiè)，两条路(lù)径上都各有“头号玩家”分(fēn)布。闭(bì)源自(zì)不必(bì)说(shuō)，海外(wài)有OpenAI旗下的ChatGPT，国内是百度的文心一言以及风头正劲的月之暗面Kimi。

而开源方面，除了Llama系列，目前应用较广的开源大模型(xíng)还包括(kuò)非营利(lì)组织LAION推(tuī)出的(de)OpenFlamingo、Databricks的Dolly，以及MosaicML的MPT等(děng)。国内则包(bāo)括，阿里巴巴的通义千问，智(zhì)谱的ChatGLM-4、百(bǎi)川(chuān)智能的baichuan-7B中英文大模型、北京智源悟(wù)道3.0大模(mó)型系列和面壁(bì)智能的CPM-Bee 10B中(zhōng)文基座大模型等。

形成这样的分化，很多时候是受技术进步和商(shāng)业模式迭(dié)代(dài)等的多重影响。

天(tiān)使投资人、资(zī)深人工智能(néng)专家(jiā)郭涛认为，从技术角度来看，开源可以促进学术(shù)界的研究和(hé)创新，而闭源(yuán)则有助于在一定时间内保持(chí)技术(shù)领先优势。

从商业(yè)角度来(lái)看，开(kāi)源可以吸引开发者社区的贡献，促进技术的快速迭代和应用的广泛传播，但可能会影响到公(gōng)司的盈利模式。闭源则可以保护知识产权，为公司创造直接(jiē)的收入来源，但可能会限制技术的普及和生态的建设(shè)。

事实(shí)上，在Llama3发布之前，中文互联网刚刚经(jīng)历(lì)了一轮(lún)开闭源论战。

据媒体报道，百度CEO李彦宏近日表态(tài)，认为大模型开源意义不大(dà)，闭源模型性能(néng)会不断提升。“有了文心大模型4.0，我们可以根据需要兼顾效果、响应速度、推理成本等(děng)各种考虑，裁剪(jiǎn)出适合各种场(chǎng)景的更(gèng)小尺寸模型，且支持精调和post pretrain。通过降维裁剪出(chū)的模型，比直接拿开(kāi)源调出来的模型，同等尺寸下效果更好，同等(děng)效果下成本明显更(gèng)低。”

李彦宏(hóng)一(yī)直是(shì)闭源路线(xiàn)的忠实拥趸，理由包括但(dàn)不限于认可闭(bì)源商业模式可以更好地聚集人力和财力等。

而其反对(duì)者——360创始人周(zhōu)鸿祎(yī)言简意赅，“一句(jù)话，今天(tiān)没有开(kāi)源就没(méi)有(yǒu) Linux，没有 Linux 就没有(yǒu)互联网。”

“源神”启动，影响几何？

“Llama 3的发布会(huì)带来(lái)市场格局的改变。”郭涛在接(jiē)受21记者(zhě)采访时(shí)指出，其优(yōu)异表现可能(néng)吸引更多的用(yòng)户和投(tóu)资者，从而增加其市场(chǎng)份额。

官网显示，Llama 3将(jiāng)有条件地开源给商业(yè)使用（月活用户超过7亿需要单独申请）。“不过这基本等(děng)于完全免费商用(yòng)了(le)。”卡兹克(kè)表示。

此前，投资人朱啸虎曾经就人工智能市场相(xiāng)关话题接受(shòu)腾讯新(xīn)闻采访。当被问及2023年大模型发展的关键节点时，他给出的回答正是Llama上线。这让中国在(zài)应用层面创新(xīn)有了基础，降(jiàng)低了(le)商业化(huà)门槛。

当然，朱(zhū)啸虎提到的变现是指开源生态内(nèi)的用户。对于开源大模型发布者的(de)能否(fǒu)盈利，或者能等来盈利机会(huì)，很(hěn)多(duō)时候并没有确定的(de)答案。

闭源大模(mó)型通常(cháng)通过授权使(shǐ)用、订阅服务或者直接销售产品来盈利。其中的代表便是(shì)AI领(lǐng)域(yù)的领跑者OpenAI，虽然其一直有推(tuī)进开源项目的动作，但其处(chù)在核心地位的ChatGPT却一直采取收取API许可费的方式向其他公司(sī)提供服务(wù)。在(zài)API服务(wù)过程，其他公司不会(huì)接触到ChatGPT模(mó)型的细(xì)节和(hé)源代码，仅仅通过API接口进行(xíng)调用。

创业者服务(wù)平台GoDaddy对全美1003家小型企(qǐ)业(yè)的(de)调查数据显示，ChatGPT以70%的应用率成为美国小型企业(yè)应用(yòng)最(zuì)多的生成式AI产品，这说明OpenAI选择的(de)闭源(yuán)模式的商业化之路(lù)在一定程度已经跑通。

开源模型如何寻求生(shēng)存(cún)和(hé)发展的机会？

首先是(shì)以AI“源神”启动！影响多大？开放的生态吸引用户(hù)。国(guó)盛(shèng)证(zhèng)券研报就指出，开源大模型借助更(gèng)大标识符训练(liàn)数(shù)据(jù)集、DeepSpeed、RLHF等(děng)方式，实现低训练成本和(hé)高性能，超大模型以下大模型的壁垒正在消失。

“AI“源神”启动！影响多大？在拥有用户后，开源(yuán)大模(mó)型通常通过提供增值服务、定制(zhì)开发、技术支持等方式(shì)来实现盈利”。郭涛指出，公司(sī)可以在(zài)开源模型的基础(chǔ)上提供专业的训练服务(wù)或(huò)者定制化的(de)应(yīng)用解决方(fāng)案。

对于Meta甚(shèn)至众(zhòng)多开源者而言，开源的野心(xīn)不仅是短期的商业变(biàn)现，其更想引领规则设计以及搭建生态。有业内专家分析，开源后壁垒并没有那么容易破除(chú)，高质量、标(biāo)注过的训练数据集尤其是专(zhuān)业模型的壁垒。

星纪魅族集(jí)团数据合规执行总监(jiān)朱玲(líng)凤(fèng)表(biǎo)示，目前有些开源AI由头(tóu)部公司主(zhǔ)导(dǎo)，“越(yuè)多人使用，就越能(néng)强化网格效应，而且不是真正的开(kāi)放，后续需要(yào)使(shǐ)用(yòng)它们(men)的配套工具、配(pèi)套服务。头部公司还可能利用(yòng)监管豁免的方(fāng)式，获得寻(xún)租空间。”换言之(zhī)，以开源为(wèi)噱头的巨头游戏，可(kě)能会进(jìn)一(yī)步强化大公司的垄断地位，反而不(bù)利(lì)于产业竞争。

据报(bào)道(dào)，去年(nián)4月，在扎(zhā)克伯格与分(fēn)析(xī)师的一次(cì)电(diàn)话会议中(zhōng)，他就(jiù)谈到，如果行业能够在Meta使用的(de)基础工具上达成标准化(huà)，那么meta就能从其他人的改进中受益。同年(nián)5月，谷歌内部泄露(lù)的文件《我们没有护城(chéng)河，OpenAI也没有》在SemiAnalysis网(wǎng)站上传播，其中的观点包(bāo)括，比起开源社区需(xū)要谷歌，谷歌(gē)更需要开源社区等等。文章作者指出，不同开源模型所组成的生(shēng)态系统永远是OpenAI的潜(qián)在竞争对手(shǒu)，与(yǔ)开源(yuán)AI竞争的(de)结果(guǒ)必然(rán)是失败。

Meta落子，战局生(shēng)变。大模型的路线之争会不会迎来真正的胜利者？

“开源与闭源(yuán)大模型(xíng)之间(jiān)不太(tài)可能分(fēn)出绝对的输赢(yíng)，因为它们各自适合不同的应(yīng)用和场景。”郭涛认为，开源大(dà)模型更适合那些需要快速创新和大规模协作的项目，而闭源大模型可能更适合那些(xiē)对性能和安全性有极高要求的商业应用。

未经允许不得转载：天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修 AI“源神”启动！影响多大？