天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修

AI“源神”启动!影响多大?

AI“源神”启动!影响多大?

开(kāi)源还是闭源?这是属于大模型的时(shí)代之问(wèn)。

今年年初,埃(āi)隆·马斯克在对OpenAI及其CEO萨姆·奥特曼(màn)提起诉讼时,就对OpenAI逐(zhú)渐(jiàn)不公开其模(mó)型研究相关细(xì)节(jié)的行为(wèi)大加谴(qiǎn)责。“时(shí)至今日,OpenAI公司网(wǎng)站还宣称,它的宗(zōng)旨是(shì)确保通用人工智(zhì)能造福全人类(lèi)。然而,在现实中,OpenAI已经转变为(wèi)科技巨头微软事实上的闭源子公司。”这位曾经的OpenAI联合创始(shǐ)人如此表示。

OpenAI不够“Open”,Meta却“Open”了自(zì)己最(zuì)新的(de)开源人工智能模型。

4月18日,Meta 发(fā)布了其最新版(bǎn)本的开源大模型 Llama 3,引起开源AI社区的一阵欢呼。巧合的是,Llama 3发布当天正好是AI领域顶尖学者、AI开(kāi)源倡导者吴恩 达(dá)的生日。“(Llama 3是)至今为止最好的礼物,谢感谢Meta!”他说。

行至2024,开闭源之争日渐白热化。闭源阵营以(yǐ)目(mù)前最(zuì)强(qiáng)的OpenAI为代表,开源阵营Meta的LLaMa、Mistral和Google等也在不断迭代。闭(bì)源(yuán)阵营坚持对Scaling Law的信仰,押注在更(gèng)强通用(yòng)模(mó)型的打造上;开源阵 营模型能力不断(duàn)提升,并且强调以更垂(chuí)直的性能、更灵活的配置来(lái)推动大模型商业化(huà)落地。

关于(yú)应该选择模(mó)型开源(yuán)还是闭源讨论(lùn)经久不息。

对于局内人,这一选择这不仅决定(dìng)了(le)他们将如何点亮AI“科技树”,更(gèng)将影响他们的商业路线选(xuǎn)择。换(huàn)言之(zhī),这很(hěn)有可能是这个残酷竞 争市场下的生存问题。

两个版本,多(duō)重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和指令微调版本。

据Meta官网信息,Llama 3 模型将(jiāng)数据和规(guī)模提升到新的高度。它在两个定(dìng)制24K GPU集群上基于超过 15T 的数(shù)据进行(xíng)了训练——训 练数据集是Llame 2使用量(liàng)的7倍有余。它支持 8K 上下文长度,是 Llama 2 容量的两倍。

除了 Llama 3,Meta 还发布了(le)新(xīn)的信任和安全(quán)工(gōng)具,包(bāo)括Llama Guard 2、Code Shield和(hé) CyberSec Eval 2。

据悉,Llama 3 即将(jiāng)在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模型 API 提供商平(píng)台上线(xiàn),Llama还得到(dào)AMD、AWS、戴尔、英特尔、NVIDIA和高通(tōng)提供的硬件平台的支持。

在官网上,Meta还放出了Llama3两个版(bǎn)本(běn)与谷歌 Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等(děng)竞争对手(shǒu)的(de)参数对比(bǐ)。据Meta官网,Llame3在MMLU(学科知识理解)、GPQA(一般问题)、HumanEval(代 码能力)、GSM—8K(数学能力)、MATH(比较难的数学问题)5个评测集(jí)上均表现(xiàn)良好。

值(zhí)得注意的是,Llama3的代码能力非常优秀。在AI领域公众号“数字生命卡兹克(kè)”主理人卡兹克分享的用户实测中,Llama3—8B能够给出国(guó)际象棋中经典(diǎn)皇后问(wèn)题的解题代码。而(ér)其前代版(bǎn)本Llama2需要(yào)专门的代码模型才能实现。

市场的反应速度很快。18日 当天,Meta股价逆势收涨1.54%。次日,百度智能云千帆大模(mó)型平台开放邀约测试,提(tí)供针对Llama 3的训练推(tuī)理方案,帮助开发者训练专属大模型。

8B和70B 两 个型号的模型,仅仅标志着 Llama 3 系(xì)列的开端,Meta AI首席科学家杨(yáng)立昆在其社交(jiāo)媒体透露,在接下来的几个月(yuè),还会有更(gèng)多版(bǎn)本(běn)陆续发(fā)布。

英(yīng)伟(wěi)达高级科(kē)学家Jim Fan认为之后可能会发布的(de)Llama 3-400B以上的版本将成为(wèi)某种(zhǒng)“分水岭”,开源社区将能用上GPT-4级别的模型。

不下牌桌,各显神通

上一轮元宇(yǔ)宙竞争中(zhōng)被认为可能跌进(jìn)坑里的Meta,在人工智能的牌(pái)桌上打出了Llama系列这把好牌。要讨论Llama3带来的行业(yè)震荡(dàng),首先要(yào)明白,什么是大(dà)模型领域的(de)开源?

大模(mó)型领(lǐng)域的开源通常意味着模型的架构、训练代码和预训练权重等都被公开(kāi),允许研究(jiū)人员和(hé)开(kāi)发者自由地访(fǎng)问和使用。

不过 ,开源的程度因模(mó)型而异。“有些可能(néng)只提供有限的访问权限或部分代码。”郭(guō)涛指出,判(pàn)断(duàn)大模型(xíng)是否真正开源的基准可能包括:代码和数据的可访问性、使用许(xǔ)可(kě)的宽(kuān)松程度、社区(qū)支(zhī)持的活跃度以及对改进和新应用的开放性。

放眼AI界(jiè),两条路(lù)径上都各有“头号玩家”分(fēn)布。闭(bì)源自(zì)不必(bì)说(shuō),海外(wài)有OpenAI旗下的ChatGPT,国内是百度的文心一言以及风头正劲的月之暗面Kimi。

而开源方面,除了Llama系列,目前应用较广的开源大模型(xíng)还包括(kuò)非营利(lì)组织LAION推(tuī)出的(de)OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等(děng)。国内则包(bāo)括,阿里巴巴的通义千问,智(zhì)谱的ChatGLM-4、百(bǎi)川(chuān)智能的baichuan-7B中英文大模型、北京智源悟(wù)道3.0大模(mó)型系列和面壁(bì)智能的CPM-Bee 10B中(zhōng)文基座大模型等。

形成这样的分化,很多时候是受技术进步和商(shāng)业模式迭(dié)代(dài)等的多重影响。

天(tiān)使投资人、资(zī)深人工智能(néng)专家(jiā)郭涛认为,从技术角度来看,开源可以促进学术(shù)界的研究和(hé)创 新,而闭源(yuán)则有助于在一定时间内保持(chí)技术(shù)领先优势。

从商业(yè)角度来(lái)看,开(kāi)源可以吸 引开发 者社区的贡献,促进技术的快速迭代和应用的广泛传播,但可能会影响到公(gōng)司的盈利模式。闭源则可以保护知识产权,为公司创造直接(jiē)的收入来源,但可能会限制技术的普及和生态的建设(shè)。

事实(shí)上,在Llama3发布之前,中文互联网刚刚经(jīng)历(lì)了一轮(lún)开闭源论战。

据媒体报道,百度CEO李彦宏近日表态(tài),认为大模型开源意义不大(dà),闭源模型性能(néng)会不断提升。“有了文心大模型4.0,我们可以根据需要兼顾效果、响应速 度、推理成本等(děng)各种考虑,裁剪(jiǎn)出适合各种场(chǎng)景的更(gèng)小尺寸模型,且支持精调和post pretrain。通过降维裁剪出(chū)的模型,比直接拿开(kāi)源调出来的模型,同等尺寸下效果更好,同等(děng)效果下成本明显更(gèng)低。”

李彦宏(hóng)一(yī)直是(shì)闭源路线(xiàn)的忠实拥趸,理由包括但(dàn)不限于认可闭(bì)源商业模式可以更好地聚集人力和财力等。

而其反对(duì)者——360创始人周(zhōu)鸿祎(yī)言简意赅,“一句(jù)话,今天(tiān)没有开(kāi)源就没(méi)有(yǒu) Linux,没有 Linux 就没有(yǒu)互联网。”

“源神”启动,影响几何?

“Llama 3的发布会(huì)带来(lái)市场格 局的改变。”郭涛在接(jiē)受21记者(zhě)采访时(shí)指出,其优(yōu)异表 现可能(néng)吸引更多的用(yòng)户和投(tóu)资者,从而增加其市场(chǎng)份额。

官网显示,Llama 3将(jiāng)有条件地开源给商业(yè)使用(月活用户超过7亿需要单独申请)。“不过这基本等(děng)于完全免费商用(yòng)了(le)。”卡兹克(kè)表示。

此前,投资人朱啸虎曾经就人工智能市场相(xiāng)关话题接受(shòu)腾讯新(xīn)闻采访。当被问及2023年大模型发展的关键节 点时,他给出的回答正是Llama上线。这让中国在(zài)应用层面创新(xīn)有了基础,降(jiàng)低了(le)商业化(huà)门槛。

当然,朱(zhū)啸虎提到的变现是指开源生态内(nèi)的用户。对于开源大模型发布者的(de)能否(fǒu)盈利,或者能等来盈利机会(huì),很(hěn)多(duō)时候并没有确定的(de)答案。

闭源大模(mó)型通常(cháng)通过授权使(shǐ)用、订阅服务或者直接销售产品来盈利。其中的代表便是(shì)AI领(lǐng)域(yù)的领跑者OpenAI,虽然其一直有推(tuī)进开源项目的动作,但其处(chù)在核心地位的ChatGPT却 一直采取收取API许可费的方式向其他公司(sī)提供服务(wù)。在(zài)API服务(wù)过程,其他公 司不会(huì)接触到ChatGPT模(mó)型的细(xì)节和(hé)源代码,仅仅通过API接口进行(xíng)调用。

创业者服务(wù)平 台GoDaddy对全美1003家小型企(qǐ)业(yè)的(de)调查数据显示,ChatGPT以70%的应用率成为 美国小型企业(yè)应用(yòng)最(zuì)多的生成式AI产品,这说明OpenAI选 择的(de)闭源(yuán)模式的商业化之路(lù)在一定程度已经跑通。

开源模型如何寻求生(shēng)存(cún)和(hé)发展的机会?

首先是(shì)以AI“源神”启动!影响多大?开放的生态吸引用户(hù)。国(guó)盛(shèng)证(zhèng)券研报就指出,开源大模 型借助更(gèng)大标识符训练(liàn)数(shù)据(jù)集、DeepSpeed、RLHF等(děng)方式,实现低训练成本和(hé)高性能,超大模型以下大模型的壁垒正 在消失。

AI“源神”启动!影响多大?在拥有用户后,开源(yuán)大模(mó)型通常通 过提供 增值服务、定制(zhì)开发、技术支持等方式(shì)来实现盈利”。郭涛指出,公司(sī)可以在(zài)开源模型的基础(chǔ)上提供专业的训练服务(wù)或(huò)者定制化的(de)应(yīng)用解决方(fāng)案。

对于Meta甚(shèn)至众(zhòng)多开源者而言,开源 的野心(xīn)不仅是短期的商业变(biàn)现,其更想引领规则设计以及搭建生态。有业内专家分析,开源后壁垒并没有那么容易破除(chú),高质量、标(biāo)注过的训练数据集尤其是专(zhuān)业模型的壁垒。

星 纪魅族集(jí)团数据合规执行总监(jiān)朱玲(líng)凤(fèng)表(biǎo)示,目前有些开源AI由头(tóu)部公司主(zhǔ)导(dǎo),“越(yuè)多人使用,就越能(néng)强化网格效应,而且不是真正的开(kāi)放,后续需要(yào)使(shǐ)用(yòng)它们(men)的配套工具、配(pèi)套服务。头部公司还可能利用(yòng)监管豁免的方(fāng)式,获得寻(xún)租空间。”换言之(zhī),以开源为(wèi)噱头的巨头游戏,可(kě)能会进(jìn)一(yī)步强化大公司的垄断地位,反而不(bù)利(lì)于产业竞争。

据报(bào)道(dào),去年(nián)4月,在扎(zhā)克伯格与分(fēn)析(xī)师的一次(cì)电(diàn)话会议中(zhōng),他就(jiù)谈到,如果行业能够在Meta使用的(de)基础工具上达成标准化(huà),那么meta就能从其他人的改进中受益。同年(nián)5月,谷歌内部泄露(lù)的文件《我们没有护城(chéng)河,OpenAI也没有》在SemiAnalysis网(wǎng)站上传播,其中的观点包(bāo)括,比起开源社区需(xū)要谷歌,谷歌(gē)更需要开源社区等等。文章作者指出,不同开源模型所组成的生(shēng)态系统永远是OpenAI的潜(qián)在竞争对手(shǒu),与(yǔ)开源(yuán)AI竞争的(de)结果(guǒ)必然(rán)是失败。

Meta落子,战局生(shēng)变。大模型的路线之争会不会迎来真正的胜利者?

“开源与闭源(yuán)大模型(xíng)之间(jiān)不太(tài)可能分(fēn)出绝对的输赢(yíng),因为它们各自适合不同的应(yīng)用和场景。”郭涛认为,开源大(dà)模型更 适合那些需要快速创新和大规模协作的项目,而闭源大模型可能更适合那些(xiē)对性能和安全性有极高要求的商业应用。

未经允许不得转载:天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修 AI“源神”启动!影响多大?

评论

5+2=