#本文由作者授權(quán)發(fā)布,不代表IPRdaily立場,未經(jīng)作者許可,禁止轉(zhuǎn)載#
“一起來看看這條‘開源 + 專利’雙軌并行的道路究竟有何價值?!?br/>
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:佑斌
近來,AI圈正被一場“低成本+高性能”的技術(shù)風(fēng)暴席卷,由中國企業(yè) DeepSeek 打造的大語言模型,在多個國際基準(zhǔn)測試中以超強(qiáng)表現(xiàn)刷新外界認(rèn)知,且其訓(xùn)練成本竟然比市面主流方案低了一個數(shù)量級。這讓一度被認(rèn)為只有“海量GPU”才能跑出頂尖AI性能的傳統(tǒng)思維,面臨前所未有的挑戰(zhàn)。
更具話題性的是,DeepSeek一方面全面開源大模型的代碼與訓(xùn)練文檔;另一方面卻申請了多項專利,涵蓋數(shù)據(jù)處理、分布式訓(xùn)練、網(wǎng)絡(luò)通信等關(guān)鍵領(lǐng)域。很多人不免困惑:為什么要把成果免費(fèi)放出來,又要用專利進(jìn)行保護(hù)?“開源”和“專利”不是矛盾的嗎?
其實,越來越多的AI企業(yè)(如Meta、Mistral、EleutherAI等)都在開源與專利保護(hù)之間尋找平衡。以及開源軟件在AI領(lǐng)域的種種優(yōu)勢,一起來看看這條“開源+專利”雙軌并行的道路究竟有何價值。
一、“開源”究竟有什么好處?
提到“開源”,很多人往往只想到“源代碼可見、免費(fèi)使用”,但在AI大模型領(lǐng)域,開源還帶來多重紅利:
1.構(gòu)建全球化開發(fā)者生態(tài),助力市場拓展
社區(qū)驅(qū)動的創(chuàng)新:一旦模型、代碼、文檔公開,世界各地的研究者、程序員都會加入“眾包”式的改進(jìn)與測試。
Meta開源的Llama模型,不到數(shù)月就被社區(qū)打磨出無數(shù)增強(qiáng)版(Vicuna、Alpaca等),大幅提升模型在對話、多語言等方面的性能;Mistral AI開源了高效小參數(shù)模型后,吸引了眾多開發(fā)者競相嘗試,快速形成一股“用戶自帶研發(fā)”浪潮。
快速搶占市場與用戶心智:開源可以“零門檻”地讓企業(yè)、個人、高校研究者下載使用,從而大面積占領(lǐng)市場。一旦在開發(fā)者群體中取得先發(fā)地位,就為后續(xù)付費(fèi)增值或生態(tài)合作打下基礎(chǔ)。
商業(yè)邏輯:盡管最初看似“免費(fèi)”,但隨著社區(qū)認(rèn)可度升高,一旦形成標(biāo)準(zhǔn)或廣泛采用,就會有更多商業(yè)客戶尋求官方技術(shù)支持、定制化服務(wù)、企業(yè)級部署方案等。對開源企業(yè)而言,這往往反而能帶來更可觀的營收。
品牌與公關(guān)效應(yīng):在“開源 = 透明與信任”的時代,越多的開發(fā)者和媒體會將“開源大模型”的企業(yè)視為“站在技術(shù)前沿、敢于分享、利他共贏”的典范,這種“信譽(yù)加成”對市場拓展非常有幫助。
2. 加速技術(shù)迭代與降低研發(fā)成本
開源社區(qū)的“協(xié)同研發(fā):許多公司在開源后,能收到來自外部的優(yōu)化工具、插件以及新功能貢獻(xiàn)。這相當(dāng)于把一部分研發(fā)工作“眾包”給了全球?qū)I(yè)人士,為企業(yè)節(jié)省了不小的人力與時間成本。
EleutherAI的GPT-Neo、GPT-J等開源模型,借助社區(qū)力量完成了從訓(xùn)練到評測的一系列繁瑣細(xì)節(jié),有效降低組織內(nèi)部的資源開銷。
生態(tài)完善,工具互通:大模型常常與各種開源庫和硬件適配深度綁定,如分布式訓(xùn)練框架、性能調(diào)優(yōu)工具、推理引擎等。企業(yè)若封閉單干,需自己摸索一整套解決方案。而選擇開源,就能順利對接已有的豐富社區(qū)成果,節(jié)省大量重復(fù)投入。
廣泛應(yīng)用場景反饋:開源讓不同領(lǐng)域、不同業(yè)務(wù)的使用者在第一時間把需求和bug反饋給開發(fā)團(tuán)隊,幫助模型持續(xù)進(jìn)化。對比封閉式開發(fā),迭代速度常??鞌?shù)倍,也是為何Meta的Llama衍生版本層出不窮。
3. 與資本和商業(yè)化不沖突,甚至能增加盈利機(jī)會
雙重策略:社區(qū)版與企業(yè)版:很多開源項目使用的都是“寬松許可證”(如Apache 2.0),同時企業(yè)會保留一些定制化、高端功能,只對企業(yè)客戶提供付費(fèi)授權(quán)。這樣既能凝聚社區(qū)人氣,又能在高階商用市場賺取利潤。
如Databricks對Spark的開源與商用支持,Docker對社區(qū)版和企業(yè)版的劃分,都在證明“開源”和“盈利”可以雙贏。
衍生服務(wù)與云合作:開源大模型通常需要穩(wěn)定的云部署、長期維護(hù)和安全管理,許多企業(yè)客戶樂于付費(fèi)給原廠商獲取專業(yè)支持服務(wù)。企業(yè)也可與云平臺(如阿里云、騰訊云、AWS、Azure等)合作,共同推出“托管版”大模型,產(chǎn)生盈利分成。
增強(qiáng)投資者信心:從資本市場角度看,開源 = 快速做大規(guī)模與影響力,有助于拉高公司估值。許多投資機(jī)構(gòu)更青睞能迅速形成社區(qū)影響、構(gòu)建行業(yè)標(biāo)準(zhǔn)的AI公司,理由在于:一旦拿下開發(fā)者生態(tài),就等于站上了“未來的流量入口”。
二、DeepSeek為什么還要申請專利?
既然開源優(yōu)勢這么多,DeepSeek為何要對核心技術(shù)進(jìn)行專利布局?其實,開源與專利保護(hù)在法律和商業(yè)層面并不對立,它們解決的是不同問題:
開源主要處理“著作權(quán)”:讓他人可以合法地復(fù)制、修改、分發(fā)代碼或模型。專利主要保護(hù)“發(fā)明與技術(shù)方案”:防止他人在未授權(quán)的情況下,將同一創(chuàng)新技術(shù)用于商業(yè)牟利。對大模型企業(yè)而言,“開源 + 專利”雙軌并行大多出于以下考量:
1. 防御侵權(quán)與惡意訴訟
防被對手或“專利流氓”搶注:AI技術(shù)迭代極快,如果DeepSeek不及時申請專利,可能會被他人搶先注冊相似技術(shù),然后再反向告DeepSeek“侵權(quán)”。通過專利確權(quán),可有效減少日后糾紛。
形成法律護(hù)盾:當(dāng)企業(yè)擁有足夠的專利儲備,就能在面對外部專利攻擊時,用自身專利進(jìn)行“交叉授權(quán)”或“反訴”,從而守護(hù)開源項目的安全。
2. 保護(hù)核心競爭力與商業(yè)收益
小核心、大協(xié)同:企業(yè)可以將大模型整體架構(gòu)、訓(xùn)練流程開源,讓更多人受益;但在某些關(guān)鍵算法或系統(tǒng)優(yōu)化上,通過專利來維護(hù)“獨(dú)家知識”。這樣既可獲取社區(qū)的廣泛支持,又能保留自己無法輕易被復(fù)制的“王牌”。
專利提升公司估值:對商業(yè)公司而言,專利是重要的無形資產(chǎn),可以在投融資、并購或談判中提高企業(yè)估值與議價能力,從而支持后續(xù)研發(fā)投入。
3. 與開源社區(qū)的關(guān)系:授權(quán)而非壟斷
許多開源許可證帶有“專利授權(quán)”條款(如Apache 2.0、GPLv3等),如果DeepSeek將模型以這類許可證開放,就會默認(rèn)授予用戶必要的專利使用許可,只要用戶遵守協(xié)議即可合法使用關(guān)鍵技術(shù)。
企業(yè)仍能保留更多商業(yè)授權(quán)模式:當(dāng)下游客戶規(guī)模、用途超越一定范圍,或者需要深度定制,DeepSeek可通過額外專利授權(quán)來收取合理費(fèi)用,平衡研發(fā)成本。
三、DeepSeek專利布局:如何實現(xiàn)“低成本 + 高性能”?
根據(jù)Maxipat的專利分析,DeepSeek在北京、杭州、寧波等關(guān)聯(lián)企業(yè)名下,圍繞大模型訓(xùn)練優(yōu)化、網(wǎng)絡(luò)通信、數(shù)據(jù)管理等領(lǐng)域申請了 17項核心專利。其中最令人矚目的是:
1.數(shù)據(jù)序列索引技術(shù)(CN118246542A)
將訓(xùn)練數(shù)據(jù)集拆分成固定大小的數(shù)據(jù)序列,統(tǒng)一以“索引”方式混合、打亂、切分,而非物理復(fù)制或重組數(shù)據(jù)。這樣做可極大節(jié)省存儲空間、減少數(shù)據(jù)重復(fù)和網(wǎng)絡(luò)通信負(fù)擔(dān),并讓GPU始終“吃得飽”,提升訓(xùn)練效率。
2. 多平面RDMA并行數(shù)據(jù)傳輸(CN118503194A)
跨節(jié)點(diǎn)GPU之間通過RDMA(遠(yuǎn)程直接內(nèi)存訪問),繞過CPU瓶頸,減少延遲和數(shù)據(jù)傳輸中的來回拷貝。在大規(guī)模分布式訓(xùn)練時,通信是最大瓶頸之一;該技術(shù)能大幅提升網(wǎng)絡(luò)吞吐,減少GPU空閑時間。
3. 無損壓縮與分布式異步I/O(CN117707416A)
動態(tài)選擇數(shù)據(jù)壓縮策略,結(jié)合并行讀取,將PB級數(shù)據(jù)的I/O壓力大幅分?jǐn)偂p少對高端存儲硬件的依賴,讓訓(xùn)練能在相對普通的硬件環(huán)境中高效運(yùn)行,進(jìn)一步降低成本。
4. 異構(gòu)斷點(diǎn)續(xù)訓(xùn)(CN117669701A)
允許在不同并行策略或集群拓?fù)淝袚Q時,快速恢復(fù)訓(xùn)練進(jìn)度,減少重復(fù)。
這些底層專利相輔相成,共同構(gòu)筑了DeepSeek的大模型訓(xùn)練優(yōu)化體系。這正是DeepSeek能在不靠“天價GPU堆砌”的情況下,跑出媲美或超越歐美先進(jìn)大模型的關(guān)鍵原因。
四、開源與專利并舉:DeepSeek的多重收益
快速做大影響力:通過開源,DeepSeek的模型可快速被更多開發(fā)者、企業(yè)采納,形成用戶與社區(qū)規(guī)模效應(yīng)。從而帶動后續(xù)培訓(xùn)服務(wù)、付費(fèi)支持、云托管等增值服務(wù)的市場空間。
穩(wěn)固技術(shù)壁壘與估值:專利不僅能阻擋對手的“抄襲”,還能在投融資和產(chǎn)業(yè)合作中當(dāng)“硬通貨”。一旦有企業(yè)想要深度集成DeepSeek的核心技術(shù),就有明確的專利授權(quán)機(jī)制可以產(chǎn)生收益。
提升品牌認(rèn)知與人才吸引力:以開源姿態(tài)示人,讓DeepSeek在AI界獲得“透明可信、技術(shù)底氣足”的形象;而對核心專利的掌控又能吸引想做深層研究的高級工程師、科研人員加入,共同突破技術(shù)極限。
減少外部專利風(fēng)險,確保開源生態(tài)健康發(fā)展:擁有充足專利儲備的企業(yè),才有底氣說“我們的開源項目不怕惡意訴訟”。社區(qū)開發(fā)者也能更加安心地基于DeepSeek的成果進(jìn)行二次創(chuàng)新,形成良性循環(huán)。
五、對中國AI產(chǎn)業(yè)的啟示
DeepSeek的成功給中國AI乃至全球AI行業(yè)帶來一些重要啟示:
1.“高性能”不一定非要靠“大算力燒錢”
合理的網(wǎng)絡(luò)優(yōu)化、數(shù)據(jù)管理、分布式訓(xùn)練算法等“軟實力”同樣能帶來性能飛躍;技術(shù)積累與系統(tǒng)性創(chuàng)新,是彎道超車、降本增效的。
2. 開源與專利可以共存,形成“雙贏模式”
開源不是“白白送人”,也不是與商業(yè)化對立;專利也不是“封閉壟斷”,關(guān)鍵看企業(yè)如何設(shè)計授權(quán)條款,讓更多人受益的同時,保證自身投資回報。
3. 中小企業(yè)也能在大模型賽道突出重圍
DeepSeek并非“超級大廠”,打破行業(yè)對大模型的一些傳統(tǒng)認(rèn)知;只要足夠聚焦、創(chuàng)新點(diǎn)過硬,小公司同樣能在AI浪潮中嶄露頭。
4. 建立健康的AI開源生態(tài),離不開行業(yè)的共同努力
大廠的開放策略、民間社區(qū)的積極貢獻(xiàn)、專利保護(hù)與共享機(jī)制,這些都需要更多機(jī)構(gòu)和人才參與。隨著更多像DeepSeek這樣兼具技術(shù)實力與開源精神的企業(yè)涌現(xiàn),中國在大模型領(lǐng)域有望形成更具活力、更具競爭力的生態(tài)。
在這樣一條道路上,DeepSeek不僅收獲了社區(qū)人氣與國際聲譽(yù),也為自身后續(xù)擴(kuò)張打下堅實基礎(chǔ)。更重要的是,它為國內(nèi)外AI行業(yè)提供了一個值得借鑒的范本:在快速迭代、高度競爭的AI時代,“技術(shù)護(hù)城河 + 社區(qū)共創(chuàng)”才是持續(xù)發(fā)展之道。
未來,隨著DeepSeek不斷完善其大模型生態(tài)并推出更多創(chuàng)新應(yīng)用,或許會有更多企業(yè)被激勵跟進(jìn),形成“高效率、低門檻”的大模型新范式。讓我們拭目以待。
(原標(biāo)題:DeepSeek為何一邊“開源大模型”,一邊“申請專利”?)
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:佑斌
編輯:IPRdaily辛夷 校對:IPRdaily縱橫君
注:原文鏈接:DeepSeek為何一邊“開源大模型”,一邊“申請專利”?(點(diǎn)擊標(biāo)題查看原文)
「關(guān)于IPRdaily」
IPRdaily是全球領(lǐng)先的知識產(chǎn)權(quán)綜合信息服務(wù)提供商,致力于連接全球知識產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產(chǎn)權(quán)負(fù)責(zé)人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://m.islanderfriend.com
文章不錯,犒勞下辛苦的作者吧