伴隨著“中國制造”,“中國創造”走向世界,漢之光華將以卓越的
服務能力協助我們的客戶完成全球知識產權布局。
【前 言】
2024年7月,世界知識產權組織WIPO發布了《生成式人工智能專利態勢報告》(以下簡稱:WIPO報告),報告分析了從2014年至2023年底的十年間,全球生成式人工智能(GenAI)相關專利情況,并給出了權威的結論。WIPO報告顯示,在這10年間,全球GenAI相關專利申請有5.4萬件,其中中國的專利申請量以3.8萬件占據首位,遠遠超過美國、韓國、日本和印度等國。由于 GenAI 技術呈現井噴式發展,相應的專利申請量也呈現指數式上升,僅2023年公布的 GenAI 相關專利就超過了全部總數的1/4。相應地,GenAI技術淘汰速度也非常快,可以想見過去10年的專利技術,越是新的技術越是具有參考借鑒價值。
本文將沿襲WIPO報告的專利分析思路,聚焦ChatGPT發布后幾個重要的國外公司公開的相關專利,即2023年1月以后公開的相關專利,進行相關專利數據分析,為感興趣的客戶提供參考。
一、OpenAI的專利公開情況
由于ChatGPT產品的成功,在公眾心目中 OpenAI 即 GenAI。因此OpenAI公司是我們必須首先研究一下的研發主體。
OpenAI公司初創于2015年。2017年“情緒神經元”和 OpenAIFive 項目的突破,使得OpenAI開始關注大型語言模型(LLM)。2019年7月,微軟(Microsoft)宣布與OpenAI開展為期多年的合作。微軟投資OpenAI 10億美元,雙方攜手合作替Azure云端平臺服務開發人工智能技術。微軟也成為OpenAI的獨家云供應商和 OpenAI 新AI技術商業化的首選合作伙伴。微軟的加持使得OpenAI的大模型開發如虎添翼。之后,OpenAI 公司為整個行業提供了日新月異的創新成果,引領著行業的方向。
然而,經過嚴格的專利檢索發現,以“OPENAI OPCO LLC”作為專利申請人申請的專利非常少,真正有效的專利申請是從2023年開始的;截至本文發表日,僅有28個專利同族公開。在2023年前,OpenAI公司沒有通過專利申請去保護其任何研究成果。當然,OpenAI 公司創立伊始是一個非營利性的研究機構,其研究成果往往通過學術論文的方式公開。同時0penAI公司最初將其重要的代碼開源,以活躍各技術方向在全球的研發活動。同時,OpenAI也可能正在通過商業機密的形式保護其知識產權。不過由于最前沿的技術不得不公開以加速其全球的研發,同時又要維護OpenAI公司在該技術上的專屬權以獲得相應的經濟回報,反哺其研發活動,使得其研發具有可持續性。因此對其研發成果進行專利申請,恰恰是最好公司利益的保護方式。
我們欣喜地看到,自從2022年底ChatGPT產品發布后,OpenAI公司開始了專利申請。基于現在有限的專利申請量,我們僅能總結出以下一些結論,相信隨著更多的專利公開,我們將會得到更多有價值的結論。
第一:OPENAI 專利的技術構成
根據 OPENAI 專利的IPC分類號統計,可以得出以下申請量排名領先的技術構成。根據該技術構成排名,可以認為,OPENAI公司的創新主要圍繞自然語言處理展開的。
第二:專利受理局
在我們調研的28個專利同族中,都在美國有專利申請,其中僅有4件專利有PCT申請,但未見在任何國家落地。可見 OPENAI 公司的專利保護策略還是局限于美國原研地。可見其專利技術還是聚焦基礎技術,在亞洲地區非常活躍的有關具體應用的技術方案,OPENAI尚未涉及;當然也可以理解為,OPENAI公司鼓勵亞洲各研發實體應用其開發的基礎專利,來設計具體的應用產品。
第三:專利被引用
專利被引用次數是一個非常好的指標,其可以識別哪些專利技術已被廣泛應用,并且說明有很多研發人員已經借鑒過這些技術。被引用次數越多的專利,其影響力越大,甚至可以代表該技術領域的核心創新技術。據統計,OPENAI有以下3篇專利被引用,這3篇專利,都是2023年申請的,并都于2024年獲得授權。可以預見,隨著各國 GenAI 相關應用技術的發展,將會有更多OPENAI 申請的基礎專利被引用。
二、其他國外知名公司的專利公開情況
GenAI各主要大模型的專利公開量
相較于OPENAI公司很少的專利公開量,很多其他國外知名公司卻有更多的相關專利公開量。根據《WIPO報告》里面全球專利公開量的排名,排名第5的IBM、第8的Alphabet/Google、第10的Microsoft和 第19的Adobe是 GenAI 領域專利家族最多的美國公司。IBM 開發了一個 GenAI 平臺 watsonx,該平臺使公司能夠使用和定制 LLM,重點關注數據安全性和合規性,因為公司可以構建基于自己數據訓練的 AI 模型(Stack Overflow 2023)。Alphabet 的 AI 部門 DeepMind 最近推出了其最新的 LLM 模型 Gemini,該模型最終將集成到 Google 的搜索引擎、廣告產品、Chrome 瀏覽器和其他產品中(Pichai 和 Hassabis 2023)。Microsoft是 GenAI 的主要參與者,不僅是因為其對 OpenAI 的大量投資,該公司還大量投資了其他研究活動。例如,Microsoft在2024年投資了InnerEye 項目,該項目分析醫學掃描以檢測異常、診斷疾病并推薦治療方案。
我們研究了《WIPO報告》里面排名靠前的美國公司IBM、Google、Microsoft、Adobe、以及GAN申請量非常多的德國知名企業Siemens和韓國SamSung。通過研究這幾個排名靠前的國外知名公司在ChatGPT發布前后(即2023年前后)的相關專利公開量,并且根據GenAI各主要大模型加以梳理,形成以下柱狀圖,直觀地展示了IBM、SamSung、Google、Microsoft、Adobe、Siemens 等公司,于2023年前后在GAN,VAE,LLM,AE,DM 大模型上相關專利公開量。
注——
1.2023年前是指:2014年1月1日~2022年12月31日;2023年后是指:2023年1月1日~2024年6月30日。我們將2024年6月30日作為專利統計的截斷日,主要是因為有很多2024年下半年申請的專利尚未公開
2.各大模型具體的含義:
生成對抗網絡 Generative adversarial networks (GAN)
變分自編碼器 Variational autoencoders (VAE)
基于解碼器的大型語言模型 decoder-based large language models (decoder-based LLM)
自回歸模型 Autoregressive models(AM)
擴散模型 Diffusion models(DM)
各大模型的技術特點詳見:《生成式人工智能(GenAI+)最新專利技術發展態勢系列之一——-GenAI+大模型》
從各大公司的 GAN、VAE、AM 大模型相關專利的申請情況來看,2023年后的專利申請量沒有明顯的爆發性上升,這個情況和三個大模型在總體上受到 ChatGPT 發布的影響較小的結論是一致的。
在各大公司中僅有Microsoft公司在GAN大模型的專利申請量較少,Adobe公司在VAE大模型的相關專利上產出很少。
從總體上而言,AM 大模型相關專利一直只有零星的申請量。落實到各大知名公司上,僅有Google公司在2023年前后都有相關專利申請;IBM公司在2023年后的相關專利申請明顯下降;其他知名國外公司則在 AM 大模型上未見相關專利申請。可以預見,若沒有新應用場景的涌現,AM大模型相關專利將延續現在的零星的申請量,甚至將不會有研發實體再繼續這方面的應用研究投入。
相較于GAN、VAE、AM 大模型,各大國際知名公司的 LLM 和 DM 大模型的則在2023年前后受到ChatGPT 的影響非常大。尤其是LLM 大模型,Google 和 Microsoft 公司在2023年后相關專利申請量成倍數增加,顯然這和這兩家公司同OPENAI公司的合作密切相關。
以上的專利統計,是基于專利標題、摘要以及權利要求等信息,進行的專利類型歸類。但是,所有GenAI專利家族中有很大一部分不適合任何特定的大模型。許多GenAI專利的標題、摘要以及權利要求不包含特定的大模型關鍵字,而是專注于描述專利的應用,并且在專利說明書里面只對使用的GenAI過程進行了一般性描述。這使得我們很難將一些專利映射到五個核心GenAI模型,同時這5種不同的大模型在技術解決方案上也有一些重疊。因此以上的統計不免有些失真的情況,但是從總體上而言還是有說服力的。
根據《WIPO報告》顯示,真正活躍的GenAI大模型的研發實體,其實在中國。之后我們將研究中國的各大研發實體對GenAI應用的貢獻。敬請期待!