天天综合色天天综合色h,欧美一区亚洲一区,亚洲精品成人一区,在线不卡日本v二区707

網(wǎng)站地圖 - 關于我們
您的當前位置: 首頁 > 業(yè)界 > 頭條 正文

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們

作者:用戶投稿 時間:2023-03-31 08:25 點擊:
導讀:開年以來,全球 AI 大模型行業(yè),鮮花著錦,比肩繼踵。微軟、Google、Meta、百度等科技巨頭你追我趕,掀開了大模型“軍備競賽”時代的序幕。新的挑戰(zhàn)者入局,大模型概念不斷走高,眾多 AI 企業(yè)紛紛宣告進軍,擁抱新一輪生產(chǎn)力革命

開年以來,全球 AI 大模型行業(yè),鮮花著錦,比肩繼踵。微軟、Google、Meta、百度等科技巨頭你追我趕,掀開了大模型“軍備競賽”時代的序幕。新的挑戰(zhàn)者入局,大模型概念不斷走高,眾多 AI 企業(yè)紛紛宣告進軍,擁抱新一輪生產(chǎn)力革命。

在國內(nèi),做類 ChatGPT 產(chǎn)品,建中國版 OpenAI,這個無與倫比的“性感故事”,引燃了互聯(lián)網(wǎng)大廠和科技大佬的創(chuàng)業(yè)熱情,AI 2.0 的“諸神之戰(zhàn)”已經(jīng)打響。

今年 2 月,原美團聯(lián)合創(chuàng)始人王慧文的一則“AI 英雄榜”,高調(diào)入局“劍指”大模型。之后,前搜狗 CEO 王小川、前京東 AI 掌門人周伯文、被譽為“AI 框架領域第一華人”的阿里技術副總裁賈揚清、出門問問創(chuàng)始人李志飛等一眾大佬爭先加入 ChatGPT 掀起的創(chuàng)業(yè)熱隊伍。

還有眾多背景華麗的創(chuàng)業(yè)團隊涌現(xiàn),其中清華大學處于身負眾望的頭一梯隊。比如,清華唐杰教授的智譜 AI,黃民烈教授的聆心智能,清華大學 NLP 實驗室的孫茂松、劉知遠團隊,深言科技豈凡超,以及循環(huán)智能楊植麟等等,都被頭部 VC 賦予了顛覆行業(yè)的希望,創(chuàng)業(yè)的列車再次提速。

互聯(lián)網(wǎng)大廠也不甘心錯過下一個時代。百度已經(jīng)率先推出“文心一言”,華為的“盤古”大模型,騰訊的“混元”AI 大模型,已經(jīng)蓄勢待發(fā)。還有阿里達摩院被曝要推出的類 ChatGPT 產(chǎn)品,字節(jié)跳動被爆正在布局大模型,科大訊飛也被傳出類 ChatGPT 技術將在今年 5 月落地公司 AI 學習機產(chǎn)品中的消息.......

生產(chǎn)力范式轉移,算力時代悄然開啟,一場 AIGC 帶來的奇幻革命正在進行。諸神之戰(zhàn)!決戰(zhàn)“中國版 ChatGPT”,誰會是最后的贏家?

一、創(chuàng)業(yè)派

王小川團隊

據(jù)公開信息,2022 年 6 月,王小川設立了人工智能技術公司 —— 北京百方眾智信息技術合伙企業(yè),自己占股 80%。另據(jù)媒體向王小川本人求證是否回歸創(chuàng)業(yè)做 AI 大模型的消息,王小川承認自己在“快速籌備中”。

《態(tài)℃ 》欄目從接近王小川的消息源獲知,王小川近期正在與產(chǎn)業(yè)界和學術界的一些重要人士進行密集溝通,目前項目還沒有公開,據(jù)說已經(jīng)搞定了一億美金的啟動資金,被稱作“親友輪”。

王小川于 1996 年獲得國際奧林匹克信息學競賽金牌,進入清華大學。進入搜狐后,在 2004 年主導推出搜狗搜索,并在 27 歲那年成為彼時中國互聯(lián)網(wǎng)界最年輕的高管。2015 年開始,王小川開始講 AI 的故事,以“自然交互 + 知識計算”為核心,推出 AI 翻譯機等產(chǎn)品。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖1)

搜狗在 2017 年 11 月登陸美國紐約證券交易所,上市四年多時間,營收最高峰停在 2019 年,營收 11.7 億美元,凈利潤 1.05 億。此后不斷下滑,2020 年營收降至 8.37 億美元,虧損 1.09 億美元,2021 前兩個季度,營收同比基本下降超過 44%。

2021 年 10 月初,搜狗完成私有化,并從紐交所退市。2021 年 9 月 4 日,搜狗宣布與騰訊完成合并。合并完成后,搜狗將成為騰訊控股間接全資子公司。2021 年 10 月 15 日,王小川發(fā)布郵件告別搜狗,卸任 CEO 職務,功成身退。

既有技術主義理想,又懂得商業(yè)的智慧,王小川無疑是殺向大模型賽道的一匹黑馬。

光年之外

前美團聯(lián)合創(chuàng)始人、高級副總裁王慧文宣布殺入 AI 大模型賽道,曾一度引發(fā)科技互聯(lián)網(wǎng)行業(yè)的熱議。

2 月 13 日,王慧文在社交媒體上發(fā)出 AI 英雄榜,宣布打造中國 OpenAI,成立北京光年之外科技有限公司(以下簡稱“光年之外”),出資 5 千萬美元,估值 2 億美元,自有資金占股 25%。王慧文進一步表示,下輪融資已有頂級 VC 認購 2.3 億美元。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖2)

3 月 27 日晚,王慧文創(chuàng)立的公司光年之外被傳將以換股形式收購北京一流科技,在現(xiàn)有團隊基礎之上,打造中國版的 ChatGPT。公開信息顯示,一流科技成立于 2017 年 1 月,自稱是世界上唯一一家以“創(chuàng)業(yè)團隊”身份研發(fā)通用深度學習框架的團隊。其產(chǎn)品 OneFlow 的競爭對手包括百度的 PaddlePaddle、谷歌的 TensorFlow 和 Facebook 的 PyTorch。

之前還有消息稱,美團創(chuàng)始人兼董事長王興個人將參與王慧文 AI 創(chuàng)業(yè)公司 A 輪融資,并出任董事。王興曾在朋友圈中表示,“AI 大模型讓我既興奮于即將創(chuàng)造出來的巨大生產(chǎn)力,又憂慮它未來對整個世界的沖擊。老王和我在創(chuàng)業(yè)路上同行近二十年,既然他決心擁抱這次大浪潮,那我必須支持。”

王慧文和王興曾聯(lián)合創(chuàng)辦校內(nèi)網(wǎng)(后更名人人網(wǎng)),此后又一起創(chuàng)辦了美團。2020 年 12 月,王慧文宣布從美團退休時,王興曾在公開信中表示:“老王和我是有共同志趣的同學和室友,是攜手創(chuàng)業(yè)的搭檔和并肩戰(zhàn)斗的戰(zhàn)友,更是可以思想碰撞、靈魂對話的一生摯友。”

兩年后,在 AI 大模型賽道,兩人再次走到一起,共同奔赴新的戰(zhàn)場。

Project AI 2.0

同樣高調(diào)入場的還有 AI 大牛李開復,3 月 19 日下午,其在朋友圈宣布成立 Project AI 2.0 公司。同一天,新公司在其創(chuàng)新工場官網(wǎng)正式上線。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖3)

據(jù)了解,Project AI 2.0 不僅僅要做中文版 ChatGPT。李開復認為,AI 2.0 不僅僅是個高能聊天工具,也不僅僅是圖文創(chuàng)作的 AIGC 生成,Co-pilot 和如今看到的應用都還只是 AI 2.0 能力的開端。

他還透露,Project AI 2.0 的資金、算力陸續(xù)到位,新公司期權由新團隊絕對主導,首批廣招大模型、多模態(tài)、NLP (自然語言處理)、AI 算法工程與研究、分布式計算 / Infrastructure 等方向大的頂級人才推薦自薦。

瀾舟科技

今年 3 月 14 日,語言大模型玩家瀾舟科技,剛剛完成了 Pre-A + 輪融資。本輪融資由北京中關村科學城公司領投,斯道資本和創(chuàng)新工場跟投。這也是瀾舟科技一年內(nèi)收獲的第 2 輪融資,累計總額已經(jīng)數(shù)億元。

和融資消息一同公布的還有瀾舟科技推出的語言生成模型 —— 孟子 MChat 可控大模型。據(jù)介紹,它有類 ChatGPT 的能力,加上原來瀾舟科技孟子大模型 N 個項目功能引擎,最終呈現(xiàn)出來的 MChat,既有對話能力,又具備翻譯、生成、信息搜索等能力。

瀾舟科技創(chuàng)始人周明是聞名世界的 NLP 專家,也是當今 NLP 領域成就最高的華人之一,他不僅是中國第一個中英翻譯系統(tǒng)的研制者,還在 2019 年成為 AI 語言領域最高級頂會 ACL(國際計算語言協(xié)會)主席。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖4)

公開資料顯示,周明先后就讀于重慶大學、哈爾濱工業(yè)大學和清華大學,并在清華大學擔任過副教授。創(chuàng)業(yè)前,周明長期在微軟亞洲研究院擔任 NLP 組的負責人、微軟亞研副院長。周明在 NLP 領域發(fā)表的文章數(shù)量居世界前列,2012 年至 2020 年期間,周明在 NLP 領域頂會發(fā)表的論文數(shù)量居全球第一。

MiniMax

MiniMax 在 2021 年 11 月成立,是一家頗為神秘的人工智能公司,成立至今,對外發(fā)聲次數(shù)屈指可數(shù)。根據(jù)明勢資本官方消息,2022 年上半年,明勢資本領投了 MiniMax 的天使輪融資。

但事實上,MiniMax 是國內(nèi)名列前茅的多模態(tài) AI 大模型創(chuàng)業(yè)公司,形成了文本到視覺(text to visual)、文本到語音(text to audio)、文本到文本(text to text)三大模態(tài)的基礎模型架構,可能也是國內(nèi)第一家同時擁有 3 個模態(tài)大模型能力的創(chuàng)業(yè)公司。

MiniMax 首款 C 端產(chǎn)品 Glow,和 ChatGPT 百科全書一樣的回答不同,Glow 的定位在 AI 虛擬聊天社交軟件,主打聊天、陪伴等情感功能,目前用戶數(shù)已經(jīng)破百萬。在 to B 方向,MiniMax 計劃在今年對外開放 API。

有媒體曾披露,MiniMax 聯(lián)合創(chuàng)始人為前商湯科技副總裁、通用智能技術負責人閆俊杰,也曾擔任商湯研究院副院長,搭建了商湯的人臉識別和智慧城市相關的技術體系。在深度學習和計算機視覺領域,閆俊杰發(fā)表頂級會議和期刊論文 100 余篇,Google Scholar 引用超過 10000 次。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖5)

目前,MiniMax 團隊人數(shù)已過百,公司核心技術研發(fā)成員均來自全球知名高校和全球頂尖科技公司,擁有世界頂尖自然語言處理,語音,計算機視覺,計算機圖形學等工業(yè)界和學術界經(jīng)驗,擁有多項全球領先的人工智能領域研究成果,具有上百個全球發(fā)明專利,1/3 的團隊成員擁有世界頂尖技術實驗室的博士學位。

銜遠科技

2 月 26 日晚,前京東 AI 掌舵人周伯文發(fā)布一則 AI 英雄帖,招募合伙人一起打造中國版 ChatGPT。這是繼前王慧文、王小川之后又一位下場的業(yè)界大牛。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖6)

周伯文長期致力于語音、自然語言處理、多模態(tài)內(nèi)容理解與生成、知識表征與推理、人機對話、可信賴 AI 等研究領域及其在產(chǎn)業(yè)化、數(shù)智化的應用。他提出的自注意力融合多頭機制的自然語言表征機理后來成為 Transformer 架構的核心思想之一,他還曾與圖靈獎得主 Yoshua Bengio 在 NLP 方向合作一篇論文,至今被引用 2000 多次,其論文總引用次數(shù)也高達近 15000。

周伯文自 2021 年底從京東離職后,轉去學術界,擔任清華大學惠妍講席教授、電子系長聘教授 、清華大學電子系協(xié)同交互智能研究中心主任。同時,他還是銜遠科技的創(chuàng)始人、首席科學家。

在英雄帖中,周伯文也表達了銜遠科技參與 ChatGPT 這一波所走的差異化路線 —— 中國的 OpenAI 需要探索一條新的道路:垂直整合從自有基礎大模型到應用、用戶全場景閉環(huán),實現(xiàn)生成式人工智能技術與商業(yè)價值 "雙落地"。

今年 3 月 1 日,銜遠科技宣布已經(jīng)完成數(shù)億元天使輪融資,本輪融資由啟明創(chuàng)投領投,經(jīng)緯創(chuàng)投跟投。

二、學院派

智譜 AI

智譜 AI 由清華大學計算機系唐杰教授創(chuàng)立,團隊核心成員曾參與清華大學與智源研究院合作項目「悟道」的研發(fā)工作,具有豐富的大模型經(jīng)驗。

2022 年 8 月,清華大學知識工程實驗室與智譜 AI 合作研發(fā)的超大規(guī)模預訓練語言模型 GLM-130B 正式上線,在多個公開評測集上性能超過 GPT-3。

去年 9 月,智譜 AI 宣布獲得數(shù)億元人民幣 B 輪融資,由君聯(lián)資本和啟明創(chuàng)投聯(lián)合領投,本輪融資將被用于繼續(xù)投入到打造高性能千億級普惠大模型。

唐杰,清華大學計算機系教授,剛剛入選 2023 AAAI Fellow,也是 ACM / IEEE Fellow。研究方向包括人工智能、數(shù)據(jù)挖掘、社交網(wǎng)絡、機器學習和知識圖譜等,曾獲 ACM SIGKDD Test-of-Time Award(十年最佳論文)。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖7)

就在 GPT4 發(fā)布的同一天,唐教授在微博宣布:基于千億參數(shù)大模型的對話機器人 ChatGLM,現(xiàn)在開啟邀請制內(nèi)測。據(jù)介紹,這是一個初具問答和對話功能的千億中英語言模型。

聆心智能

另一支赫赫有名的清華系 NLP 隊伍,是交互式人工智能(CoAI)課題組教授朱小燕和其學生黃民烈團隊,他們先后提出過 SentiLARE、StoryGPT 等預訓練模型。

黃明烈副教授于 2021 年創(chuàng)立聆心智能,專注心理咨詢賽道,致力于打造“超擬人底層大模型”。2022 年團隊上線“AI 烏托邦”對話機器人,支持自定義 AI 人設進行聊天交互。團隊核心成員均來自于清華大學、卡內(nèi)基梅隆大學、谷歌等國內(nèi)外頂尖高校及公司,具有豐富的商業(yè)化經(jīng)驗。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖8)

作為國內(nèi)具備訓練超大規(guī)模語言模型能力的團隊之一,聆心智能將自己定位為 "中國的 Character AI", 旨在提供情感陪伴的文本生成服務,公司目前已完成 Pre-A 輪融資。

黃明烈本人是自然語言生成領域的資深專家,清華大學計算機科學與技術系長聘副教授,國家杰出青年科學基金獲得者,智能技術與系統(tǒng)實驗室副主任。研究興趣主要集中在人工智能、深度學習、強化學習,自然語言處理如自動問答、對話系統(tǒng)、情感與情緒智能等。已超過 100 篇 CCF A / B 類論文發(fā)表在 ACL、IJCAI、AAAI、EMNLP、KDD、ACM TOIS、TASLP、TKDE 等國際頂級或主流會議及期刊上。

清華大學 NLP 實驗室的孫茂松、劉知遠團隊

從 NLP 的學科方向上看,清華系孫茂松、劉知遠團隊算其中一股中堅力量,來自清華自然語言處理與社會人文計算實驗室(THUNLP)。THUNLP 成立于上世紀 70 年代的實驗室,牽頭人是國內(nèi) NLP 研究領域的泰斗黃昌寧。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖9)

清華大學自然語言處理與社會人文計算實驗室(THUNLP),是國內(nèi)最早開展 NLP 研究、且極具影響力的科研單位。實驗室于 20 世紀 70 年代末成立之初,由中國 NLP 開山人物黃昌寧帶領,ACL Fellow 孫茂松是他的學生,劉知遠則是孫茂松的學生。

在語言大模型方面,孫茂松、劉知遠團隊從 2018 年跟進預訓練范式,2019 年初發(fā)布了 ERNIE 語言模型(與同時期百度版 ERNIE 同名),之后研發(fā)了 CPM 模型,是智源研究院「悟道?文源」的前身。

2021 年底,該團隊發(fā)布了機器中文語言能力評測基準“智源指數(shù)”(CUGE),以評測和推動中文 NLP 的發(fā)展。一個是 AI 寫詩模型“九歌”,訓練過程中學習了 80 萬首中國古詩;另一個是語言表征模型 ERNIE(和百度文心大模型同名),可與當時任務最優(yōu)的 BERT 媲美。

深言科技

孫茂松、劉知遠及其門下畢業(yè)的學生,在 NLP 和大模型領域已孵化了多個公司。其中就包括豈凡超于 2022 年成立的深言科技,致力于以自研中文大模型構建工業(yè)級中文信息處理引擎。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖10)

2019 年,清華大學自然語言處理實驗室(THUNLP)研制出一款名為 WantWords 的反向詞典,能夠根據(jù)語義描述查找詞語,可用于寫作輔助等多個場景;2021 年 11 月,這款應用突然在微博爆紅,多次擠爆了服務器;2022 年 5 月,基于語義的名言名句檢索系統(tǒng) WantQuotes 上線,截至去年 8 月,WantWords 和 WantQuotes 已有超 200 萬用戶。

這支團隊就是深言科技的前身,目前當初研發(fā)這款應用的幾位同學目前已畢業(yè),并和他們的導師孫茂松教授一同創(chuàng)辦了創(chuàng)業(yè)公司深言科技(DeepLang AI),公司成立之初即獲得一線 VC 千萬元級投資。

深言科技的 CEO 豈凡超在人工智能和自然語言處理領域的國際刊物發(fā)表論文近 30 篇,申請專利十余項。目前,深言科技團隊的核心成員主要由清華大學的博士、碩士組成,并由孫茂松教授領銜擔任首席科學家。

循環(huán)智能

在這次激烈的大模型“軍備競賽”中,不乏履歷光鮮的 90 后創(chuàng)業(yè)者出現(xiàn),首屈一指的就是循環(huán)智能聯(lián)合創(chuàng)始人楊植麟。

楊植麟本科就讀于清華大學計算機系,師從 IEEE Fellow 唐杰,2015 年以年級第一名的優(yōu)異成績畢業(yè);隨后,赴自然語言處理(NLP)研究全球排名第一的卡內(nèi)基梅隆大學語言技術研究所(LTI)攻讀博士,師從蘋果 AI 研究負責人 Ruslan Salakhutdinov 和谷歌首席科學家 William Cohen,4 年即拿下博士學位。

博士期間,他與圖靈獎得主 Yoshua Bengio 合作發(fā)布「火鍋問答」數(shù)據(jù)集 HotpotQA,又以一作身份發(fā)表的 XLNet 與 Transformer-XL 在 NLP 領域產(chǎn)生重要影響,成為 NeurIPS 2019 與 ACL 2019 的最高引論文之一,谷歌學術引用次數(shù)直接破萬……

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖11)

這位 90 后創(chuàng)業(yè)者不僅學術履歷優(yōu)秀,在產(chǎn)業(yè)界的表現(xiàn)也可圈可點。2016 年,楊植麟創(chuàng)立循環(huán)智能,公司主要業(yè)務是運用 NLP、語音、多模態(tài)、大模型等人工智能技術打造“銷售科技”方案。與此同時,智譜 AI 和清華研究團隊的多個 AI 項目由他主導,例如華為的“盤古”大模型也是楊植麟團隊和華為云聯(lián)合推出的。

目前,循環(huán)智能已進行到 B 輪融資,并連續(xù)三年實現(xiàn)了超 200% 的營收增長。

復旦邱錫鵬教授團隊

2 月 20 日,復旦大學自然語言處理實驗室的邱錫鵬教授團隊攜上海人工智能實驗室發(fā)布“國內(nèi)第一個對話式大型語言模型 MOSS”,它是一種類似于 ChatGPT 的對話聊天機器人或語言模型,可以執(zhí)行各種功能,例如給出答案、生成對話、編寫代碼等。邱錫鵬教授介紹,對話式大型語言模型 MOSS 大概有 200 億參數(shù)。

據(jù)介紹,未來,MOSS 的優(yōu)化將會圍繞三方面展開:團隊會準備更高質(zhì)量的中文數(shù)據(jù);會開放接口,讓 MOSS 與人類進行對話,收集更多的對話數(shù)據(jù);同時,團隊還會進一步加大投入,擴大其參數(shù)規(guī)模。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖12)

邱錫鵬教授為自然語言處理領域的資深學者,曾主導開發(fā) NLP 工具 FudanNLP, 團隊主要研究方向為自然語言處理和深度學習。目前,邱錫鵬與他的 MOSS 團隊 ——8 位年輕的復旦學生,正緊鑼密鼓地開展內(nèi)測和迭代工作。

三、大廠派

百度

3 月 16 日,百度啟動基于百度新一代大語言模型的生成式 AI 產(chǎn)品“文心一言”的邀請測試,使用場景主要包含文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖13)

目前來看,“文心一言”的基礎能力還算扎實,具備文學創(chuàng)作能力,可以進行總結、分析、內(nèi)容、檢索,延伸至檢索增強。只是,從當前的測試狀態(tài)來看,不乏“翻車現(xiàn)場”,達到的效果并不算是完美。

百度一直堅持壓強式、馬拉松式的研發(fā)投入。百度高額的研發(fā)投入主要集中在 AI 領域,自 2012 年成立 AI 部門開始百度在十年里累計投入到 AI 方面的研發(fā)費用超過了 1000 億元,是全球大廠中極少數(shù)具有能支撐訓練大語言模型的公司。

從算力、算法到數(shù)據(jù),從高端芯片昆侖芯,到飛槳深度學習框架,百度在各個層面都早有關鍵自研技術,給百度文心一言提供了一定的研發(fā)投入壁壘。

華為

2021 年 4 月,盤古大模型正式對外發(fā)布。其中盤古 NLP 大模型是業(yè)界首個千億參數(shù)的中文預訓練大模型,在 CLUE 打榜中實現(xiàn)了業(yè)界領先。為了訓練 NLP 大模型,團隊在訓練過程中使用了 40TB 的文本數(shù)據(jù),包含了大量的通用知識與行業(yè)經(jīng)驗。

3 月 27 日有消息傳出,華為盤古大模型 4 月將發(fā)布,將對標 CHATGPT,同樣達到千億級參數(shù)量,是全球最大的中文語言 AI 訓練大模型,由華為與鵬城實驗室聯(lián)合開發(fā),鵬城云腦二期提供算力底座。

華為這方面的核心人物,是國際歐亞科學院院士、IEEE Fellow、華為云人工智能領域首席科學家田奇。加入華為之前,田奇已經(jīng)是業(yè)界知名的 AI 領域?qū)W者。他是美國伊利諾伊大學香檳分校博士、IEEE Fellow,也是原德州大學圣安東尼奧分校計算機系正教授。在高校任教 17 年之后,帶著學術界的前沿思考和科研成果,田奇與團隊來到了產(chǎn)業(yè)一線。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖14)

騰訊

AI 大模型方面,騰訊表示正大力投入人工智能與云基礎設施建設,騰訊混元 AI 大模型覆蓋 NLP(自然語言處理)、CV(計算機視覺)、多模態(tài)等基礎模型和眾多行業(yè)與領域模型,還推出了萬億中文 NLP 預訓練模型。

2022 年 4 月,騰訊首次對外披露 HunYuan 大模型研發(fā)進展 —HunYuan 集 CV、NLP、多模態(tài)理解能力于一體,先后在 MSR-VTT、MSVD 等五大權威數(shù)據(jù)集榜單中登頂。

2022 年 5 月,“混元”在國際公認的 CLUE 三個榜單同時登頂,一舉打破三項紀錄。去年年底,騰訊 HunYuan 進一步推出國內(nèi)首個低成本、可落地的 NLP 萬億大模型,并再次登頂自然語言理解任務榜單 CLUE。

據(jù)悉,HunYuan 是業(yè)界首個可在工業(yè)界海量業(yè)務場景直接落地應用的萬億 NLP 大模型,最快用 256 張卡,1 天內(nèi)就能訓練完成,成本直接降至原來的 1/8。

阿里達摩院

AI 大模型方面,據(jù)阿里研究院公布的信息顯示,達摩院在 2020 年初啟動中文多模態(tài)預訓練模型 M6 項目,同年 6 月推出 3 億參數(shù)的基礎模型;2021 年 1 月模型參數(shù)規(guī)模到達百億;2021 年 5 月,具有萬億參數(shù)規(guī)模的模型正式投入使用;2020 年 10 月,M6 的參數(shù)規(guī)模擴展到 10 萬億,成為當時全球最大的 AI 預訓練模型。

M6 于 2021 年 3 月首次發(fā)布,后來通過 480 塊 GPU 更迭至萬億參數(shù),并成功在 10 天內(nèi)訓練出 10 萬億模型,其參數(shù)規(guī)模與 GPT-3 相當,但能耗僅為其 1%。

阿里云曾表示,M6 已在超 40 個場景中應用,日調(diào)用量上億。在阿里云內(nèi)部,M6 大模型的應用包括但不限于在犀牛智造為品牌設計的服飾已在淘寶上線、為天貓?zhí)摂M主播創(chuàng)作劇本,以及增進淘寶、支付寶等平臺的搜索及內(nèi)容認知精度等,尤其擅長設計、寫作、問答,在電商、制造業(yè)、文學藝術、科學研究等前景中落地。

M6 的負責人為楊紅霞,據(jù)公開資料,楊紅霞 2007 年本科畢業(yè)于南開大學,獲統(tǒng)計學學士學位。其后她去往美國杜克大學統(tǒng)計科學系攻讀博士學位,師從 David Dunson 教授。博士畢業(yè)后,先入職 IBM 全球研發(fā)中心任 Watson 研究員,之后入職雅虎公司擔任首席數(shù)據(jù)科學家。楊紅霞在人工智能領域國際會議、頂級期刊有上百篇頂級論文。

諸神之戰(zhàn)!一文盤點中國“大模型”玩家們(圖15)

不過,3 月 22 日有消息傳出,阿里巴巴的語言生成大模型 M6 的原帶頭人楊紅霞已加入字節(jié)跳動 AI Lab,擔任語言生成大模型的研發(fā)領導。

字節(jié)跳動

據(jù)媒體消息,字節(jié)跳動方面正在大模型方面布局、在語言與圖像模態(tài)方面發(fā)力。字節(jié)跳動相關技術負責人表示,技術中臺在這些領域的探索仍處于初期,尚未成熟。

報道稱,語言大模型團隊由字節(jié)搜索部門領導,目前規(guī)模在十數(shù)人左右;圖片大模型團隊由產(chǎn)品研發(fā)與工程架構部下屬的智能創(chuàng)作團隊牽頭。

知情人士表示,字節(jié)跳動語言大模型團隊在今年組建,探索方向主要為與搜索、廣告等下游業(yè)務的結合,語言大模型團隊的預期是在今年年中推出大模型。

科大訊飛

科大訊飛于 2022 年 12 月份啟動生成式預訓練大模型“1+N”任務攻關,其中“1”是通用認知智能大模型算法研發(fā)及高效訓練底座平臺,“N”是應用于教育、醫(yī)療、人機交互、辦公、翻譯、工業(yè)等多個行業(yè)領域的專用大模型版本。

公開資料披露,科大訊飛類 ChatGPT 技術將在今年 5 月落地公司 AI 學習機產(chǎn)品中。

科大訊飛在教育、醫(yī)療、司法等不同行業(yè)多年的規(guī)模化應用積累了超過 50TB 的行業(yè)語料和每天超 10 億人次用戶交互數(shù)據(jù),為訓練實現(xiàn)達到人類專家水平的行業(yè)認知大模型提供了海量行業(yè)文本語料和用戶反饋數(shù)據(jù),也為基于大模型的創(chuàng)新應用研發(fā)和試點推廣提供了場景保障。

結語:

1769 年,英國人瓦特改良的蒸汽機掀開了熱力時代的序幕。今天,伴隨 AI 算量需求急劇增加,倒逼傳統(tǒng)計算架構加速革新,算力時代已經(jīng)悄然開啟。

未來,AI 大模型技術的影響力,有可能接近印刷術,蒸汽機,電力,芯片,互聯(lián)網(wǎng),其所帶來的巨大顛覆性,可能引領人類社會整個技術發(fā)展產(chǎn)生躍遷,結果是會導致人類經(jīng)濟產(chǎn)生非線性的躍遷。

誘人的前景下,也是指數(shù)級上升的入場難度。

首先,高算力就代表著高成本,意味著 AI 2.0 時代創(chuàng)業(yè)的絕對高門檻,沒有雄厚的資金支撐根本無法承擔 AI 訓練的費用,這也預示著進場船票非常難得,非大廠和明星創(chuàng)業(yè)者團隊,幾乎沒有跑完全程的希望。

同時,AI 2.0 創(chuàng)業(yè)對技術有了更嚴苛的要求。有投資人向《態(tài)℃》欄目透露,市面上但凡能做底層的模型,不管是去做語言大模型的,還是去做強化學習的,只要以技術見長,以工程化產(chǎn)品化的思維做底層模型的公司,真正有技術水平的創(chuàng)業(yè)公司,國內(nèi)尚不超過十家。

最后,AI 大模型頂級的技術人才是更為稀缺的資源。大佬們下場,打的第一場仗就是搶人,畢竟國內(nèi)真正主導開發(fā)深度學習框架、人工智能框架的頂尖技術大牛少之又少,優(yōu)秀人才可謂可遇不可求。

這場諸神之戰(zhàn),最終誰將脫穎而出引領下一個時代?對于中國科技公司,距離終點仍有漫長的道路要摸索、攀登。

打賞

取消

感謝您的支持,我會繼續(xù)努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關推薦:

網(wǎng)友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

欄目分類
Copyright ? 2021 早報網(wǎng) 版權所有
蘇ICP備2024138443號

蘇公網(wǎng)安備32130202081338號

本網(wǎng)站所刊載信息,不代表早報網(wǎng)觀點。如您發(fā)現(xiàn)內(nèi)容涉嫌侵權違法立即與我們聯(lián)系客服 106291126@qq.com 對其相關內(nèi)容進行刪除。
早報網(wǎng)登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內(nèi)容僅供參考,不構成投資建議。投資者據(jù)此操作,風險自擔。
《早報網(wǎng)》官方網(wǎng)站:www.www.mfzxfx.com互聯(lián)網(wǎng)違法和不良信息舉報中心
Top 主站蜘蛛池模板: 达孜县| 陈巴尔虎旗| 勃利县| 临澧县| 都昌县| 论坛| 大关县| 海原县| 上犹县| 石门县| 普安县| 海南省| 静乐县| 台南县| 霍林郭勒市| 边坝县| 扎囊县| 太保市| 阿图什市| 清镇市| 吉安市| 噶尔县| 嵊州市| 宁远县| 治县。| 沁源县| 麻江县| 封开县| 石城县| 东港市| 茂名市| 祁东县| 安远县| 华坪县| 长沙市| 荃湾区| 南宁市| 蒙山县| 盐源县| 岫岩| 广灵县|