一文看懂:華為盤古系列AI大模型到底是個啥?(附:盤古發佈會觀看地址)

註:華為將在4月8日上午11:00,發表《盤古大模型的進展及其應用》的專題演講,主講人是田奇(華為雲人工智能首席科學傢),內容非常有看點。觀看地址見文後(或置頂評論)。

首先要跟大傢說明的是,華為盤古AI大模型是一個系列,並不是隻有一個!根據華為雲官方資料,盤古系列大模型包括以下五個基礎大模型(L0):

中文語言(NLP)大模型

視覺(CV)大模型

多模態大模型

科學計算大模型

圖網絡(Graph)大模型

盤古大模型的結構圖

中文語言(NLP)大模型,是業界首個超千億參數的中文預訓練大模型,被認為是最接近人類中文理解能力的AI大模型。與ChatGPT等外國AI模型相比,華為盤古大模型更註重針對中文語言的優化。其首次使用Encoder-Decoder架構,兼顧NLP理解與生成的能力。在預訓練階段學習瞭超40TB文本數據,並通過行業數據的小樣本調優,提升模型在場景中的應用性能。在權威的中文語言理解評測基準CLUE榜單中,盤古NLP大模型在總排行榜及分類、閱讀理解單項均排名第一,刷新三項榜單世界歷史紀錄;總排行榜得分83.046(人類水平是85.61分),多項子任務得分業界領先。

視覺(CV)大模型,是超過30億參數的業界最大CV大模型,首次實現模型按需抽取,首次實現兼顧判別與生成能力。它可以基於模型大小和運行速度需求,自適應抽取不同規模模型,AI應用開發快速落地,使AI開發進入工業化模式,。使用層次化語義對齊和語義調整算法,在淺層特征上獲得瞭更好的可分離性,使小樣本學習的能力獲得瞭顯著提升,達到業界第一。

CV大模型的訓練過程

圖網絡(Graph)大模型,首創圖網絡融合技術,在工藝優化、時序預測、智能分析等場景有廣泛應用。

多模態大模型,具備圖像和文本的跨模態理解、檢索與生成能力。

科學計算大模型,主要解決各種科學問題,旨在用AI促進基礎科學的發展。

盤古L0大模型 圖片來源:浙商證券研究所

除瞭以上五個基礎大模型(L0)以外,盤古大模型不斷進化,共分為L0、L1、L2三個層級。L0指基礎大模型,L1指行業大模型,L2則是指面向更加細分場景的推理模型。

盤古氣象大模型

盤古小分子藥物大模型

目前在L1級別的行業大模型方面,華為已經推出瞭盤古金融大模型、盤古礦山大模型、盤古氣象大模型、盤古電力大模型、盤古制造質檢大模型、盤古藥物分子大模型等行業大模型。

在L2級細分場景模型方面,華為已經推出,例如基於氣象大模型的短臨氣象預報、臺風預測等場景模型;例如基於電力大模型的無人機電力巡檢、電力缺陷識別等場景模型;例如基於時尚大模型的時尚輔助設計、時尚版權保護等場景模型。此外,在物聯網、智能座艙、智能駕駛等領域,華為都已推出基於盤古大模型的各種應用。

盤古大模型生態 圖片來源:浙商證券研究所

在生態建設方面,華為盤古大模型是基於昇騰計算產業生態。關於AI生態型產業鏈,華為提出“一平臺雙驅動”的模式。其中“一平臺”指基礎軟件平臺,包括AI處理器、服務器硬件以及芯片使能軟件、AI框架。“雙驅動”指平臺要支撐的兩大生態,一是技術生態,二是商業生態,包括ISV(獨立軟件開發商)、IHV(獨立硬件開發商)、整機、一體機合作夥伴等。

華為盤古生態產業鏈

華為將在4月8日上午11:00,在《人工智能大模型技術高峰論壇》上,發表《盤古大模型的進展及其應用》的專題演講,主講人是田奇(華為雲人工智能首席科學傢),內容非常有看點。觀看地址如下:

觀看地址如下:

https://weibo.com/7585110331/MAtJFlO4t

赞(0)