如何讓AI用最少的樣本來理解自然語言是個難題

來源：快科技時間：2021-09-14 13:42:01

AI人工智能是現在的熱門，很多服務都上了AI客服，如何讓AI用最少的樣本來理解自然語言是個難題，國內還有中文語言理解的需要。在日前的中文語言理解權威評測基準CLUE評測中，阿里的AI模型就拿到了雙料冠軍。

日前，中文語言理解權威評測基準CLUE公布了小樣本學習評測榜單FewCLUE的最新結果，阿里巴巴在大模型和無參數限制模型兩項賽事中雙雙刷新榜單最好紀錄，僅次于“人類”，并在極少(一個類別僅十余個)樣本條件下，超過了新聞文本分類上的人類識別精確度。

這證明了AI小樣本學習在NLP任務上具備超越人類的能力。

FewCLUE是CLUE最新推出的一項中文小樣本學習評測榜單，包括大模型和無參數限制模型雙賽道，用來評估預訓練模型是否能夠通過小樣本學習來掌握特定的自然語言處理任務。基于這項評估，科研人員可以更精準的衡量預訓練模型的泛化性和準確率。

眾所周知，預訓練模型在特定自然語言處理任務上要取得高精度的成本非常高，科研人員進而轉向攻關小樣本學習技術，希望用較低的成本實現可觀的識別精確度。

據悉，阿里云機器學習平臺PAI和和達摩院共同提出了一種大模型+小樣本的聯合方案，在大規模通用預訓練基礎之上，將億級知識圖譜融入預訓練模型，打造了強大的底座KGBert，結合Fuzzy-PET少樣本學習，在多個任務上比預訓練微調技術提升近25%了準確率，甚至在一個小樣本學習任務上的精準度超過了人類。

例如，在智能客服場景下的用戶需求識別，僅需人工標注幾十條樣本，就能讓需求識別的準確率達到90%。

值得一提的是，這項小樣本學習技術已在阿里巴巴的實際場景落地且有很好的業務表現，目前阿里云智能客服云小蜜僅用20條樣本就可以做到快速冷啟動，實現精準問答，準確率超過80%，并在政務、金融、通用線多個業務場景落地。開發者可基于PAI直接調用行業解決方案，也可以二次開發打造自己的模型。

阿里云PAI是國際領先的機器學習平臺，過去幾年陸續打破多項國內外AI記錄：2019年10月，英文多輪閱讀榜單QuAC取得第一;2020年3月，中文CLUE分類榜單取得第一;2020年8月，英文SuperGLUE取得國內第一，世界第二。

“我們希望通過算法與工程的協同設計構建端到端的大規模AI工程能力，用云上AI平臺PAI服務各行各業。”阿里巴巴副總裁、阿里云計算平臺負責人賈揚清表示：“目前，PAI支持從數據標注、模型設計、分布式訓練、模型管理和模型服務等AI資產管理的各方面需求，全面提升AI落地企業應用的效率。”

責任編輯：FD31

亚洲一区二区电影_青青操久久_亚洲狠狠婷婷综合久久久久_国产欧美日韩在线观看精品