從元宵節(jié)AI做畫,到高考季度曉曉的高分作文;從百度APP對(duì)話式搜索,到龔俊數(shù)字虛擬人的聊天……今年以來(lái),百度文心大模型頻頻創(chuàng)造社會(huì)熱點(diǎn),AI已經(jīng)離我們?cè)絹?lái)越近了。
這不是錯(cuò)覺(jué),AI正在我們每個(gè)人的工作、生活中潛移默化、潤(rùn)物無(wú)聲地滲透。這背后,是大模型加速落地、開(kāi)啟價(jià)值階段的轉(zhuǎn)折點(diǎn)。
「?01?」
場(chǎng)景“大爆炸” 度曉曉“出圈”
今年的高考季,數(shù)字人度曉曉“出圈”了。
每年的高考作文都會(huì)成為公眾的一大關(guān)注點(diǎn)。今年語(yǔ)文考試結(jié)束后,百度數(shù)字人度曉曉化身為“數(shù)字人考生”,挑戰(zhàn)高考作文寫作——《本手、妙手、俗手》這篇議論文,在40秒內(nèi)就創(chuàng)作了40多篇文章,平均1秒生成1篇。
不僅速度快,文章結(jié)構(gòu)還非常完整,論述邏輯清晰、文字語(yǔ)言流暢,文中還大量引用了名人名言,并使用了排比、比喻等修辭手法。面對(duì)高考作文寫作“審題”、“邏輯”和“創(chuàng)意”等挑戰(zhàn),度曉曉在文心大模型的幫助指導(dǎo)下,又快又好地完成了寫作。
曾擔(dān)任北京高考語(yǔ)文閱卷組組長(zhǎng)的申怡,為度曉曉的作文打出了48分的成績(jī)(滿分60分),這一分?jǐn)?shù)已經(jīng)超過(guò)75%的高考考生。
作為一個(gè)數(shù)字人,度曉曉不僅能答題,還能變身學(xué)習(xí)助理,為考生提供虛擬服務(wù),包括整合多模態(tài)交互技術(shù)、3D數(shù)字人建模、機(jī)器翻譯、語(yǔ)音識(shí)別、自然語(yǔ)言理解等多項(xiàng)技術(shù)能力,可以在查分、報(bào)志愿、查錄取等重要高考節(jié)點(diǎn)推送提醒,確??忌图议L(zhǎng)不會(huì)錯(cuò)過(guò)任何重要信息,還能根據(jù)考生的不同特點(diǎn),智能推送個(gè)性化的報(bào)考推薦和優(yōu)質(zhì)內(nèi)容。
另外,“度曉曉”還能與考生進(jìn)行智能聊天對(duì)話,通過(guò)情感陪伴的方式幫助用戶緩解壓力與情緒波動(dòng),全程陪伴考生及家長(zhǎng)。
在百度文心大模型的加持下,度曉曉的角色還可以從高三考生秒變AI藝術(shù)生,帶著她的畫作“現(xiàn)身”西安美術(shù)學(xué)院的2022年“時(shí)空留痕·無(wú)界西美”本科畢業(yè)展。在其展出的用AI創(chuàng)作的六幅繪畫作品中,除了四幅與“無(wú)界”主題強(qiáng)相關(guān)的作品(《自然與虛擬》、《火星上的月亮》、《沙漠中的孤島》、《顏色與星空》)外,還有兩幅有關(guān)西安大雁塔的特別作品。度曉曉僅用數(shù)十秒就完成了作品,而且“已經(jīng)達(dá)到了本科美術(shù)畢業(yè)生的基本要求”。
擁有一個(gè)智慧的靈魂——文心大模型,度曉曉可以分飾多個(gè)角色,可以跟據(jù)場(chǎng)景換不同的造型,也可以換個(gè)合適的名字。
在百度自己的智能化產(chǎn)品中,語(yǔ)音搜索、信息推薦、對(duì)話系統(tǒng)、智能音箱、自動(dòng)駕駛等方面都得到了實(shí)踐。比如在百度App端內(nèi)的AI數(shù)字人,目前主要可以實(shí)現(xiàn)四大功能:即個(gè)性化聊天陪伴、輔助搜索、服務(wù)分發(fā)和互動(dòng)玩法。
在外部,文心大模型已落地工業(yè)、能源、金融、通信、媒體等領(lǐng)域,通過(guò)飛槳開(kāi)源開(kāi)放平臺(tái)、百度智能云等賦能到各行各業(yè),個(gè)人、企業(yè)開(kāi)發(fā)者數(shù)量超6萬(wàn)。
隨著“度曉曉”一次次出圈,你才突然發(fā)現(xiàn)AI已經(jīng)遍地開(kāi)花。
在AI遍地開(kāi)花的同時(shí),其價(jià)值也在不斷被驗(yàn)證:在媒體行業(yè),可以激發(fā)創(chuàng)新,提升內(nèi)容多樣性,降低制作成本;在保險(xiǎn)領(lǐng)域,能夠讓文本處理效率提升30倍;在人力資源應(yīng)用中,候選人信息智能分類識(shí)別準(zhǔn)確率可高達(dá)99%;在醫(yī)療領(lǐng)域應(yīng)用中,病歷檢查時(shí)間從30分鐘縮短到了秒級(jí)……
一項(xiàng)技術(shù)的快速普及,其要素之一就是廣泛的應(yīng)用場(chǎng)景,并且能在場(chǎng)景中產(chǎn)生價(jià)值。從過(guò)去這兩年文心大模型落地的應(yīng)用來(lái)看,場(chǎng)景正在不斷豐富,尤其是今年呈現(xiàn)出“大爆炸”之勢(shì),與此同時(shí)應(yīng)用價(jià)值也逐漸被用戶認(rèn)可。此次度曉曉出圈,也讓更多人看到了AI的價(jià)值,無(wú)疑將對(duì)AI的普及起到進(jìn)一步催化作用。
「?02?」
技術(shù)成熟,文心大模型已是“優(yōu)秀生”
預(yù)訓(xùn)練大模型在AI進(jìn)程中為什么重要?它如同AI“輪子”,解決場(chǎng)景碎片化的難題,是AI從作坊式變成工廠式生產(chǎn)的通用工具。所以,大模型在一定程度上也決定著AI落地的速度。
所謂預(yù)訓(xùn)練大模型,是通過(guò)自監(jiān)督學(xué)習(xí)的方法,讓模型對(duì)海量無(wú)標(biāo)注數(shù)據(jù)中的規(guī)律和知識(shí)進(jìn)行提煉、學(xué)習(xí),當(dāng)面向?qū)嶋H任務(wù)和場(chǎng)景應(yīng)用時(shí),只需要少量的任務(wù)標(biāo)注數(shù)據(jù),就能通過(guò)持續(xù)微調(diào)得到在應(yīng)用場(chǎng)景中非常好用的模型。從這一點(diǎn)可以看到,其特點(diǎn)就是通用性強(qiáng)、泛化性強(qiáng),易用且好用。也正是因此,全球科技巨頭都在預(yù)訓(xùn)練大模型領(lǐng)域投入研發(fā)力量,展開(kāi)“軍備競(jìng)賽”。
百度是中國(guó)企業(yè)中走得早、走得快的科技企業(yè)之一。2019年3月,百度率先發(fā)布國(guó)內(nèi)首個(gè)正式開(kāi)放的預(yù)訓(xùn)練模型ERNIE 1.0,那個(gè)時(shí)候這項(xiàng)技術(shù)還相對(duì)稚嫩。此后兩年兩次升級(jí),到2021年7月,百度百億參數(shù)規(guī)模的知識(shí)增強(qiáng)型預(yù)訓(xùn)練模型ERNIE 3.0 問(wèn)世,這是當(dāng)時(shí)業(yè)界首次在百億級(jí)預(yù)訓(xùn)練模型中引入大規(guī)模知識(shí)圖譜。
ERNIE 3.0 一舉刷新了54個(gè)中文NLP任務(wù)基準(zhǔn),其英文模型在國(guó)際權(quán)威的復(fù)雜語(yǔ)言理解任務(wù)評(píng)測(cè)SuperGLUE上,以超越人類水平0.8個(gè)百分點(diǎn)的成績(jī)登頂全球榜首,處于全球領(lǐng)先地位。當(dāng)年12月,百度聯(lián)合鵬城實(shí)驗(yàn)室打造了“鵬城-百度·文心”(代號(hào)ERNIE 3.0 Titan),這是全球首個(gè)知識(shí)增強(qiáng)千億大模型,參數(shù)規(guī)模達(dá)到了2600億,是當(dāng)時(shí)全球最大中文的單體模型。就在剛剛結(jié)束的WAVE SUMMIT 2022深度學(xué)習(xí)開(kāi)發(fā)者峰會(huì)上,文心大模型又迎來(lái)一系列重大升級(jí)——ERNIE 3.0 Zeus成為融合了任務(wù)相關(guān)知識(shí)的千億大模型,也是國(guó)內(nèi)首個(gè)開(kāi)放API調(diào)用的千億大模型。
文心大模型的一大特色是“知識(shí)增強(qiáng)”,即引入知識(shí)圖譜,將數(shù)據(jù)與知識(shí)融合,使得學(xué)習(xí)效率更高、可解釋性更好。今天,用AI進(jìn)行創(chuàng)作已經(jīng)很成熟,從財(cái)經(jīng)、體育類新聞快訊,再到詩(shī)歌、小說(shuō)等文學(xué)創(chuàng)作,AI寫作覆蓋的領(lǐng)域越來(lái)越廣,創(chuàng)作形式和內(nèi)容也變得更加豐富多彩。
這次支持度曉曉完成高考作文的,就是文心大模型最新發(fā)布的融合任務(wù)相關(guān)知識(shí)的千億大模型ERNIE 3.0 Zeus。這一模型在學(xué)習(xí)海量數(shù)據(jù)和知識(shí)的基礎(chǔ)上,進(jìn)一步學(xué)習(xí)了百余種不同形式的任務(wù)知識(shí),增強(qiáng)了模型的效果,在各類NLP任務(wù)上都表現(xiàn)出更強(qiáng)大的零樣本和小樣本學(xué)習(xí)能力。
技術(shù)的成熟度,是市場(chǎng)普及的另一個(gè)關(guān)鍵因素。短短幾年時(shí)間,百度文心大模型已經(jīng)成為業(yè)界的優(yōu)秀生。隨著技術(shù)的成熟,只需要少量的任務(wù)標(biāo)注數(shù)據(jù),就能通過(guò)持續(xù)微調(diào)得到在應(yīng)用場(chǎng)景中非常好用的模型,進(jìn)一步加速在各類場(chǎng)景中的應(yīng)用落地。
以AI創(chuàng)作的一些例子來(lái)分析,在文心大模型的支持下,利用AI自動(dòng)生成內(nèi)容的新型生產(chǎn)方式——AIGC已經(jīng)滲透到諸多場(chǎng)景中,并且愈發(fā)成熟:AI作畫、AI寫歌、AI剪輯、虛擬主持、智能客服……根據(jù)百度研究院預(yù)測(cè),2022年AIGC技術(shù)將借助大模型的跨模態(tài)綜合技術(shù)能力,實(shí)現(xiàn)更為規(guī)?;膽?yīng)用。
對(duì)此《經(jīng)濟(jì)學(xué)人》最近發(fā)表的一篇關(guān)于大模型的文章也指出,文心ERNIE大模型是中國(guó)最好的預(yù)訓(xùn)練大模型,“AIGC的普及,能夠給人類的創(chuàng)作帶來(lái)更多靈感?!?/p>
「?03?」
搭橋鋪路,由點(diǎn)到面加速普及
基于技術(shù)成熟、場(chǎng)景價(jià)值的基礎(chǔ),AI普及的第三個(gè)要素就是實(shí)現(xiàn)路徑。
在今年WAVE SUMMIT 2022深度學(xué)習(xí)開(kāi)發(fā)者峰會(huì)上,百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心副主任吳甜認(rèn)為,今年是大模型的落地關(guān)鍵年,她對(duì)此強(qiáng)調(diào):“要做好落地,需要解決的關(guān)鍵問(wèn)題,是前沿的大模型技術(shù)如何與真實(shí)場(chǎng)景的方方面面要求相匹配?!睂?shí)際上,就是要在技術(shù)與場(chǎng)景之間搭橋鋪路,讓技術(shù)快速在場(chǎng)景中落地。
首先是模型體系。不同場(chǎng)景對(duì)模型的需求會(huì)有一定的差異化,所以在通用模型的基礎(chǔ)上要增加不同特質(zhì),對(duì)此百度增加了兩類模型:一是任務(wù)大模型,主要面向特定任務(wù),比如語(yǔ)音搜索、圖文搜索、圖象理解等等;二是行業(yè)大模型,針對(duì)特定行業(yè)進(jìn)行知識(shí)增強(qiáng)后的大模型,百度當(dāng)前的模型體系中已經(jīng)發(fā)布能源和金融兩個(gè)行業(yè)大模型,未來(lái)還將不斷更新更多行業(yè)。
將大模型體系化,按技能、行業(yè)細(xì)化,拓寬了人工智能技術(shù)落地場(chǎng)景的覆蓋廣度。如果用蓋房子來(lái)比喻,大模型就是基礎(chǔ)設(shè)施,有人建公寓,有人建別墅,有人建寫字樓,有人建廠房,有人建商場(chǎng)。不同的建筑,選擇不同的基礎(chǔ)設(shè)施。
其次是全流程支持。百度今年WAVE SUMMIT 2022發(fā)布了大模型開(kāi)發(fā)套件、API和內(nèi)置了文心大模型能力的EasyDL及BML開(kāi)發(fā)平臺(tái)。
所謂全流程支持,本質(zhì)上是降低了技術(shù)滲透到產(chǎn)業(yè)應(yīng)用的難度,提升了落地速度。如果用蓋房子來(lái)比喻,這就相當(dāng)于提供各種工具、圖紙以及施工指導(dǎo),幫助你快速完成工程。
比如,高性能部署方案涵蓋了通用蒸餾、任務(wù)蒸餾、模型裁剪等大規(guī)模輕量化落地方案,以及飛槳算子融合、模型量化等加速方案。再比如,預(yù)設(shè)多領(lǐng)域的豐富任務(wù),包括40多種NLP任務(wù),涵蓋了分類、抽取、檢索、生成等;20多種計(jì)算機(jī)視覺(jué)任務(wù),涵蓋了人臉、人體、車輛、商品、食物等細(xì)粒度分類識(shí)別。在這些預(yù)制任務(wù)下,方案提供配置文件、命令行等多種啟動(dòng)方式、實(shí)現(xiàn)一鍵組網(wǎng)訓(xùn)練。
最后是生態(tài)、社區(qū)。任何一項(xiàng)技術(shù)的普及,都與生態(tài)的繁榮度密切相關(guān)。大模型的技術(shù)成熟了,未來(lái)如何創(chuàng)新地應(yīng)用于場(chǎng)景中,需要更多的開(kāi)發(fā)者共同探索與創(chuàng)造。百度開(kāi)放的大模型創(chuàng)意和探索社區(qū)——旸谷,是文心大模型支持下的一個(gè)創(chuàng)意應(yīng)用空間,也是開(kāi)發(fā)者盡情展現(xiàn)自己“腦洞”的地方。百花齊放、百家爭(zhēng)鳴,將會(huì)加速世界向AI遷移的進(jìn)程。
我們都知道,生態(tài)能促進(jìn)場(chǎng)景應(yīng)用的豐富度。如果類比于蓋房子,生態(tài)就是各種設(shè)計(jì)師、建筑師在這里發(fā)揮創(chuàng)意,出設(shè)計(jì)圖、建樣板間,他們?cè)趯?shí)現(xiàn)自我價(jià)值的同時(shí)也可以供別人參考、復(fù)制。
可以說(shuō),今年度曉曉的“出圈”,讓更多人深刻感受到了AI的發(fā)展已經(jīng)到達(dá)一個(gè)臨界點(diǎn):這將是由點(diǎn)到面快速普及的一年。廣度、速度、豐富度,百度有意識(shí)地在多個(gè)維度加速AI的落地,今年我們將在更多的場(chǎng)景中看到AI帶來(lái)的創(chuàng)新價(jià)值。
【結(jié)束語(yǔ)】
正是因?yàn)榇竽P偷闹匾?,過(guò)去幾年間,業(yè)界展開(kāi)了大模型的技術(shù)軍備競(jìng)賽,大家不停刷榜。事實(shí)上,無(wú)論大模型的性能有多強(qiáng)、參數(shù)量有多么龐大,最終的價(jià)值體現(xiàn)是要落地,好用、易用的同時(shí),還要在應(yīng)用場(chǎng)景中產(chǎn)生價(jià)值,帶動(dòng)產(chǎn)業(yè)發(fā)展和升級(jí)。文心大模型完成了初期的技術(shù)積累,率先開(kāi)啟了大模型的價(jià)值階段。