配圖來自Canva可畫
隨著數(shù)字化時(shí)代的來臨,國(guó)內(nèi)各企業(yè)為了提升行業(yè)競(jìng)爭(zhēng)力,紛紛開始利用數(shù)字化技術(shù),來實(shí)現(xiàn)以降本增效為核心的數(shù)字化轉(zhuǎn)型,得益于此,助力企業(yè)數(shù)字化轉(zhuǎn)型升級(jí)的SaaS也開始進(jìn)一步升溫。
眾所周知,國(guó)內(nèi)企業(yè)服務(wù)SaaS產(chǎn)業(yè)賽道眾多、流派迥異,其中向用戶提供SaaS類產(chǎn)品與本地化部署解決方案的智能語音轉(zhuǎn)寫就是其細(xì)分領(lǐng)域的一員。而在疫情等眾多因素的共同催化之下,智能語音轉(zhuǎn)寫技術(shù)的商業(yè)化應(yīng)用也迎來了新的發(fā)展機(jī)遇。
智能語音轉(zhuǎn)寫乘風(fēng)起
隨著智能語音產(chǎn)品及服務(wù)在辦公、學(xué)習(xí)、行業(yè)交流等多個(gè)場(chǎng)景中的應(yīng)用越來越廣泛,智能語音轉(zhuǎn)寫市場(chǎng)整體規(guī)模持續(xù)上漲,其發(fā)展?jié)摿σ苍谥鹨会尫?。?jù)艾瑞咨詢發(fā)布的《2022年中國(guó)智能語音轉(zhuǎn)寫行業(yè)研究報(bào)告》顯示,2021年中國(guó)智能語音轉(zhuǎn)寫市場(chǎng)規(guī)模約為215億元,預(yù)計(jì)2026年將達(dá)到469億元,呈現(xiàn)高速增長(zhǎng)態(tài)勢(shì)。而智能語音轉(zhuǎn)寫行業(yè)之所以能一直保持快速發(fā)展勢(shì)頭,則與三大利好不無關(guān)系。
在政策上,國(guó)家有關(guān)智能語音、語音自動(dòng)轉(zhuǎn)寫、語音同步轉(zhuǎn)錄等相關(guān)政策的不斷出臺(tái),使得智能語音轉(zhuǎn)寫賽道不斷升溫。自2017年起,國(guó)家有關(guān)部門就相繼出臺(tái)了多項(xiàng)政策,鼓勵(lì)和支持智能語音產(chǎn)業(yè)的發(fā)展。
在技術(shù)上,語音識(shí)別(ASR)、自然語言處理(NLP)、語音合成(TTS)等技術(shù)的持續(xù)突破,為智能語音轉(zhuǎn)寫技術(shù)的精度和速度的提升奠定了基礎(chǔ)。
在需求上,得益于人力成本、協(xié)同辦公、會(huì)展交流、跨國(guó)溝通等多重因素的共同驅(qū)動(dòng),智能語音轉(zhuǎn)寫的市場(chǎng)需求持續(xù)擴(kuò)大。
但技術(shù)從殿堂步入尋常百姓生活,需要產(chǎn)品的鏈接,如何滿足當(dāng)下用戶越來越豐富多元的使用需求?真正做到有爽點(diǎn)的使用感受,這是出給每個(gè)人工智能公司產(chǎn)品和業(yè)務(wù)團(tuán)隊(duì)的一項(xiàng)難題。從產(chǎn)品形態(tài)來看,智能轉(zhuǎn)寫和翻譯的產(chǎn)品主要包括SaaS類產(chǎn)品與本地化部署解決方案兩大類,其中SaaS市場(chǎng)更是不乏重量級(jí)玩家,只不過新入局者眾多,行業(yè)痛點(diǎn)并未得到很好的解決。
一是,技術(shù)實(shí)力不足。精準(zhǔn)快速的轉(zhuǎn)寫和翻譯服務(wù)往往需要強(qiáng)大的軟硬件技術(shù)支撐,然而目前大多數(shù)語音智能轉(zhuǎn)寫玩家,在技術(shù)研發(fā)和創(chuàng)新上的能力較為有限,這就導(dǎo)致其產(chǎn)品在應(yīng)用過程中的準(zhǔn)確率,難以達(dá)到理想效果,不僅無法滿足實(shí)際使用需求,可能最后還需要人工來處理或糾錯(cuò),從而降低使用效率。
二是,應(yīng)用場(chǎng)景單一。如今,智能語音轉(zhuǎn)寫產(chǎn)品和服務(wù)的應(yīng)用場(chǎng)景正在逐漸擴(kuò)大。市面上大多數(shù)轉(zhuǎn)寫翻譯的產(chǎn)品和服務(wù)卻依舊很難滿足用戶多場(chǎng)景、多形態(tài)的需求,加之有的軟硬件產(chǎn)品還出現(xiàn)了鏈接不順暢或者賬戶切換繁冗復(fù)雜等情況,讓用戶交互體驗(yàn)感欠佳。
三是,缺乏定制化服務(wù)。對(duì)語義的理解有誤,語言識(shí)別和翻譯的準(zhǔn)確性就會(huì)大打折扣,定制化服務(wù)卻能有效緩解這一問題。只不過,在目前的入局者中,能夠?yàn)橛脩魳?gòu)建獨(dú)有產(chǎn)品,提供專屬服務(wù)的玩家少之又少。而缺乏定制化服務(wù),很難真正做到對(duì)智能語音轉(zhuǎn)寫行業(yè)的深耕。
以上問題確實(shí)是行業(yè)內(nèi)真實(shí)存在的通病,也是實(shí)際應(yīng)用中很難避免的痛點(diǎn),因此為了實(shí)現(xiàn)“信達(dá)雅”這一目標(biāo),該領(lǐng)域的大多數(shù)玩家還需要在技術(shù)研發(fā)、場(chǎng)景優(yōu)化、交互體驗(yàn)等方面長(zhǎng)期求索。與其他玩家不同,在解決這些痛點(diǎn)方面,我覺得科大訊飛做的還是有可圈可點(diǎn)之處的。
訊飛聽見重塑語音SaaS服務(wù)
作為科大訊飛旗下的一款SaaS化服務(wù)產(chǎn)品,訊飛聽見在創(chuàng)立之初便通過聚合多項(xiàng)SaaS轉(zhuǎn)寫翻譯服務(wù)搭建了面向消費(fèi)者的軟件平臺(tái),同時(shí)又面向BG端客戶群率先發(fā)布了智能會(huì)議系統(tǒng)及相應(yīng)解決方案,從而形成了全套的、成體系的系統(tǒng)級(jí)智能語音轉(zhuǎn)寫服務(wù)。
通過GBC三方聯(lián)動(dòng)的業(yè)務(wù)方式,訊飛聽見很快就在轉(zhuǎn)寫行業(yè)的品牌市場(chǎng)打響了知名度。據(jù)悉,易觀發(fā)布的《中國(guó)智能語音轉(zhuǎn)寫工具行業(yè)洞察2021》報(bào)告顯示,訊飛聽見的轉(zhuǎn)寫產(chǎn)品品牌知名度位列榜首;艾瑞咨詢剛剛發(fā)布的2022《智能語音轉(zhuǎn)寫行業(yè)研究報(bào)告》中也顯示,訊飛聽見在智能語音轉(zhuǎn)寫SaaS產(chǎn)品競(jìng)爭(zhēng)格局中被納入了第一梯隊(duì)的陣營(yíng),且綜合排名第一。而訊飛聽見能在行業(yè)中擁有如此地位,雖有些出乎意料之外,但也確實(shí)在情理之中。
在技術(shù)落地方面,訊飛聽見繼承了訊飛轉(zhuǎn)寫的全部?jī)?yōu)點(diǎn),做到了既“快”又“準(zhǔn)”??拼笥嶏w是國(guó)內(nèi)少數(shù)幾家真正在人工智能領(lǐng)域具備核心技術(shù)的企業(yè),因此,傳統(tǒng)轉(zhuǎn)寫引擎1個(gè)小時(shí)的音頻一般需要10分鐘左右,而依托科大訊飛深耕多年的自然語言處理、聲紋識(shí)別、語音識(shí)別、翻譯等核心技術(shù),訊飛聽見超高效率的極速語音轉(zhuǎn)寫,最快可以達(dá)到1小時(shí)音頻轉(zhuǎn)寫完成僅耗時(shí)20秒。在市場(chǎng)應(yīng)用級(jí)別,1小時(shí)音頻則5分鐘之內(nèi)即可轉(zhuǎn)寫完畢。
另外,市面上很多智能語音轉(zhuǎn)寫產(chǎn)品和服務(wù)因?yàn)榧夹g(shù)實(shí)力不足,其產(chǎn)品力也明顯不足,轉(zhuǎn)寫準(zhǔn)確率大多甚至還達(dá)不到90%,稍微好一點(diǎn)的產(chǎn)品,其準(zhǔn)確率也只到95%左右,而訊飛聽見的AI智能轉(zhuǎn)寫準(zhǔn)確率能高達(dá)97.5%,在行業(yè)內(nèi)可謂是名列前茅。且在智能糾錯(cuò)、語氣詞過濾、詞庫建設(shè)上有較好的應(yīng)用,大大提升了轉(zhuǎn)寫精準(zhǔn)度。
在場(chǎng)景應(yīng)用方面,訊飛聽見解決了通用人群的轉(zhuǎn)寫問題,是專業(yè)人群的翻譯助力。傳統(tǒng)翻譯產(chǎn)品多應(yīng)用于專業(yè)大會(huì)、學(xué)術(shù)研究等場(chǎng)景,但訊飛聽見除了這些傳統(tǒng)場(chǎng)景外,還可以應(yīng)用于常用的日常會(huì)議記錄、課堂筆記。不過,訊飛聽見的豐富程度遠(yuǎn)不止于此,還包括視頻會(huì)議自帶字幕的云會(huì)議,給視頻做字幕和翻譯的聽見字幕,以及可以提升拾音效率的一系列硬件組合產(chǎn)品等。而針對(duì)轉(zhuǎn)寫應(yīng)用最廣泛的一個(gè)場(chǎng)景會(huì)議紀(jì)要,訊飛聽見則是推出了網(wǎng)頁端的AI紀(jì)要功能,在實(shí)時(shí)錄音轉(zhuǎn)寫的同時(shí),可以進(jìn)行AI輔助紀(jì)要,自動(dòng)關(guān)聯(lián)紀(jì)要內(nèi)容所匹配的錄音時(shí)段,讓記錄更清晰,會(huì)議場(chǎng)景再現(xiàn)更準(zhǔn)確。此外,先于蘋果手機(jī)推出的懸浮字幕,可識(shí)別手機(jī)音視頻內(nèi)容中的文字,實(shí)時(shí)轉(zhuǎn)寫翻譯成多語種字幕也被應(yīng)用在各類場(chǎng)景中。
在服務(wù)專業(yè)性方面,訊飛聽見周到細(xì)致的定制化服務(wù),與其他產(chǎn)品形成了差異化優(yōu)勢(shì)。訊飛聽見作為一款高效轉(zhuǎn)寫服務(wù)產(chǎn)品,不僅技術(shù)領(lǐng)先,服務(wù)也很專業(yè)。平臺(tái)能為不同用戶提供定制化的服務(wù),通過將機(jī)器轉(zhuǎn)寫翻譯和人工譯員資源整合,打造語音語言服務(wù)平臺(tái)促進(jìn)行業(yè)共榮,讓用戶可根據(jù)不同需求進(jìn)行定制化服務(wù)咨詢。而其豐富的生態(tài)服務(wù)能力,也能滿足很多垂直領(lǐng)域人群的服務(wù)需求,幫助用戶實(shí)現(xiàn)高效無障礙溝通。也正因?yàn)閷I(yè)性的應(yīng)用,訊飛聽見在冬奧會(huì)、冬殘奧會(huì)、成都世乒賽等多項(xiàng)體育賽事上,才可以代表中國(guó)刷新中國(guó)智造的AI名片。
好產(chǎn)品往往都是從用戶角度出發(fā),訊飛聽見之所以能從眾多玩家中脫穎而出,得到越來越多用戶的青睞和選擇,與其持續(xù)深入了解用戶需求,不斷進(jìn)行產(chǎn)品迭代不無關(guān)系。
值得一提的是,轉(zhuǎn)寫翻譯技術(shù)不僅是作為一個(gè)專業(yè)型工具被廣泛應(yīng)用,也可以作為輔助工具幫助到聽障人群 。據(jù)了解訊飛聽見在2019年發(fā)起的“聽見AI的聲音”公益活動(dòng),為聽障群體免費(fèi)提供訊飛聽見旗下APP、訊飛聽見會(huì)議、訊飛聽見鴻蒙卡片等多項(xiàng)轉(zhuǎn)寫服務(wù),幫助聽障人群可以通過轉(zhuǎn)寫文字加強(qiáng)與社會(huì)的交流,目前已經(jīng)向社會(huì)捐贈(zèng)8140萬分鐘轉(zhuǎn)寫時(shí)長(zhǎng)。
語音轉(zhuǎn)寫SaaS服務(wù)邁入全新時(shí)代
而訊飛聽見的再度迭代升級(jí),不僅對(duì)機(jī)器同傳行業(yè)有著積極影響,更對(duì)推動(dòng)整個(gè)智能語音轉(zhuǎn)寫市場(chǎng)的發(fā)展具有重要意義。
具體而言,對(duì)用戶來說,訊飛聽見憑借強(qiáng)大的AI語音轉(zhuǎn)寫翻譯技術(shù),為用戶提供了更有效率的信息傳遞服務(wù),在一定程度上降低溝通門檻,提升交互體驗(yàn)。訊飛聽見同傳支持中、英、法、俄、德、日、韓、西班牙、阿拉伯9國(guó)語種的實(shí)時(shí)轉(zhuǎn)寫及翻譯,能有效滿足用戶的多樣化需求,進(jìn)而真正實(shí)現(xiàn)人與人之間的無障礙交流。而這類傳統(tǒng)線下頂級(jí)峰會(huì)才被使用的AI技術(shù),目前已經(jīng)通過在線同傳服務(wù)走進(jìn)普通用戶的生活,一臺(tái)電腦即可享受實(shí)時(shí)AI同傳的服務(wù)。
對(duì)市場(chǎng)而言,訊飛聽見SaaS類智能語音轉(zhuǎn)寫翻譯產(chǎn)品的成功出圈,有利于打破行業(yè)同質(zhì)化的窠臼,加速市場(chǎng)洗牌,推動(dòng)市場(chǎng)良性發(fā)展。訊飛聽見具有足夠的實(shí)力和精力進(jìn)行技術(shù)研發(fā)與產(chǎn)品打磨,因此其產(chǎn)品化能力十分優(yōu)秀。而憑借“好產(chǎn)品”破圈的訊飛聽見將有望給用戶帶來全新的選擇,同時(shí)也為市場(chǎng)帶來全新的變化。
從行業(yè)來看,訊飛聽見所提供的SaaS類智能語音轉(zhuǎn)寫翻譯產(chǎn)品,為整個(gè)行業(yè)提供了一個(gè)優(yōu)秀范本,有利于引導(dǎo)整個(gè)行業(yè)向著更積極的一面去發(fā)展。如今,智能語音轉(zhuǎn)寫翻譯產(chǎn)品的普及推廣已經(jīng)是大勢(shì)所趨,而在整個(gè)智能語音轉(zhuǎn)寫市場(chǎng)占據(jù)主流廠商地位的訊飛聽見,則對(duì)整個(gè)行業(yè)都具有借鑒意義。
隨著智能語音轉(zhuǎn)寫的技術(shù)的不斷突破、功能的持續(xù)豐富、場(chǎng)景更加泛化,在語音轉(zhuǎn)寫行業(yè)已經(jīng)走在前列的訊飛聽見,未來將會(huì)給市場(chǎng)和用戶帶來更多更大的驚喜,也將推動(dòng)整個(gè)語音轉(zhuǎn)寫SaaS服務(wù)邁入一個(gè)全新的時(shí)代。