想象一下,咖啡桌旁兩人相對而坐,一位只會說中文,另一位只能講英語,可是他們卻聊得眉飛色舞,這是什么情況?
有翻譯器!熟悉數(shù)碼產(chǎn)品的人一定會馬上說出答案。
的確,目前很多AI企業(yè)都推出了體積小巧、功能強大的即時翻譯器,這似乎并不是一個新鮮事物。那么,如果旁邊突然又過來了一位說法語的,也和中國人攀談了起來,接著又加入了一位說日語的,對話卻依然在順暢進行,這又是什么情況?
在前兩天的2018 微軟人工智能大會上,這樣的場景引起了很多與會者的好奇心。當天,小米生態(tài)鏈企業(yè)香蕉出行展示了基于微軟翻譯引擎的“魔芋AI翻譯器”,這款翻譯器能夠提供多達14種語言的實時語音翻譯。而通過遠場語音識別技術(shù),兩個語言不通的人可以像朋友一樣,邊喝咖啡邊聊天,使用不同語言的人還可以通過語音進行語言模式切換,自由自在地進行多語種交流。
突然感覺,這款不到手機一半大小的小東西,很快將會成為出國旅行時的必備“利器”。
從一款翻譯器到一群生態(tài)伙伴
不過,顯然香蕉出行不僅僅是要打造一款旅行專用翻譯器,在公司合伙人及CTO于亮看來,魔芋AI翻譯器核心的武器是AI,而AI促使以往的翻譯能力突破了窠臼?!罢麄€翻譯器市場火起來有個原因,語音(識別)的技術(shù)和翻譯的技術(shù)都達到了可以真正落地的水平?!?于亮在和懂懂筆記交流時表示,目前人們對于語言交流(翻譯)的訴求越來越多,“隨著整個社會的開放性,人們到達的地方將更多,開放合作的機會將更多,多元化的交流需求也會更多。”
關(guān)于產(chǎn)品,于亮坦言一直自己有一個夢想,就是能夠做一款世界上最好用的翻譯器?!瓣P(guān)于核心技術(shù),我們的思路是迅速落地產(chǎn)品,在翻譯、語音這方面借助與微軟的合作,盡快實現(xiàn)技術(shù)積累?!?/p>
于亮所說的合作,來自于微軟今年2月與小米簽署的戰(zhàn)略合作備忘錄,內(nèi)容包括微軟與小米在AI方面的多個合作項目,如計算機視覺、語音、自然語言處理、對話式人工智能、知識庫等AI技術(shù),還有“兩位小姐妹”——小娜和小冰、SwiftKey、微軟翻譯Translator等方面的產(chǎn)品及服務(wù)。
可能有人會說,當天微軟人工智能大會上可是秀出了“18般武器”,你為什么只關(guān)注小米生態(tài)鏈企業(yè)的這款翻譯器?
其實原因很簡單,這個有趣的產(chǎn)品背后透露出了兩個關(guān)鍵詞——技術(shù)落地和商業(yè)伙伴。
首先,微軟這幾年在AI技術(shù)方面的深耕正在開始全面落地;其次,除了小米,我們還看到國內(nèi)大量的商業(yè)合作伙伴(生態(tài)體系)開始浮出水面。
這也正是2018 微軟人工智能大會上,值得業(yè)界關(guān)注的最重要的一些信息。
作為一名普通參會者,我們在大會上看到的,是微軟在語音語義、視覺、機器翻譯和“全雙工語音技術(shù)”等方面的新進展;ONNX項目及ML.NET背后正在建立的開源跨平臺AI開發(fā)框架;包括中國移動、小米生態(tài)鏈、大疆、唯品會等多家合作伙伴基于微軟AI技術(shù)展示的合作成果。而更多重要的信息,需要進一步剝繭抽絲。
三個令人動容的瞬間
懂懂筆記在微軟人工智能大會上感覺最有趣的,首先是三個人講的三段話。
“全雙工……谷歌動不動就喜歡吹牛。我們的系統(tǒng)不僅僅支持兩個人交流對話,還可以支持五個人(對話),這算是全武工(全五工)了?”在大會上,微軟技術(shù)院士黃學(xué)東這句半開玩笑的話語,引發(fā)觀眾席上的一片笑聲。
或許是因為前一段時間谷歌I/O大會上的那段“人機對話”在朋友圈霸屏,多少讓黃學(xué)東感覺有些不忿。微軟也對此表示,早在2017年微軟小冰就已經(jīng)主動和人類撥打了第一個電話,遠遠早于谷歌。而黃學(xué)東提到的“全五工”,是指現(xiàn)場演示的微軟與Roobo合作研發(fā)的一款A(yù)I會議系統(tǒng),這款開會“利器”可以同時支持五人對話和語音內(nèi)容記錄。
可以看到,會議中交流的幾個人有時是一人一句,有時話題會被打斷或是有人插話進來,而這款“利器”能自動識別出說話的人和聲音,并把各方講話內(nèi)容自動轉(zhuǎn)換為文字并記錄下來。這里的“全五工”,指的是數(shù)據(jù)能同時在五個方向上進行傳輸,實現(xiàn)群聊識別及多輪對話記憶等功能。
在這段演示背后透露出的信息,是微軟即將在今年秋季推出一項開源計劃——全雙工語音感官技術(shù)(Full Duplex)。微軟將在中國和日本幫助開發(fā)者在開發(fā)相關(guān)應(yīng)用時,能夠使用到包括語音喚醒、群聊識別(基本身份與聲紋)、控制器應(yīng)答、多輪對話記憶等新的技術(shù)成果。
“有時候用戶冒犯了小冰,小冰也會打電話過去質(zhì)問對方,有時能把用戶問蒙了?!?微軟 (亞洲) 互聯(lián)網(wǎng)工程院副院長李笛的這句話,引發(fā)了很多聽眾的興趣。小冰在很多場景中的應(yīng)用以及越來越普及,而且這個“小姑娘”已經(jīng)讓人真假難辨,聽不出是一個人工智能系統(tǒng)了。
李笛展示的內(nèi)容,包括小冰在與一位用戶電話聊天后,判斷出對方的情緒不好,于是再次撥打電話,詢問對方情緒是否好轉(zhuǎn),還溫馨提示用戶盡早休息,并預(yù)告了第二天的天氣狀況。這個小故事背后,體現(xiàn)的就是人工智能從語音識別到語義識別過程中的巨大進步。而從大會上透露出的中國移動與微軟合作內(nèi)容來看,微軟已經(jīng)將領(lǐng)先的語音技術(shù)應(yīng)用到前者巨大的語音及數(shù)據(jù)運營環(huán)境中,同時雙方還將在機器翻譯等技術(shù)上打造出更多的應(yīng)用場景。
大會上,最讓聽者動容的,還是微軟全球執(zhí)行副總裁沈向洋的這一幕畫面:他與來自南京工業(yè)大學(xué)的碩士研究生宋昊旻的一段對話。宋昊旻自幼喪失聽力,發(fā)聲也非常困難,但他通過不懈努力,終于考上了南京工業(yè)大學(xué)的本科和碩士研究生?,F(xiàn)場宋昊旻是通過微軟語音服務(wù)的協(xié)助,與沈向洋進行了對話。沈向洋介紹,針對宋昊旻聲音特點定制的語音識別模型,能夠?qū)⑺Πl(fā)出的語音轉(zhuǎn)換成文字,而且可以同步翻譯成多種外語,真正實現(xiàn)無障礙溝通。
沈向洋在其新書《未來計算》中表示:人工智能的發(fā)展讓我們有機會,以前所未有的方式塑造我們的未來,我們必須以負責任的態(tài)度,確保打造一個所有人都能參與和分享的美好未來,讓人工智能為全人類造福。對于他講的這一點,我們深感認同。
而在當天的大會上,技術(shù)趨勢和亮點太多,我們所記憶深刻的這三個瞬間,也只是眾多精彩中的一小部分。正如沈向洋所總結(jié)的,微軟正在將認知服務(wù)擴展到智能邊緣,通過推出ONNX項目及ML.NET開源跨平臺人工智能開發(fā)框架,以及為微軟小冰賦予更多創(chuàng)意功能““將18項創(chuàng)新技術(shù)、工具、服務(wù)與合作伙伴分享,與開發(fā)者分享,共同把握數(shù)字化轉(zhuǎn)型機遇?!?/p>
多形態(tài)的合作伙伴=數(shù)據(jù)維度
關(guān)于大會上微軟這十八般武器,以及背后的底氣,我們認為不僅僅來自于技術(shù)的能力。
之所以這么說,來自于對AI應(yīng)用落地的理解。
在與眾多科技企業(yè)高管的以往交流中,可以得到這樣一個共識:AI不僅僅是算法、技術(shù)門檻,它還需要海量的(并且是打過標簽的)數(shù)據(jù)進行訓(xùn)練,讓算法和模型在反復(fù)訓(xùn)練中變得更加“聰明”。更為重要的是,大數(shù)據(jù)的多維度、多樣化尤為重要。
反過來看,即便依靠微軟自家的數(shù)據(jù)積累,也不足以支撐起一個更加聰明的AI系統(tǒng)。這時候,更多的合作伙伴,更完善的生態(tài)體系也就彌足珍貴了,這里的合作伙伴,包含開發(fā)者和合作商業(yè)企業(yè)。
以微軟認知服務(wù)為例,目前微軟已經(jīng)在全球推出了覆蓋語音、視覺、語言、機器翻譯等功能的24項服務(wù),并且有超過100萬開發(fā)者使用認知服務(wù)。而微軟智能云上的Azure Batch AI服務(wù),則允許數(shù)據(jù)科學(xué)家和人工智能開發(fā)者以非常簡單的方式利用包括GPU在內(nèi)的Azure云計算資源對人工智能模型進行訓(xùn)練。數(shù)據(jù)科學(xué)家只需明確任務(wù)需求,設(shè)定輸入、存儲、輸出等設(shè)置,其它所有與基礎(chǔ)設(shè)施管理、規(guī)模縮放、批量工作任務(wù)相關(guān)的繁雜的后臺工作都能由Azure Batch AI自動完成。
而大會當天的眾多商業(yè)合作伙伴——中國移動、大疆創(chuàng)新、唯品會、游族網(wǎng)絡(luò)、小米生態(tài)鏈企業(yè)等分享的案例中,我們也能看到開放和共贏的AI合作理念,對于微軟夯實自身在行業(yè)應(yīng)用落地中的重要作用。
微軟大中華區(qū)副總裁兼市場營銷及運營總經(jīng)理康容在與懂懂筆記的交流中這樣強調(diào),“實力”與“態(tài)度”是微軟人工智能得以贏得廣大中國客戶、合作伙伴、開發(fā)者充分信任的兩個關(guān)鍵要素。“從認知服務(wù)、機器人框架到最新發(fā)布的ONNX和ML.NET,微軟正在不斷敞開胸懷,積極擁抱開放、開源、跨平臺開發(fā)?!笨等菘偨Y(jié)。
他以和小米公司的合作為例,強調(diào)雙方強強合作的基礎(chǔ)是創(chuàng)造共贏:“小米是從客戶轉(zhuǎn)變成伙伴關(guān)系的,小米重在技術(shù)和產(chǎn)品落地,微軟則有AI和云方面的身后積累,雙方的合作空間會不斷擴大?!?/p>
實際上,手握Azure這朵云,微軟發(fā)力AI已經(jīng)有了先天優(yōu)勢,而要讓AI和云落地應(yīng)用,了解行業(yè),深入行業(yè)已經(jīng)成為必然,這也就可以理解,微軟不僅在中國市場,包括在全球市場去積極擁抱各行各業(yè)的企業(yè)客戶資源,積極拓展具有行業(yè)特點的應(yīng)用場景的落地工作。
這也是CEO納德拉過去一年多來戰(zhàn)略變化的重點——不斷推進微軟研究院的研究項目轉(zhuǎn)換為實際應(yīng)用和產(chǎn)品,加碼增值服務(wù)市場的增長勢能。至少從微軟2018年Q2的財報中,我們已經(jīng)看到ABC(AI+BigData+Cloud)融合帶來的效果:Azure在全球云計算市場的份額已經(jīng)從 16%上升到了 20%。
當然,作為一名普通消費者,微軟財報的變化離我們太遠。而懂懂筆記籌劃的,是在下一場說走就走的“歐洲五小國自由行”裝備清單里,加上那個能“講”14種語言的翻譯器了。
——————————————————————————————————
微信關(guān)注公眾號“懂懂筆記”每天第一時間為您奉上最新最熱的科技圈資訊~
多年財經(jīng)媒體經(jīng)歷,業(yè)內(nèi)資深分析人士,圈中好友眾多,信息豐富,觀點獨到。
發(fā)布各大自媒體平臺,覆蓋百萬讀者。
《小米生態(tài)鏈戰(zhàn)地筆記》、《微信思維》、《微信力量》三本暢銷書的作者。
請登錄以參與評論
現(xiàn)在登錄