亞馬遜員工會聽你的ALEXA錄音來改進(jìn)服務(wù)
在這種情況下,這個過程被稱為數(shù)據(jù)注釋,它已經(jīng)悄然成為機(jī)器學(xué)習(xí)革命的基石,在自然語言處理、機(jī)器翻譯、圖像和對象識別方面取得了大量進(jìn)展。他們的想法是,人工智能算法只有在它們能夠訪問的數(shù)據(jù)能夠被輕松解析和分類的情況下才能隨著時間的推移而改進(jìn)——它們不一定要訓(xùn)練自己這樣做。也許Alexa聽錯了,或者系統(tǒng)認(rèn)為你問的不是英國城市布萊頓,而是紐約西部的郊區(qū)。在處理不同的語言時,還有無數(shù)的細(xì)微差別,比如地區(qū)俚語和方言,這些細(xì)微差別可能在Alexa支持該語言的開發(fā)過程中沒有考慮到。
在許多情況下,人類通過聆聽交換的錄音并正確地標(biāo)記數(shù)據(jù),從而將數(shù)據(jù)反饋回系統(tǒng),從而發(fā)出這些呼叫。這個過程被廣泛地稱為監(jiān)督學(xué)習(xí),在某些情況下,它與其他更自主的技術(shù)相結(jié)合,也就是半監(jiān)督學(xué)習(xí)。蘋果、谷歌和Facebook都以類似的方式使用這些技術(shù),Siri和谷歌助手都隨著時間的推移而改進(jìn),這要?dú)w功于需要人眼和耳朵進(jìn)行監(jiān)督學(xué)習(xí)。
在這個案例中,布隆伯格揭露了亞馬遜全球數(shù)千名員工的真實(shí)情況,其中包括一些承包商和一些全職員工,他們的任務(wù)是分析Alexa記錄,隨著時間的推移幫助改進(jìn)助手。雖然這種方法本身并沒有什么邪惡之處,但彭博確實(shí)指出,大多數(shù)客戶并不經(jīng)常意識到這種情況正在發(fā)生。此外,還有濫用的空間。錄音可能包含明顯可識別的特征和有關(guān)說話者的傳記信息。目前還不清楚這些錄音的確切存儲時間,以及這些信息是否曾被惡意第三方竊取或被員工濫用。
雖然這可能是標(biāo)準(zhǔn)實(shí)踐,但是這種類型的注釋可能會導(dǎo)致濫用
彭博社的報(bào)告列舉了一些例子,其中一些注釋者聽到了他們認(rèn)為可能是性侵犯或其他形式的犯罪活動,在這種情況下,亞馬遜需要在執(zhí)法過程中反復(fù)循環(huán)。(Alexa語音數(shù)據(jù)被用于起訴犯罪的案件已經(jīng)引起了廣泛關(guān)注。)報(bào)告說,在其他情況下,一些辦公室的員工會與同事分享他們覺得有趣或?qū)擂蔚恼勗捚巍?/p>
亞馬遜在一份聲明中告訴彭博社,“我們只對Alexa語音記錄的一小部分進(jìn)行了注釋,目的是(原文如此)改善客戶體驗(yàn)?!崩?,這些信息幫助我們訓(xùn)練我們的語音識別和自然語言理解系統(tǒng),因此Alexa可以更好地理解您的請求,并確保服務(wù)對每個人都有效。該公司聲稱,它擁有“嚴(yán)格的技術(shù)和運(yùn)營保障措施,對濫用我們的系統(tǒng)采取零容忍政策?!眴T工無權(quán)訪問參與Alexa語音請求的人的身份,任何這類信息都“被高度保密地對待”,并受到“多因素身份驗(yàn)證的保護(hù),以限制訪問、服務(wù)加密和對我們控制環(huán)境的審計(jì)”。
盡管如此,批評這種人工智能發(fā)展方式的人士已經(jīng)為此敲響了警鐘,通常情況下,當(dāng)亞馬遜犯了一個錯誤,不小心把錄音發(fā)送給了錯誤的人,或者透露自己已經(jīng)存儲了數(shù)月甚至數(shù)年的錄音時,就會出現(xiàn)這種情況。去年,Alexa代表該用戶向其丈夫的同事發(fā)送了一段私人對話,結(jié)果出現(xiàn)了一系列奇怪而極其復(fù)雜的錯誤。去年12月,一名德國居民詳細(xì)描述了他是如何根據(jù)GDPR的數(shù)據(jù)請求,從亞馬遜收到1700條語音記錄的,盡管這名男子沒有Alexa設(shè)備。通過分析這些文件,德國雜志c的記者們無法僅通過使用從Alexa互動中收集到的信息來識別被記錄的實(shí)際用戶。
亞馬遜存儲了數(shù)千份語音記錄,目前尚不清楚是否存在濫用
亞馬遜正在積極尋找擺脫那種需要大量抄寫和注釋的監(jiān)督學(xué)習(xí)的方法。連接在去年晚些時候的一份報(bào)告中稱,亞馬遜是如何使用新的、更尖端的技術(shù)像所謂的主動學(xué)習(xí)和學(xué)習(xí)轉(zhuǎn)移到減少錯誤率和擴(kuò)大Alexa的知識庫,即使它增加了更多的技能,而不需要添加更多的人類的混合。
亞馬遜Ruhi Sarikaya, Alexa的應(yīng)用科學(xué),在科學(xué)美國人本月早些時候發(fā)表了一篇文章題為“Alexa學(xué)習(xí),”,他詳細(xì)說明了這種類型的大規(guī)模機(jī)器學(xué)習(xí)的目標(biāo)總是會減少所需的冗長的人類勞動來解決錯誤。在最近的人工智能研究中,監(jiān)督學(xué)習(xí)占據(jù)了主導(dǎo)地位。但如今,商業(yè)人工智能系統(tǒng)產(chǎn)生的客戶互動,遠(yuǎn)遠(yuǎn)超過我們開始手工標(biāo)注的數(shù)量?!耙胙永m(xù)商業(yè)人工智能迄今所帶來的迅猛進(jìn)步,唯一的方法就是將我們自己重新定位為半監(jiān)督、弱監(jiān)督和非監(jiān)督學(xué)習(xí)?!蔽覀兊南到y(tǒng)需要學(xué)習(xí)如何改進(jìn)自己。”
然而,就目前而言,亞馬遜可能需要真正了解人類語言和文化的人來解析這些Alexa交互并理解它們。這種令人不安的現(xiàn)實(shí)意味著,有些人,甚至遠(yuǎn)在印度和羅馬尼亞,正在你的客廳、臥室、甚至浴室里,聽你和一個沒有實(shí)體的人工智能說話。這就是ai提供便利的代價,至少在亞馬遜看來是這樣。
請登錄以參與評論
現(xiàn)在登錄