台灣一位客家阿婆讓她的 Siri 發送簡訊,Siri 反覆聽都聽不懂阿婆要幹嘛,阿婆又好笑又好氣的影片,有數萬人觀看,分類是「搞笑影片」。
你是否也曾經遇過語音助理聽不懂你說話,重複數遍後,依然未果?如果是偶爾如此,你可能摸摸鼻子覺得好笑,就算了,自己動手也無妨;但如果是總是如此,你是否會覺得,奇怪,大家都是付一樣的錢買一樣的產品,為什麼偏偏有一群人,彷彿享受無通無阻的最頂級方案,而你卻好像被語音助理百般刁難?
你可能會覺得,不過就是個語音助理,問題應該沒有這麼嚴重吧?不過其實,研究發現,人們在與語音助理互動時,往往會不自覺地把它們當作人類來對待,從而將人類間的行為模式和社會規範帶入這種互動中。
以德國的一項研究為例,語音助理的聲音性別會顯著影響使用者的行為,當女性使用者面對使用女性聲音的語音助理時,即便語音助理給出違背常理的建議,女性使用者也有較高的傾向接受語音助理的建議;男性使用者則是不受語音助理聲音性別的影響。同時,當語音助理使用男性聲音時,用戶普遍傾向認為語音助理更有能力;而當使用女性聲音時,則認為更溫暖。這些都複製了人類互動中性別刻板印象的效果。
這反映出,現實生活中的人類互動模式也出現在人類與語音助理的互動中。換句話說,當語音助理對使用者有傷害性的回饋,使用者也可能會往心裡去,就好像被真人排擠一樣,蘇格蘭人便常常因為汽車語音導航聽不懂自己說話,氣得對著導航破口大罵。想像一下,當日常生活中,你無論怎麼講話,你的朋友都會不停地「蛤?」這種互動,會對你造成什麼樣的心理影響?
語音助理無法理解某些用戶的語音時,可能會給這些用戶帶來心理壓力。以我自身訪談聽障者的研究經驗為例,聽力障礙者因為每個人可以聽見的聲音頻率與分貝不同,加上輔具差異及早療時間等個人因素,而有跟其他人不同的口音,聽障者內部亦有很高的口音異質性,使得在使用語音助理時,很大機率上語音助理並不能理解他們的指令,這對於他們的自我認知有相當大的影響,尤其是對於本身就蠻在意自身聽力損失這件事的人,語音助理的反應就像是在告訴他,他有多麽「不正常」。
當語音助理只聽得懂某一群人的聲音
目前世界各地的研究團隊,以學術機構中人類電腦互動(Human-Computer Interaction;HCI)的專家為主,正開始關注語音識別技術的社會偏見問題。包含 HCI 在內的人工智慧領域的研究,大多不將焦點放在審查時間曠日廢時的期刊論文,而是傾向將研究在研討會上直接亮相,這些研討會也常能見到科技巨頭公司的科學家參與,甚至主辦單位直接得到贊助。這讓學院的研究可能直接與業界的技術發展有所連結,甚或產生實際影響。譬如,像是微軟、Google 等公司,近年來就開始關注旗下涉及語言科技的產品,是否再製了社會的偏見。
關於語音辨識的社會偏見議題,大部分研究關注的是地區口音。不同語音識別技術在處理不同地區口音方面面臨重大挑戰,這反映出這些識別技術在訓練時使用的資料集,就是偏向社會主流群體。