送禮物 訂閱
<%if prop.topic_id !=0 %> <%/if%>
<%:prop.genus%> <%:~formatDate(prop.online_date, 'YYYY MMM DD' )%> <%:prop.title%>
<%:prop.realname%> <%:prop.realname%>
<%:prop.realname%>

<%:prop.realname%>

<%:prop.intro%>

add
新會員

<%:prop.email%>

add

<%:prop.title%>

Siri 聽不懂你說的話?不是你的錯,是語音辨識偏見惹的禍

ISSUE #135

Siri 聽不懂你說的話?不是你的錯,是語音辨識偏見惹的禍

Feb 20, 2024

圖片來源 - Midjourney

非母語者、窮人和身心障礙族群,由於口音不夠「標準」,經常被語音辨識軟體排除在外。哪怕重複再多次,說到臉紅脖子粗,軟體仍舊無法辨識。然而,許多身障族群卻往往是最依賴語音辨識軟體的一群人。為了讓包括 Siri 在內的語音助理「聽懂」更多元的口音,不僅需要改善訓練資料,開發者也必須正視偏見問題。

台灣一位客家阿婆讓她的 Siri 發送簡訊,Siri 反覆聽都聽不懂阿婆要幹嘛,阿婆又好笑又好氣的影片,有數萬人觀看,分類是「搞笑影片」。

你是否也曾經遇過語音助理聽不懂你說話,重複數遍後,依然未果?如果是偶爾如此,你可能摸摸鼻子覺得好笑,就算了,自己動手也無妨;但如果是總是如此,你是否會覺得,奇怪,大家都是付一樣的錢買一樣的產品,為什麼偏偏有一群人,彷彿享受無通無阻的最頂級方案,而你卻好像被語音助理百般刁難?

你可能會覺得,不過就是個語音助理,問題應該沒有這麼嚴重吧?不過其實,研究發現,人們在與語音助理互動時,往往會不自覺地把它們當作人類來對待,從而將人類間的行為模式和社會規範帶入這種互動中。

以德國的一項研究為例,語音助理的聲音性別會顯著影響使用者的行為,當女性使用者面對使用女性聲音的語音助理時,即便語音助理給出違背常理的建議,女性使用者也有較高的傾向接受語音助理的建議;男性使用者則是不受語音助理聲音性別的影響。同時,當語音助理使用男性聲音時,用戶普遍傾向認為語音助理更有能力;而當使用女性聲音時,則認為更溫暖。這些都複製了人類互動中性別刻板印象的效果。

這反映出,現實生活中的人類互動模式也出現在人類與語音助理的互動中。換句話說,當語音助理對使用者有傷害性的回饋,使用者也可能會往心裡去,就好像被真人排擠一樣,蘇格蘭人便常常因為汽車語音導航聽不懂自己說話,氣得對著導航破口大罵。想像一下,當日常生活中,你無論怎麼講話,你的朋友都會不停地「蛤?」這種互動,會對你造成什麼樣的心理影響?

語音助理無法理解某些用戶的語音時,可能會給這些用戶帶來心理壓力。以我自身訪談聽障者的研究經驗為例,聽力障礙者因為每個人可以聽見的聲音頻率與分貝不同,加上輔具差異及早療時間等個人因素,而有跟其他人不同的口音,聽障者內部亦有很高的口音異質性,使得在使用語音助理時,很大機率上語音助理並不能理解他們的指令,這對於他們的自我認知有相當大的影響,尤其是對於本身就蠻在意自身聽力損失這件事的人,語音助理的反應就像是在告訴他,他有多麽「不正常」。


當語音助理只聽得懂某一群人的聲音

目前世界各地的研究團隊,以學術機構中人類電腦互動(Human-Computer Interaction;HCI)的專家為主,正開始關注語音識別技術的社會偏見問題。包含 HCI 在內的人工智慧領域的研究,大多不將焦點放在審查時間曠日廢時的期刊論文,而是傾向將研究在研討會上直接亮相,這些研討會也常能見到科技巨頭公司的科學家參與,甚至主辦單位直接得到贊助。這讓學院的研究可能直接與業界的技術發展有所連結,甚或產生實際影響。譬如,像是微軟、Google 等公司,近年來就開始關注旗下涉及語言科技的產品,是否再製了社會的偏見。

關於語音辨識的社會偏見議題,大部分研究關注的是地區口音。不同語音識別技術在處理不同地區口音方面面臨重大挑戰,這反映出這些識別技術在訓練時使用的資料集,就是偏向社會主流群體。

陪你從「科技+人文」視角,深入國際政經脈動

35元/週解鎖付費會員專屬內容

  • 成為付費會員,即可擁有:
  • ✓ 全站深度分析報導文章
  • ✓ 會員專屬 8 折活動報名優惠

已經是付費會員?登入繼續閱讀

萬宗綸

萬宗綸 / 特約撰稿人

採訪寫作

吳政霆

吳政霆 / 研究員

編輯

時間標記 Timestamp

EPEPISODE #旭沙龍-張育寧時間

EP #
邀請已成功寄出 Sucessfully sent