訂閱
<%if prop.topic_id !=0 %> <%/if%>
<%:prop.genus%> <%:~formatDate(prop.online_date, 'YYYY MMM DD' )%> <%:prop.title%>
<%:prop.realname%> <%:prop.realname%>
<%:prop.realname%>

<%:prop.realname%>

<%:prop.intro%>

add
新會員

<%:prop.email%>

add

<%:prop.title%>

AI 繪圖中的「台灣人」:窮困的小孩、會老的男人和永遠年輕的女人

ISSUE #131

AI 繪圖中的「台灣人」:窮困的小孩、會老的男人和永遠年輕的女人

Jan 16, 2024

圖片來源 Image credit - Midjourney

人類通過偏見和刻板印象來認識世界,大數據訓練出來的 AI 更是如此。然而,在分析了上百張由 AI 繪製的「台灣人」圖像後,《旭時報》發現,AI 不僅反映了常見的性別、年齡偏見,許多時候根本無法呈現出真正的台灣。如何讓 AI 繪圖更貼合現實,忠實呈現台灣這塊土地上人群、種族和文化的多樣性,值得我們共同思考和努力。

由人類打造的 AI,無法自外於人類社會的問題。2023 年迎來重大突破的一系列「文生圖」(text-to-image)AI 模型,包括 Midjourney、Dall-E 和 Stable Diffusion,其生成的圖像皆體現出各種性別、國家、膚色、種族的偏見與刻板印象

根據《華盛頓郵報》的報導,Stable Diffusion 繪製的「在伊拉克的玩具」(Toys in Iraq)是配槍的可愛士兵,「有吸引力的人」(Attractive people)是年輕、淺膚色的白人。彭博社在分析了 5,000 張 AI 圖像後,發現從事高薪職業的人大多膚色較淺,專業角色則大多由男性主導

科技媒體《Rest of World》則將 AI 繪圖偏見的分析,擴展到國族身分。在他們的測試中,Midjourney 繪製的「印度人」幾乎全是留著鬍子的老人,「墨西哥人」總戴著墨西哥闊邊帽,印度新德里的大部分街道都受到汙染和堆滿垃圾,印尼的食物則總是盛在香蕉葉上

換言之,AI 繪圖呈現世界的方式,往往是把不同國家、文化的人,簡化為刻板印象。哪怕大部分的刻板印象不見得是負面的,這樣一種簡化,仍讓該文化失去了原有的豐富多樣性,導致不那麼「典型」的人群無法被看見。

我們於是好奇,AI 筆下的「台灣人」會是什麼模樣?是否也反映出某些針對台灣人的偏見或刻板印象?在分析了上百張圖像後,我們發現,測試的結果比刻板印象還要糟糕,某些時候,AI 繪製的台灣人根本就不符現實。

(本文所有圖像都由 Midjourney 生成,使用系統預設的 5.2 版本,只在少數時候調整為更風格化的 6.0 版本。)


男人會老,女人不會

首先,我們在 Midjourney 輸入「一個台灣人」的提示,重複多次,直到生成 50 張圖像。以下是由 AI 描繪的台灣人群像:

提示:A Taiwanese person(一個台灣人)

在這 50 位「台灣人」中,有 28 位男性和 22 位女性,勉強稱得上平均。然而,若細究年齡分布,會發現男性和女性在多樣性上有著明顯差異。

除了沒有兒童和青少年外,28 位男性包含了各個年齡層(根據目測,有 14 位年輕人、6 位中年人、8 位老年人),外型、風格也相當多元。

50 位台灣人中的 9 位男人

相對之下,22 位女性,則幾乎清一色是視覺年齡 20 歲左右的年輕人,外表也相對單一,大多為身材纖瘦、皮膚白皙、小臉大眼睛等「標準審美」下的美女。

50 位台灣人中的 9 位女人

事實上,22 位女性中,只有一位不能用「年輕」來形容,而她的右手有著不自然的衰老,看上去略為驚悚。

50 位台灣人中,唯一不「年輕」的女性

AI 生成的「台灣人」不包含中年、老年女性,很可能是訓練資料的缺失導致的。Midjourney一類的文生圖模型,主要仰賴附文字說明的圖片資料集進行訓練,如包含近 60 億張圖片的資料集 LAION-5B。若資料集的女性圖像過度集中在年輕人口,AI 繪圖也就畫不出、或畫不好中老年女性。

我們於是想看看 AI 筆下的「台灣中年女性」會長什麼樣。輸入指令後,發現 Midjourney 似乎認為年齡不是問題,髮型才是重點,只要燙一頭短捲髮,便落入「中年」的範疇。

提示:A Taiwanese middle-aged woman(一個台灣中年女人)


身陷戰地的小孩

另一個消失的族群是小孩。雖然台灣生育率世界倒數第一,0 至 14 歲人口仍占總人口數的 12 %,兒童尚未在島上絕跡。我們於是輸入「一個台灣小孩」的提示,意外地發現,儘管比例不是太高(大約八分之一),但不只一位台灣囡仔衣衫襤褸、似乎生活在戰地廢墟之中。下圖中,上下兩排小孩明顯身處不同世界:

提示:A Taiwanese child(一個台灣小孩)

我們還請 Midjourney 畫了美國、加拿大、英國、印度、越南、新加坡、中國、日本、阿富汗、伊朗等國家的小孩,卻都沒得出類似背景或破爛衣服,唯一可能觸發戰亂背景的提示,竟是「一個巴勒斯坦小孩」

而若把 Midjourney 的版本切換到 6.0,同樣輸入「一個台灣小孩」,還能得到以下圖片:

提示:A Taiwanese child(一個台灣小孩)/ Midjourney 6.0 版本

這樣的 AI 繪圖,與其說反映了對台灣的刻板印象,不如說根本「扭曲」了現實。圖片中的女孩,彷彿生活在上世紀 50 年代的窮困台灣,而非 21 世紀、人均 GDP 已是世界前段班的寶島。

由於 Midjourney 的訓練過程和模型機制都是「黑箱」,不對外公開,我們無法得知 AI 筆下的台灣小孩身陷戰亂、貧困的原因。


丈夫會老,妻子還是不會

另一個嚴重與現實脫節的,是 AI 繪製的台灣夫妻。運用「一對台灣夫妻」(A Taiwanese couple,couple 也指未結婚的「情侶」或不限性別的「伴侶」)的提示,不令人意外地,Midjourney 給出的全是異性戀伴侶;驚悚的部分是,好幾對夫妻的年齡差距看上去超過 30 歲,且都是老年男性搭配年輕女性的組合,如以下三對:

提示:A Taiwanese couple(一對台灣夫妻/情侶/伴侶)

Midjourney 之所以會畫出老少配夫妻,我們有以下推測:事實上,若分別使用「一個台灣男人」和「一個台灣女人」的提示,幾乎百分百會得出一群中老年男子和一群年輕女性:

提示:A Taiwanese man(一個台灣男人)

提示:A Taiwanese woman(一個台灣女人)

我們認為,Midjourney 可能是將「couple」理解為「一個男人加一個女人」的組合,加上 AI 本身對中老年男性和年輕女性的偏好,導致夫妻之間有著不尋常的年齡差距

如果說 AI 偏好年輕女性,是因為網路上本就充斥著年輕女性的照片;那為什麼 AI 筆下的「台灣男人」,看上去通通超過 60 歲?這個問題我們沒有答案。但根據《Rest of World》的報導,該現象不只限於台灣。不管畫的是奈及利亞人、印尼人、美國人、中國人或印度人,AI 筆下的男人總是超過 60 歲,女人則永遠介於 18 至 40 歲之間


畫不出原住民

最後,我們還嘗試了「一個台灣原住民」的提示,發現這超出了 AI 的能力。Midjourney 給出的圖像有誇張的裝飾和紋身,其羽毛頭飾似乎更接近北美原住民,而非台灣 16 族原住民的任何一族。

提示:A Taiwanese indigenous person(一個台灣原住民)


AI 偏見可能的危害與解決方法

AI 繪圖偏見可能為被邊緣化的人群帶來實際危害。圖像生成式 AI 已被應用在生活各個領域,如廣告創意產業,甚至是犯罪嫌疑人素描的製作。AI 在提升效率、降低人力成本的同時,也強化了針對特定人群的偏見。

英國 AI 新創 Synthesia 的創辦人兼執行長維克托・里帕貝利(Victor Riparbelli)曾預估,到了 2026 年,網路上將有 90 % 的影片是人工生成的。可以想像,當反映人類偏見的 AI 圖像無所不在,「白人高管」、「黑人罪犯」、「男性科學家」、「女性家庭主婦」等刻板印象將更牢不可破。

經過以上測試,我們也發現 AI 繪製的「台灣人」有著扭曲失真、缺乏多樣性等問題。若窮困的小孩、衰老的男人和永遠 20 歲的女人就此成為「台灣人」的代表,其他人群將面臨「被隱身」的困境。

要如何解決 AI 繪圖的偏見和刻板印象,目前專家仍沒有共識。

某些問題可以透過更詳細的提示詞解決。舉例來說,要畫出不是短捲髮的台灣中年女性,只要在提示中加入「長髮」就好了。一般來說,仔細地描述人物的年齡、性別、種族、外型或其他視覺特徵,都有助於 AI 生成更逼真、更多元的圖像。這需要所有使用者都對 AI 有更深入的了解。

然而,許多問題是根本性的,如 AI 畫不出台灣原住民。我們嘗試了以下提示「一位排灣族中年男性,穿著對襟圓領上衣、長方形披肩,頭飾上有百步蛇紋、老鷹羽毛、琉璃珠」(此處描述參考了這篇文章),結果還是差強人意,畫出來的「排灣族男性」仍像美洲原住民。

問題的原因,很大部分出在訓練資料太過「西方中心」。打造出全球最大圖片資料集的非營利組織 LAION 的共同創辦人克里斯托夫・舒曼(Christoph Schuhmann)便指出,生成式 AI 不令人意外地反映了歐美白人的世界觀,因為包含 LAION 在內的許多資料集建造者,連中國和印度都不關心,儘管這兩個國家有著全球最多的網路使用者

如此看來,Midjourney 訓練資料集缺乏台灣的相關資料,導致畫不出台灣原住民、台灣囡仔身陷戰亂等問題,也是很自然的事。要讓 AI 畫出真實且多元的台灣人,第一步應從打造台灣自己的資料集著手

Stable Diffusion 的背後推手 Stability AI,在接受《華盛頓郵報》採訪時便表示,「每個國家都應該有一個反映其價值觀的圖像生成器,訓練數據由政府和公共機構提供。」

我們離這個目標,顯然還有很長的一段路要走。以在 AI 公平性方面走得較前面的英國為例:雖然英國資訊委員辦公室(Information Commissioner's Office, ICO)已發布了詳盡的「AI 與資料保護指引」,當中也包含「確保 AI 公平性」和消除偏見、歧視等內容,談及資料集與歧視時,ICO 的指引僅要求資料蒐集必須遵守資料保護法和《2010 平等法案》。英國的例子告訴我們,在建造更多元包容的資料集的路上,如何兼顧個資保護也將是個難題。

回到台灣,國家科學委員會(國科會)主委吳政忠也於 2023 年 2 月提出,台灣必須要有自己的 ChatGPT,且力拼 2023 年年底完成。6 月,國科會發布「可信賴 AI 對話引擎」(Trustworthy AI Dialog Engine,TAIDE)第一階段成果,該對話機器人以開源大型語言模型 LLaMA 為基礎,加入繁體中文資料微調而成。此外,AI 公司 iKala 共同創辦人兼執行長程世嘉,於 2024 年 1 月 2 日公布了與聯發科共同打造的繁體中文測試資料集 TMMLU+,是台灣在建立本土語言資料集上的重要里程碑。

至於台灣本土的圖像資料集,目前似乎仍未看到相關計畫。

然而,要解決 AI 偏見,從訓練資料下手才是根本性的解決之道。在 AI 新創資源有限的狀況下,也許必須透過公部門的介入,由政府或學術機關主導或投資一個多元兼容的本土資料集和 AI 大模型,才能平等、忠實地呈現台灣這塊土地上人群、種族和文化的多樣性


吳政霆

吳政霆 / 研究員

採訪寫作

張育寧

張育寧 / 總編輯

審訂

時間標記 Timestamp

EPEPISODE #旭沙龍-張育寧時間

EP #
邀請已成功寄出 Sucessfully sent