送禮物 訂閱
<%if prop.topic_id !=0 %> <%/if%>
<%:prop.genus%> <%:~formatDate(prop.online_date, 'YYYY MMM DD' )%> <%:prop.title%>
<%:prop.realname%> <%:prop.realname%>
<%:prop.realname%>

<%:prop.realname%>

<%:prop.intro%>

add
新會員

<%:prop.email%>

add

<%:prop.title%>

你的資料不是你的資料?網路資料抓取的合法性爭議

你的資料不是你的資料?網路資料抓取的合法性爭議

May 30, 2024

運用網頁抓取技術有助於推展學術研究,但存取的資料也會被有心人士用來進行網路犯罪。(圖片來源:Annette Riedl via Associated Press/達志影像)

<%:prop.realname%>
<%if prop.email %>

<%:prop.email%>

<%else %>

<%:prop.realname%>

<%:prop.intro%>

<%/if%>
已有閱讀權限

在資訊爆炸時代,抓取網路上的公開資料是否恰當,一直存有爭議。原因在於,確保存取公開資料的合法性,能夠豐富學術研究的資料庫,並避免資訊壟斷。但這是一把雙面刃,公開資料也可能被惡意使用,而侵害到個人隱私。

發生什麼事?

透過爬蟲程式抓取臉書上的資料,再製成新聞報導,算不算盜用資訊?這個問題的答案可能超乎你的想像。看似侵犯智慧財產權,但美國的判例卻傾向於:沒有違法。

當自動化程式搜尋可公開存取的網站以收集資料時,就會發生資料擷取,這些資料隨後可用於多種目的,包含訓練 AI 模型、定位線上廣告、輿情分析、市場研究等。

然而,被抓取的資料到底屬於誰?哪些用途才算是合理?該如何確保資料發布者的隱私?這些問題一直未有定論。

問題持續發酵,網頁抓取行為也越來越普遍。近幾年,在法律層面引發的爭議不斷出現。去年 7 月,X(原 Twitter)起訴網頁抓取公司亮數據(Bright Data),指控其從 X 平台「非法」複製和銷售內容,並提供自動化軟體,允許亮數據的用戶直接從平台抓取數據,已違反 X 的服務條款。

結果是,本月 10 日,加州聯邦法官予以駁回。法官在判決書寫道,X 並不是「希望保護用戶隱私」,而是「很樂意允許提取和複製 X 用戶的內容,只要付費即可。」

法官這麼認為的原因是,去年 7 月,X 曾在達拉斯縣(Dallas County)對 4 名被告提起訴訟,指控他們的資料抓取行為對 X 伺服器造成負擔,並損害了用戶體驗。當時 X 還求償超過 100 萬美元,因此法官認為,一旦 X 勝訴,意味著允許 X 握有抓取資料的同意權,還能對抓取資料的行為收取費用。

如果這件事可行,社群平台等於控制了收集公共網路資料的方式,並且還壟斷了這些資料的使用權與相關商業價值。而資訊由商業企業壟斷,有可能會損害公共利益。

科技巨頭的核心資產就是這些資料,不只 X,Meta 在 2023 年 1 月也曾對 Bright Data 提起類似訴訟,但同樣未獲成功。當時法官的裁決關鍵在於,Meta 沒有提供足夠的證據,證明 Bright Data 竊取除了公開資料以外的任何內容。顯然,法官認為,公開資料不算是平台提供者的財產。

連續兩個判例都保障網路公開資料的公共性,而美國以判例法為基礎,意味著公開資料的公有財產特質正在被逐步確立中,對於資訊內容產業來說,這個發展方向深具影響力。

為什麼美國法院會將公開資料定義為公共資產?這必須從 2022 年 4 月,一項具有里程碑意義的裁決說起。

陪你從「科技+人文」視角,深入國際政經脈動

35元/週解鎖付費會員專屬內容

  • 成為付費會員,即可擁有:
  • ✓ 全站深度分析報導文章
  • ✓ 會員專屬 8 折活動報名優惠

已經是付費會員?登入繼續閱讀

questionnaire questionnaire
questionnaire questionnaire
questionnaire questionnaire
林莉庭

林莉庭 / 研究員

編譯

張育寧

張育寧 / 總編輯

審訂

分享 Share シェア

facebooklinetwitterlinkedin

延伸閱讀 Read more

眼見為真?ITM為數位資料「鏈」上「信任」

眼見為真?ITM為數位資料「鏈」上「信任」

數位化快速帶動資訊傳播,原生資料可能在無數次轉手後,歷經了人為有意或無意的消失、竄改,如何「相信你看到的資料是真的」?現在,ITM 利用去中心化的區塊鏈技術,以「信任」為核心,讓數位資料都能輕易被驗證。

2022-05-05 12:01:00

面對全球駭客攻擊,奧義智慧如何以 AI 協防資安?

面對全球駭客攻擊,奧義智慧如何以 AI 協防資安?

AI 應用無所不及,資安產業也迎來自動化革新,奧義智慧以 AI 協助資安防護,釋出人力做更有價值的應用,市佔率國內第一,面對日益猖獗的駭客攻擊,奧義智慧如何一步步築起更堅硬的資安護盾?

2024-03-14 11:50:00

你有「駭客思維」嗎?上億次資安攻擊等同「資訊戰」?

你有「駭客思維」嗎?上億次資安攻擊等同「資訊戰」?

裴洛西訪台,媒體上發布「網站每分鐘達 1.7 億次攻擊」、「電子看板遭入侵」,數字跟畫面看了令人緊張,但這些攻擊其實沒有想像中恐怖。大眾對「資訊戰」有什麼誤解?企業和個人如何避免成為資安破口?

2022-11-29 11:30:00

時間標記 Timestamp

EPEPISODE #旭沙龍-張育寧時間

EP #
邀請已成功寄出 Sucessfully sent