14 日,美國舊金山地方法院判決一家資料分析公司 HiQ 有權利從 LinkedIn 網站上擷取資料,並且 LinkedIn 應該立即移除任何阻止 HiQ 擷取資料的技術壁壘。
HiQ 公司利用在 LinkedIn 網站上公開的資料建立模型、訓練演算法,進而更預測員工行為,例如他們什麽時候可能辭職。LinkedIn 的辯詞是,HiQ 的做法違背了用戶協議,侵犯了用戶掌控自己公布訊息在 LinkedIn 平台上的的權利。
但是法院並不這麽認為。第一,平台上的資料由用戶自行發表在公共空間,LinkedIn 不能證明他們擁有這些資料,也就沒有權利阻擋他人使用這些數據。第二,理論上說,任何人都可以手動點開每個人的資料,拿紙筆抄下來,然後再輸入電腦。當然這是非常低效和愚蠢的做法,所以才使用演算法來這麽做。
HiQ 認同這個判決,表示這對所有依賴公開資料開展商業活動的公司來說是一次勝利。網路行業的創新不應該被幾個資料寡頭壟斷,公開資料應該可以被公眾獲取。另外一家靠擷取數據分析預測潛在消費者 Node 的 CEO 也表示支持,如果 LinkedIn 允許用戶訊息被搜尋引擎檢索到,進而為自己的平台帶來利益;他們就不能阻止其他網路公司從這些資料中獲利。
LinkedIn 表示,他們會提出上訴,繼續為保護用戶掌控自己訊息的權利奮鬥。
這個案子應該不會就這麽結束,如果上訴到上級法院,可能給產業帶來重要的影響。這會決定網路寡頭的資料壁壘到底有多高。至少在這案子中,法院指明了 LinkedIn 不能以保護用戶權利的藉口,保護自己的商業利益,並且用戶主動公開的資料也應當被公眾自由使用。如果用戶真要保護自己的訊息只能在 LinkedIn 上使用,他們應該做出特許約定;進而給予 LinkedIn 法律基礎阻止其他機構擷取用戶的資料。
AI 的角色在這次判決中沒有過度強調,可能因為技術本身不是法律關注點。法院是為了平衡利益、保護權利,如果 HiQ 利用擷取來的資料從用戶身上獲利,那麼那些用戶有權知道這些,並且有權允許或阻止,但是這些權利不該由 LinkedIn 這家商業公司來代理。
自己在一個網站上公開的資料是屬於誰的、該怎麽被第三方擷取使用,都可能是案子接下來需要回答的問題。我們拭目以待。
(本文由 36Kr 授權轉載;首圖來源:Flickr/Blogtrepreneur CC BY 2.0)