Lawsnote 搬移 33 萬筆資料庫遭重判,業界輿論與法律邊界再掀討論
成立超過 40 年的法源資訊 ,長期承接法務部、司法院等行政機關的法律資料建置與維護,並成為各大機關與圖書館指定採用的法律資料來源。2016 年成立的法律科技新創 Lawsnote,以 AI 結合語意分析技術為核心,打造類似 Google 的法律檢索介面及 AI 法律問答機器人等收費產品,迅速打開市場知名度。
然而,6 月 27 日,Lawsnote 創辦人因利用爬蟲抓取法源公司完整法規資料庫,被新北地方法院判處 2 年與 4 年有期徒刑,並罰款 1 億新台幣,引發業界熱議。部分輿論質疑是否「只是抓幾條法規沿革」就需要如此重罰,但判決書揭露,Lawsnote 並非片段取用,而是一次抓取 33 萬筆完整資料,包括法規沿革 98,068 筆、法規內容 102,520 筆及法規附件 130,936 筆,等同直接複製整座資料庫並投入自家商業資料庫,再以低價競爭,嚴重違反商業道德。
新北地方法院判決書畫面
資料庫內容重製後再作為盈利用途,並以低價競爭
法院指出,這些資料並不只是文字,而是包含命名邏輯、完整分類結構與附檔的資料庫內容。
法源的法規沿革已經過超過 53 萬次人工修訂與編輯,具備創作性,是受著作權保護的編輯著作。Lawsnote 選擇用爬蟲來取得法源資料庫內容,再重建、販售,並用於低價競爭,已超越合理使用的範疇,構成侵害著作權與無故取得電磁紀錄。法官強調,郭榮彥本身是律師、謝復雅也受過高等教育,卻未展現任何愧疚,更未向法源道歉,顯示行為非技術應用,而是破壞資料控制權的「實質重製」。
國際法案皆明示:必須合法取得資料
其實國際上的類似案例以及法案都有講明,需要「合法取得資料」。像是近期在 Anthropic 一案中,加州聯邦法院法官 William Alsup 就認定 AI 在進行模型訓練使用他人作品時,有高度「轉化性」的用途,可能構成合理使用。
但法官也強調該前提必須是「合法取得資料」,假設資料是違法獲取,即使有公益性,也不符合使用條件。根據歐盟 2019 年《著作權指令》(Directive (EU) 2019/790) 中的第 3、4 條針對科研與一般用戶,分別引入文本與資料探勘 (TDM) 例外,允許在「合法取得資料」的前提下,無需權利人同意即可進行資料探勘或 AI 訓練。
圖為歐盟 2019 年《著作權指令》(Directive (EU) 2019/790) 法條畫面
此外,日本著作權法 第 30 條之 4 允許為機器學習、資料分析等「非以人類感受為目的」之重製,不需要取得著作權人同意。 新加坡於 2021 年修法設立「計算資料分析例外」(CDA Exception) ,同樣規定資料必須合法取得,不能繞過付費牆或違反使用條款取得資料。
總體而言,不管是歐盟、日本還是新加坡,AI 訓練的例外規範都有共同核心條件,也就是資料來源必須「合法」,不能越權爬取、擅自重製或從不明來源取得。
國外爬蟲都沒事?OpenAI 案件仍無定論
Lawsnote 一案爆出後,網路上也有人質疑,有很多 AI 模型的爬蟲就算越權或爬進付費牆,國外也不會怎麼樣。事實上,美國確實有多起仍在審理中的案件,但尚未有結論。
例如《紐約時報》控告 OpenAI ,指控 ChatGPT 未經授權擷取並使用數百萬篇受著作權保護的新聞文章,其中包含付費牆後的內容,涉嫌侵權。但案件仍在審理階段,尚無定論。
另一家數位媒體公司 Ziff Davis 也以類似理由提告 OpenAI,不過 OpenAI 則強調自家模型屬於促進創新的人類創造力工具,並嚴格遵守「合理使用」法律框架,目前部分駁回動議已獲法院初步支持,最終結果仍待觀察。
此外,新聞出版商 News Corp (旗下包括《華爾街日報》、紐約郵報等媒體) 也控告 Web3 瀏覽器業者 Brave Software,指其未經授權「爬取」並重現受版權保護且付費的內容,違反網站使用條款並構成侵權,該案仍在審理中。
不過,美國也有已經定案、認定違法的爬蟲案例。例如臉書 Facebook 與 Power Ventures 一案,法院認為 Power Ventures 在被封鎖並收到禁止通知後,仍繞過權限繼續爬取臉書用戶資料,構成違反《電腦詐欺與濫用法》(CFAA),最終被判違法並須賠償及接受禁制令。
完全與新創無關,是誠信與授權問題
話題回到 Lawsnote 一案上,網路上有不少輿論試圖將這起官司包裝成這是「傳統法規與台灣未來新創」的戰爭,或者「公共財與法律保護」的戰爭。不過根據法院判決內容,這並非 AI 或新創議題,而是單純的商業行為觸法。
有律師表示 ,Lawsnote 明知資料來源有風險,也知道對方禁止爬取、是競業,但還是選擇這樣做,更對外宣稱「只有負責人涉案,公司沒問題」,同時在臉書揶揄對手多年建庫的「愚蠢」,自誇成立三年就能完勝老牌業者,甚至事後指責檢調與法院阻礙新創,完全忽視自身責任。
也有律師指出 ,判決之所以強調「筆數」與完整結構,是因為法律判斷重點在於「是否破壞資料控制與支配性」。本案顯示,被定罪的並非爬蟲技術本身,而是「人」選擇用法律不允許的方式強取他人智慧財產,卻將問題歸咎於法律死板不開放。法院最終傳遞的訊息很清楚,資料取得方式與誠信態度,比技術本身更重要,技術無法成為侵權的藉口。