Lawsnote 爬蟲一億案掀新創爭議,新北法院為何判定違法?國外 AI 爬蟲就沒事?

Louis Lin
分享
Lawsnote 爬蟲一億案掀新創爭議,新北法院為何判定違法?國外 AI 爬蟲就沒事?

「七法公司」(Lawsnote) 因未經授權,透過網路爬蟲大量抓取法學資料庫平台「法源資訊」的付費內容,並用於自家營利用途,遭以侵害著作權等罪名提告。不僅須賠償新台幣 1 億元,兩位創辦人更被判處 2 年與 4 年有期徒刑。消息曝光後引發爭議,有人認為只是抓取部分內容不至於判刑這麼重,不過法院查明 Lawsnote 爬取的並非零星幾條資料,而是多達 33 萬筆、完整且經分類歸檔的整套資料庫內容。

Lawsnote 搬移 33 萬筆資料庫遭重判,業界輿論與法律邊界再掀討論

成立超過 40 年的法源資訊,長期承接法務部、司法院等行政機關的法律資料建置與維護,並成為各大機關與圖書館指定採用的法律資料來源。2016 年成立的法律科技新創 Lawsnote,以 AI 結合語意分析技術為核心,打造類似 Google 的法律檢索介面及 AI 法律問答機器人等收費產品,迅速打開市場知名度。

然而,6 月 27 日,Lawsnote 創辦人因利用爬蟲抓取法源公司完整法規資料庫,被新北地方法院判處 2 年與 4 年有期徒刑,並罰款 1 億新台幣,引發業界熱議。部分輿論質疑是否「只是抓幾條法規沿革」就需要如此重罰,但判決書揭露,Lawsnote 並非片段取用,而是一次抓取 33 萬筆完整資料,包括法規沿革 98,068 筆、法規內容 102,520 筆及法規附件 130,936 筆,等同直接複製整座資料庫並投入自家商業資料庫,再以低價競爭,嚴重違反商業道德。

新北地方法院判決書畫面

資料庫內容重製後再作為盈利用途,並以低價競爭

法院指出,這些資料並不只是文字,而是包含命名邏輯、完整分類結構與附檔的資料庫內容。

法源的法規沿革已經過超過 53 萬次人工修訂與編輯,具備創作性,是受著作權保護的編輯著作。Lawsnote 選擇用爬蟲來取得法源資料庫內容,再重建、販售,並用於低價競爭,已超越合理使用的範疇,構成侵害著作權與無故取得電磁紀錄。法官強調,郭榮彥本身是律師、謝復雅也受過高等教育,卻未展現任何愧疚,更未向法源道歉,顯示行為非技術應用,而是破壞資料控制權的「實質重製」。

國際法案皆明示:必須合法取得資料

其實國際上的類似案例以及法案都有講明,需要「合法取得資料」。像是近期在 Anthropic 一案中,加州聯邦法院法官 William Alsup 就認定 AI 在進行模型訓練使用他人作品時,有高度「轉化性」的用途,可能構成合理使用。

但法官也強調該前提必須是「合法取得資料」,假設資料是違法獲取,即使有公益性,也不符合使用條件。根據歐盟 2019 年《著作權指令》(Directive (EU) 2019/790) 中的第 3、4 條針對科研與一般用戶,分別引入文本與資料探勘 (TDM) 例外,允許在「合法取得資料」的前提下,無需權利人同意即可進行資料探勘或 AI 訓練。

圖為歐盟 2019 年《著作權指令》(Directive (EU) 2019/790) 法條畫面

此外,日本著作權法第 30 條之 4 允許為機器學習、資料分析等「非以人類感受為目的」之重製,不需要取得著作權人同意。 新加坡於 2021 年修法設立「計算資料分析例外」(CDA Exception),同樣規定資料必須合法取得,不能繞過付費牆或違反使用條款取得資料。

總體而言,不管是歐盟、日本還是新加坡,AI 訓練的例外規範都有共同核心條件,也就是資料來源必須「合法」,不能越權爬取、擅自重製或從不明來源取得。

國外爬蟲都沒事?OpenAI 案件仍無定論

Lawsnote 一案爆出後,網路上也有人質疑,有很多 AI 模型的爬蟲就算越權或爬進付費牆,國外也不會怎麼樣。事實上,美國確實有多起仍在審理中的案件,但尚未有結論。

例如《紐約時報》控告 OpenAI,指控 ChatGPT 未經授權擷取並使用數百萬篇受著作權保護的新聞文章,其中包含付費牆後的內容,涉嫌侵權。但案件仍在審理階段,尚無定論。

另一家數位媒體公司 Ziff Davis 也以類似理由提告 OpenAI,不過 OpenAI 則強調自家模型屬於促進創新的人類創造力工具,並嚴格遵守「合理使用」法律框架,目前部分駁回動議已獲法院初步支持,最終結果仍待觀察。

此外,新聞出版商 News Corp (旗下包括《華爾街日報》、紐約郵報等媒體) 也控告 Web3 瀏覽器業者 Brave Software,指其未經授權「爬取」並重現受版權保護且付費的內容,違反網站使用條款並構成侵權,該案仍在審理中。

不過,美國也有已經定案、認定違法的爬蟲案例。例如臉書 Facebook 與 Power Ventures 一案,法院認為 Power Ventures 在被封鎖並收到禁止通知後,仍繞過權限繼續爬取臉書用戶資料,構成違反《電腦詐欺與濫用法》(CFAA),最終被判違法並須賠償及接受禁制令。

完全與新創無關,是誠信與授權問題

話題回到 Lawsnote  一案上,網路上有不少輿論試圖將這起官司包裝成這是「傳統法規與台灣未來新創」的戰爭,或者「公共財與法律保護」的戰爭。不過根據法院判決內容,這並非 AI 或新創議題,而是單純的商業行為觸法。

有律師表示,Lawsnote 明知資料來源有風險,也知道對方禁止爬取、是競業,但還是選擇這樣做,更對外宣稱「只有負責人涉案,公司沒問題」,同時在臉書揶揄對手多年建庫的「愚蠢」,自誇成立三年就能完勝老牌業者,甚至事後指責檢調與法院阻礙新創,完全忽視自身責任。

也有律師指出,判決之所以強調「筆數」與完整結構,是因為法律判斷重點在於「是否破壞資料控制與支配性」。本案顯示,被定罪的並非爬蟲技術本身,而是「人」選擇用法律不允許的方式強取他人智慧財產,卻將問題歸咎於法律死板不開放。法院最終傳遞的訊息很清楚,資料取得方式與誠信態度,比技術本身更重要,技術無法成為侵權的藉口。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。