Lawsnote 爬蟲一億案掀新創爭議，新北法院為何判定違法？國外 AI 爬蟲就沒事？

Table of Contents

Lawsnote 搬移 33 萬筆資料庫遭重判，業界輿論與法律邊界再掀討論

成立超過 40 年的法源資訊，長期承接法務部、司法院等行政機關的法律資料建置與維護，並成為各大機關與圖書館指定採用的法律資料來源。2016 年成立的法律科技新創 Lawsnote，以 AI 結合語意分析技術為核心，打造類似 Google 的法律檢索介面及 AI 法律問答機器人等收費產品，迅速打開市場知名度。

然而，6 月 27 日，Lawsnote 創辦人因利用爬蟲抓取法源公司完整法規資料庫，被新北地方法院判處 2 年與 4 年有期徒刑，並罰款 1 億新台幣，引發業界熱議。部分輿論質疑是否「只是抓幾條法規沿革」就需要如此重罰，但判決書揭露，Lawsnote 並非片段取用，而是一次抓取 33 萬筆完整資料，包括法規沿革 98,068 筆、法規內容 102,520 筆及法規附件 130,936 筆，等同直接複製整座資料庫並投入自家商業資料庫，再以低價競爭，嚴重違反商業道德。

資料庫內容重製後再作為盈利用途，並以低價競爭

法院指出，這些資料並不只是文字，而是包含命名邏輯、完整分類結構與附檔的資料庫內容。

法源的法規沿革已經過超過 53 萬次人工修訂與編輯，具備創作性，是受著作權保護的編輯著作。Lawsnote 選擇用爬蟲來取得法源資料庫內容，再重建、販售，並用於低價競爭，已超越合理使用的範疇，構成侵害著作權與無故取得電磁紀錄。法官強調，郭榮彥本身是律師、謝復雅也受過高等教育，卻未展現任何愧疚，更未向法源道歉，顯示行為非技術應用，而是破壞資料控制權的「實質重製」。

國際法案皆明示：必須合法取得資料

其實國際上的類似案例以及法案都有講明，需要「合法取得資料」。像是近期在 Anthropic 一案中，加州聯邦法院法官 William Alsup 就認定 AI 在進行模型訓練使用他人作品時，有高度「轉化性」的用途，可能構成合理使用。

但法官也強調該前提必須是「合法取得資料」，假設資料是違法獲取，即使有公益性，也不符合使用條件。根據歐盟 2019 年《著作權指令》(Directive (EU) 2019/790) 中的第 3、4 條針對科研與一般用戶，分別引入文本與資料探勘 (TDM) 例外，允許在「合法取得資料」的前提下，無需權利人同意即可進行資料探勘或 AI 訓練。

圖為歐盟 2019 年《著作權指令》(Directive (EU) 2019/790) 法條畫面

此外，日本著作權法第 30 條之 4 允許為機器學習、資料分析等「非以人類感受為目的」之重製，不需要取得著作權人同意。新加坡於 2021 年修法設立「計算資料分析例外」(CDA Exception)，同樣規定資料必須合法取得，不能繞過付費牆或違反使用條款取得資料。

總體而言，不管是歐盟、日本還是新加坡，AI 訓練的例外規範都有共同核心條件，也就是資料來源必須「合法」，不能越權爬取、擅自重製或從不明來源取得。

國外爬蟲都沒事？OpenAI 案件仍無定論

Lawsnote 一案爆出後，網路上也有人質疑，有很多 AI 模型的爬蟲就算越權或爬進付費牆，國外也不會怎麼樣。事實上，美國確實有多起仍在審理中的案件，但尚未有結論。

例如《紐約時報》控告 OpenAI，指控 ChatGPT 未經授權擷取並使用數百萬篇受著作權保護的新聞文章，其中包含付費牆後的內容，涉嫌侵權。但案件仍在審理階段，尚無定論。

另一家數位媒體公司 Ziff Davis 也以類似理由提告 OpenAI，不過 OpenAI 則強調自家模型屬於促進創新的人類創造力工具，並嚴格遵守「合理使用」法律框架，目前部分駁回動議已獲法院初步支持，最終結果仍待觀察。

此外，新聞出版商 News Corp (旗下包括《華爾街日報》、紐約郵報等媒體) 也控告 Web3 瀏覽器業者 Brave Software，指其未經授權「爬取」並重現受版權保護且付費的內容，違反網站使用條款並構成侵權，該案仍在審理中。

不過，美國也有已經定案、認定違法的爬蟲案例。例如臉書 Facebook 與 Power Ventures 一案，法院認為 Power Ventures 在被封鎖並收到禁止通知後，仍繞過權限繼續爬取臉書用戶資料，構成違反《電腦詐欺與濫用法》(CFAA)，最終被判違法並須賠償及接受禁制令。

完全與新創無關，是誠信與授權問題

話題回到 Lawsnote 一案上，網路上有不少輿論試圖將這起官司包裝成這是「傳統法規與台灣未來新創」的戰爭，或者「公共財與法律保護」的戰爭。不過根據法院判決內容，這並非 AI 或新創議題，而是單純的商業行為觸法。

有律師表示，Lawsnote 明知資料來源有風險，也知道對方禁止爬取、是競業，但還是選擇這樣做，更對外宣稱「只有負責人涉案，公司沒問題」，同時在臉書揶揄對手多年建庫的「愚蠢」，自誇成立三年就能完勝老牌業者，甚至事後指責檢調與法院阻礙新創，完全忽視自身責任。

也有律師指出，判決之所以強調「筆數」與完整結構，是因為法律判斷重點在於「是否破壞資料控制與支配性」。本案顯示，被定罪的並非爬蟲技術本身，而是「人」選擇用法律不允許的方式強取他人智慧財產，卻將問題歸咎於法律死板不開放。法院最終傳遞的訊息很清楚，資料取得方式與誠信態度，比技術本身更重要，技術無法成為侵權的藉口。