關於數據、人工智能、區塊鏈的思考

ABMedia
分享
關於數據、人工智能、區塊鏈的思考

(本文內容源自簡體中文作者:Jason)

70 年前,當計算機普及剛剛燃起星星之火,我們絕不會想到,在全數字化社會迎面撲來之際,個體在數字世界擁有了「第二生命」,數字化的我們在遼闊的網絡「平行宇宙」中不斷拓寬自我邊界,不斷嘗試新鮮事物,不斷改善物質生活,同時我們也拓下了流動的印記:數據。

什麼是數據?這個信息科學中一個基本但複雜的問題,沒有顯而易見的答案。簡單地說,數據是觀察的產物。觀察對象包括物體、個人、機構、事件以及它們所處環境等。觀察是基於一系列視角、方法和工具進行的,並伴隨著相應的符號表達系統,比如度量衡單位。數據就是用這些符號表達系統記錄觀察對象特徵和行為的產物。數據可以採取文字、數字、圖表、聲音和視頻等形式。在存在形態上,數據有數字化的(Digital),也有非數字化的 (比如記錄在紙上)。但隨著信息和通訊技術(ICT)的發展,越來越多數據被數字化。

據 Statista 分析,預計到 2025 年,全球聯網設備的數量預計將達到 309 億台。聯網設備和服務創建了龐大的數據量,IDC 預測到 2025 年,全球數據將擴展至 163ZB (1ZB 等於 1 萬億 GB),相當於2016 年所產生 16.1ZB 數據的十倍。

這滾滾的數據洪流,如何挖掘其內在價值,人工智能給出了答案。

人工智能六十年

1956 年夏天,在達特茅斯學院長達六個月的一場研討會中,「人工智能」一詞在明斯基等一眾年輕科學家的研討中被提出。

直到 2006 年,Hinton 教授提出「深度學習」(Deep Learning) 神經網絡使得人工智能性能獲得突破性進展,這一次的人工智能浪潮與前兩次的浪潮有著明顯的不同。基於大數據和強大計算能力的機器學習算法已經在計算機視覺、語音識別、自然語言處理等一系列領域中取得了突破性的進展,基於人工智能技術的應用也已經開始成熟。讓人工智能開始真正邁向「智能」和落地應用。

時至今日,人工智能對於大家已經不再是陌生的技術,它走進了人們生活的無數細節中,小到網上購物,大到工廠生產,都能看到人工智能技術帶來的便捷與進步。

理論與技術的日益成熟,促成了應用領域攻城拔寨,並帶動商業化的不斷躍遷。全球範圍內越來越多的政府和企業組織逐漸認識到人工智能在經濟和戰略上的重要性,並從國家戰略和商業活動上涉足人工智能。

十年前,移動互聯網的興起讓人工智能站上了爆發式發展的「奇點」。以 Apple、Samsung 為代表的移動終端設備提供商和以 Alibaba、Tencent、Facebook、Google 為代表的移動互聯網服務提供商,它們的加速迭代,使得移動互聯網較之傳統的桌面互聯網,打破了既有的時空邊界,使得人機交互更加方便的同時,以自然語言處理、機器學習、視覺算法等技術為首的人工智能技術取到了突破性發展。

德勤在其 2019 全球人工智能發展白皮書中推算,預測未來 2025 年世界人工智能市場將超過 6 萬億美元,2017-2025 年複合增長率達 30%。普華永道在人工智能對世界經濟的經濟影響的研究報告稱,到2030 年人工智能的出現將為全球 GDP 帶來額外 14% 的提升,相當於 15.7 萬億美元的增長,超過中國和印度目前的國內生產總值總和。全球人工智能市場將在未來幾年經歷現象級的增長。

六十年,人工智能之火已成燎原之勢,面對第四次工業革命:科技革命,其天花板也逐漸顯現。

掣肘隱現

人工智能可以成為新一輪科技產業改革的變量與核心技術,缺少不了三大關鍵要素:數據、算法、算力

自互聯網興起,尤其是移動互聯網走進千家萬戶,迎來了全球數據的海量增長。這些真實而富有價值的數據為人工智能投餵了「生產材料」。

同時,芯片處理能力的提升,雲計算的大規模運用以及計算硬件價格的大幅下降使得全球算力迎來計算熱潮,算力為人工智能帶來了真金白銀的「生產發動機」。

得力於深度學習、機器學習、神經網絡、計算機視覺的躍遷式突破,廣闊的產業及解決方案市場使得人工智能算法得以快速發展,從行業來看,人工智能已經在醫療、健康、金融、教育、安防等多個垂直領域得到應用。算法為人工智能提供了得力的「生產工具」。

三大要素的加持,人工智能隨之迎來了「黃金十年」,而懸在人工智能頭上的達摩克利斯之劍也隨之隱現。

首先出現的是數據監管與隱私的壓力。早在 2018 年,歐盟便出台了《通用數據保護條例》(GDPR),2021 年我國《中華人民共和國數據安全法》與《中華人民共和國個人信息保護法》相繼實行。尤其是《個人信息保護法》,側重於個人權益,是為了維護公民個人的隱私、人格、人身、財產等利益,其關於「個人信息」的定義,是指以電子或者其他方式記錄的與已識別或者可識別的自然人有關的各種信息,個人隱私數據監管的加強無疑是給數據濫用的行為加上了強有力的枷鎖。

不僅如此,數據隱私的壓力也來源於彼此,對於擁有數據的企業來說,面臨著很大的矛盾:通過數據分享和交互顯然可以提升 AI 算法的效果,但同時又必須要保障自己的數據不洩露出去。無論是內部不同部門之間對於數據的使用,還是和第三方合作者的數據合作,都必須要嚴格的保障合規,上線各種涉及數據合作的項目時,往往首要的考慮就是數據流動中安全問題。

其次,模型訓練成本高昂。雖然硬件和軟件的進步一直在推動人工智能培訓成本每年下降 37%,但由於人工智能模型的規模增長更快(每年 10 倍),導致人工智能的總培訓成本繼續攀升。有機構認為,最先進的人工智能訓練模型成本可能會增加 100 倍,從目前大約 100 萬美元飆升至 2025 年超過 1 億美元。

面對數據隱私、成本高昂、技術集中化等問題,人工智能如何突破掣肘,邁上新的台階?

一些前沿技術的研究與應用為其鋪設了前進的道路。

人人都能用的人工智能

區塊鏈與隱私計算技術的出現為人工智能提供了新思路。

數據的巧妙穿插,令區塊鏈、隱私計算和 AI 三者以不同的方式產生了化學反應,這幾項技術的結合可以將數據的利用提高到新的水平,同時可以增強區塊鏈的基礎架構並增強AI的潛力。

區塊鏈的共識算法可以幫助人工智能系統中的完成主體協作任務,其技術特性也可使數據資產化,激勵更廣泛的數據、算法和算力加入,創造更高效的人工智能模型。

在有隱私數據應用的需求時,隱私計算可在保證數據提供方不洩露原始數據的前提下,對數據進行分析計算,保障數據在流通與融合過程中的「可用不可見」, 從而實現合規所需的隱私和安全控制,促進數據共享和價值交換。

目前市場上,我們已經可以看到形形色色基於隱私計算與區塊鏈的的平台產品,例如螞蟻鏈摩斯多方安全計算平台、百度安全的 MesaTEE 平台等,而平台產品絕大多數都是面向 B 端服務,道理很簡單,企業與企業之間的數據業務是最基本的商業需求,它解決了企業之間對於數據分享、交互、提升 AI 算法的基本矛盾,但並未在人工智能民主化及建立安全的通用人工智能上有所涉獵。

企業服務僅僅是人工智能目前所能達到的落地伊始,在可見的未來,數據所有權終將歸還給個人所有,技術、生產材料、生產工具也將讓渡及歸還給個人,以此才是圍繞數據這個「新一代生產要素」以AI、區塊鏈、隱私計算為技術設施,促進高級人工智能的湧現和進化,探索通往通用人工智能的道路之法。

近期,一家專注於前沿科技研究的企業發佈的產品讓用戶與市場在普世化通用人工智能的應用上看到了新的方向。

PlatON 隱私計算網絡(暫用名)是一個去中心化的數據共享和隱私計算基礎網絡,其從產品設計之初便另辟蹊徑,創新性的將人工智能的三要素:算力、算法、數據融入了產品中面向用戶,即只要你是用戶,就可以以數據所有者、數據使用者、算法開發者和算力提供者等多種身份登陸平台,並完成多種任務需求,以去中心化方式聚集計算所需的數據、算法和算力,創造安全、通用的人工智能新範式。

作為商用級產品,PlatON 隱私計算網絡不再定位為 To B 的企業級產品,而是廣義範圍的面向機構及個人開放,例如:

作為數據擁有者,個人及機構可以可作為數據節點添加數據,並參與平台上發佈的計算任務,這實現了令人驚訝地創新——將數據有效確權、定價、保護,讓數據在隱私保護的前提下完成了真正的資產化。

作為算力提供者,在平台中個人與機構皆可提供算力,為其他人提供執行某個計算任務時需消耗的機器資源,將有閒置的服務器(算力)對外提供,來支持網絡中的計算任務並獲得對應的任務獎勵。

而作為算法提供者,個人 AI 開發者可發揮最大的潛能,提供相應的AI算法,助力計算任務完成並獲得相應收益。

這形成了一個自由、開放、可持續發展的「AI 市場」,基於平台發佈數據和算力,利用數據和算力可對算法進行計算。基於區塊鏈上的密碼經濟學,可將數據、算力、算法貨幣化,形成有效的激勵機制,激勵更多的數據、算法和算力加入網絡。逐漸形成數據、算法和算力的去中心化的共享和交易市場。

此外,PlatON 在數據隱私方面,也設置了重重保護,通過融合安全多方計算、零知識證明、同態加密、可驗證計算、聯邦學習等多種密碼學技術進行協同計算,將本地數據保護起來,真正做到了「數據可用不可見」,不僅數據保護,計算結果如訓練完成的 AI 模型隱私也可得到保護。並且產品可高效地執行智能合約,也可流暢運行流行的深度學習框架,保障了其通用性、兼容性及高可用性。

從全景來看,隱私計算網絡是以平台化的方式,以 AI、區塊鏈、隱私計算技術為核心能力,建立對數據全生命週期的管理能力,並按照應用需要,實現與下層、經濟模型、數據算法算力資源等的無縫協同,從個體數據出發,破解數據孤島難題,數據不僅可以被保護、可以被運用,更能成為個人或機構資產。

目前產品正在內測階段,不難想象,如此龐大及複雜的平台產品,勢必會面臨極大的挑戰。例如:數據如何多方定價?數據在多方流通中如何實現精確抓取及應用?核心的算法又何如吸引 AI 開發者提供?

即便如此,仍可以看到這是一個前所未有的超級數據商業體,新技術的融合應用需要時間,產品打磨更需要時間,PlatON 隱私計算網絡產品在探索數據商業化的道路上已經邁出了一步。

面向未來,數據經濟躍遷的「奇點」,有可能就此向上綻放。