數(shù)據(jù)驅動的科技與產業(yè)創(chuàng)新所呈現(xiàn)的特征?
人工智能驅動的科學研究(AI for Science)在科學界早有探討,普遍認為海量數(shù)據(jù)和智能分析工具正在推動科學研究向數(shù)據(jù)驅動的科研范式轉變。創(chuàng)新不僅涉及科學研究,更要向技術開發(fā)、產業(yè)轉化、市場應用和收益回報等產學研用全鏈條推進,形成完整的商業(yè)模式。迄今學術界較少關注海量數(shù)據(jù)出現(xiàn)帶給創(chuàng)新鏈產業(yè)鏈全鏈的系統(tǒng)性影響及其對社會經(jīng)濟體系的整體影響。
科技創(chuàng)新在不同時代呈現(xiàn)不同特點。從數(shù)據(jù)生成、傳遞和獲取,數(shù)據(jù)交互能力,數(shù)據(jù)共享能力以及數(shù)據(jù)數(shù)量、深度和廣度等維度,觀察分析數(shù)字時代的科技與產業(yè)創(chuàng)新,能夠為回顧創(chuàng)新范式演進歷程提供新的視角。當前,科技創(chuàng)新進入新的時期,一個顯著特征是數(shù)據(jù)數(shù)量和關系重新定義創(chuàng)新鏈條上各方的交互方式和地位作用,各種創(chuàng)新力量的地位作用重新分化組合。
創(chuàng)新源泉:數(shù)據(jù)洞察能力與理論邏輯能力交互耦合的雙驅型創(chuàng)新
因果關系作為演繹法和歸納法的基礎假設,是理論邏輯推理的重要機制。數(shù)學理論模型作為一種抽象思維工具,特別適用于對變量進行形式邏輯處理,識別和揭示變量之間的因果關系,成為物理學、化學、生物學、醫(yī)學等學科的重要研究進路。但受限于理論認知邊界、模型結構形式、計算復雜性等因素,過往數(shù)學理論模型能夠處理的數(shù)據(jù)量小、數(shù)據(jù)維度少、數(shù)據(jù)關系相對簡單。進入數(shù)字時代,宏觀社會運行和微觀主體活動都以數(shù)字化形式呈現(xiàn),數(shù)據(jù)關系的復雜性急劇增加,變量之間更易表現(xiàn)出非線性、時變性和非平穩(wěn)性特征,以因果律為基礎的理論模型方法在刻畫和理解復雜現(xiàn)象的結構特性、交互關系以及演化行為等方面遇到前所未有的挑戰(zhàn)。
相對于因果邏輯分析,數(shù)據(jù)驅動的研究更加強調對各要素復雜相關關系的探求。從廣義角度看,大數(shù)據(jù)相關關系呈現(xiàn)的是一個無限蔓延的分布,具有深層因果關系意蘊:因果關系是對因素相互作用方向、過程及其效應之間的描述;相關關系則是因果派生關系的描述。這一具有極強滲透力、洞察力的創(chuàng)新方式在以往小數(shù)據(jù)無法解決的問題領域顯示出極強能力——尤其在未知復雜關系洞察方面取得顯著成績,甚至在更高層次推進了復雜因果概念的整體刻畫,賦予創(chuàng)新嶄新的動能。近幾年,大型數(shù)字企業(yè)憑借數(shù)據(jù)洞察力占據(jù)前沿科技新創(chuàng)企業(yè)投資的半壁江山。
從創(chuàng)新源泉角度看,超過60年的人工智能發(fā)展歷史可大致以2010年為界分為兩個階段。2010年以前,人工智能的前沿研究成果主要由理論邏輯能力驅動,而在此后,數(shù)據(jù)洞察能力成為人工智能創(chuàng)新發(fā)展的核心推動力。
新一代人工智能的發(fā)展,在更深層展示出理論邏輯能力和數(shù)據(jù)洞察能力是一個迭代累進過程。深度神經(jīng)網(wǎng)絡、機器學習等理論模型的發(fā)展帶來多模態(tài)數(shù)據(jù)處理能力的極大提升,數(shù)據(jù)驅動力的增強使得大模型出現(xiàn)“智能涌現(xiàn)”,衍生出通用人工智能的部分能力。然而,人工智能基礎大模型逐漸面臨復雜度急劇攀升、算力需求激增、摩爾定律逐步失效等“瓶頸”,并不足以支撐從感知人工智能到認知人工智能的跨越,包括數(shù)學、心理學、腦科學在內的理論研究對人工智能發(fā)展非常關鍵。在可預測的未來,數(shù)據(jù)洞察能力和理論邏輯能力交互耦合的雙輪驅動依然重要,但每個階段前期理論積累帶來的突破點不同,當前正是需要加快利用數(shù)據(jù)帶來創(chuàng)新突破的關鍵時期。
創(chuàng)新主體:規(guī)模涌現(xiàn)規(guī)則與大平臺創(chuàng)新優(yōu)勢
規(guī)模報酬是經(jīng)濟學的一個基礎概念。以往實體產品為主的時期,企業(yè)達到一定規(guī)模后,規(guī)模報酬呈現(xiàn)出報酬遞減的規(guī)律。進入網(wǎng)絡時代,軟件和各種數(shù)字產品呈現(xiàn)出規(guī)模報酬遞增的特點,產出增加比例大于投入增加比例。這是網(wǎng)絡空間數(shù)字產品可以復制復用的特性帶來的,更多銷售并無需更多產出。
海量數(shù)據(jù)和AI時代,規(guī)模報酬出現(xiàn)了本質變化。規(guī)模報酬遞增的特點由“邊際增量”改變?yōu)椤靶履芰τ楷F(xiàn)”。為了描述分析這種新類型的收益遞增,本文借用深度學習領域的一個重要概念——Scaling Law(即規(guī)模涌現(xiàn)規(guī)則),這個概念描述了模型性能與模型規(guī)模(如參數(shù)數(shù)量、數(shù)據(jù)規(guī)模和計算資源)之間的關系。其基本原理是,隨著模型規(guī)模的增加,模型的性能也會提高。這一發(fā)現(xiàn)激勵著研究者投入更多資源構建更大規(guī)模的模型,以期獲得更好的性能響應。研究者對這個規(guī)則的未來適用邊界有不同看法,但對其在當前階段的適用性大都贊同。從現(xiàn)實情況來看,頭部企業(yè)擁有數(shù)據(jù)和算力方面的優(yōu)勢,當規(guī)模越過一個閾值后,就會涌現(xiàn)出后來者無法企及的全新能力,包括深度泛在的感知能力、對多元變量關系的洞察能力、對高度復雜問題的預測能力等,為企業(yè)帶來強大市場競爭力。
從創(chuàng)新角度看,由于存在規(guī)模涌現(xiàn)規(guī)則,先行大企業(yè)在創(chuàng)新鏈條中的地位大幅提升,位勢不斷增強。大型數(shù)字平臺連接上億消費者和百萬級、千萬級生產者,實時生產和匯聚海量數(shù)據(jù),在強大的算力和算法支持下,具備自動提取經(jīng)驗數(shù)據(jù)特征和規(guī)律并進行推理決策的能力,能夠準確感知并捕捉創(chuàng)新資源維度和交易資源維度下的市場需求及變化趨勢。同時,研發(fā)結果可以直接應用于海量用戶,用戶使用反饋也能快速傳遞給研發(fā)團隊,持續(xù)的數(shù)據(jù)交互使研發(fā)方向能夠根據(jù)環(huán)境變化進行靈活調整,更好優(yōu)化相關服務。大型平臺的優(yōu)勢還來自數(shù)據(jù)交互形成研發(fā)簇群,平臺大場景運作、跨產業(yè)運營、多領域并進,能夠匯聚各創(chuàng)新主體之間的場景化數(shù)據(jù),并基于大規(guī)模的算法能力打造創(chuàng)新知識生態(tài),增強具象場域中研發(fā)成果和終端產品的良性交互,極大促進創(chuàng)新。
平臺的上述創(chuàng)新優(yōu)勢對高端人才和投資者形成強吸引力,因而成為數(shù)字前沿技術和基礎研究的重要創(chuàng)新力量。
創(chuàng)新組織:數(shù)據(jù)能力與邊界開放型創(chuàng)新組織形態(tài)
隨著數(shù)據(jù)成為重要創(chuàng)新要素,任何一個創(chuàng)新組織鏈接數(shù)據(jù)愈多、更新愈快、交互愈強,其創(chuàng)新能力就愈強。因此,能夠最大程度獲得數(shù)據(jù)、挖掘數(shù)據(jù)深度和廣度、增強數(shù)據(jù)交互和共享的開放式產業(yè)組織成為重要的創(chuàng)新組織形態(tài)。
在數(shù)字時代之前,開源開放已經(jīng)成為重要的創(chuàng)新模式。全球97%的軟件開發(fā)者和99%的企業(yè)使用開源軟件,全球70%以上的新立項軟件項目采用開源模式。雖然目前的人工智能大模型的領先者還是采用閉源模式,但由于大模型的訓練和調整需要極其巨大的數(shù)據(jù)、算力和算法的投入以及海量場景的支撐,后繼者很可能采用開源模式與之競爭。
開放科學以“自由、開放、合作、共享”為理念,以海量數(shù)據(jù)匯聚和處理為手段,推動大規(guī)??茖W項目研究。數(shù)據(jù)生成、傳遞和交互方式的不斷演進,使開放科學逐漸成為創(chuàng)新范式變革的一類趨向性目標。在天文學、高能物理、生命科學、空間科學等領域,國際大科學項目成為推動重大科學發(fā)現(xiàn)的主流模式,各國或國際組織均致力于大科學數(shù)據(jù)的開放共享,并將各國科學家聯(lián)合起來開展分布式協(xié)作研究。
數(shù)字時代,數(shù)據(jù)匯聚和交互能力成為驅動創(chuàng)新的重要引擎,任何主體具備的數(shù)據(jù)資源、專業(yè)知識都可能成為創(chuàng)新起點,也可能鏈接到創(chuàng)新鏈條中,與其他主體的數(shù)據(jù)交互還可能帶來新增的知識或發(fā)展,因而邊界開放對于創(chuàng)新的意義比以往任何時期都重要。從數(shù)據(jù)角度看,開放型組織能夠獲取多樣化的互補數(shù)據(jù)資源,包括市場需求數(shù)據(jù)、技術開發(fā)數(shù)據(jù)、行業(yè)發(fā)展數(shù)據(jù)等,提升創(chuàng)新能力。從主體角度看,開放型組織可以廣泛連接用戶、供應商、技術服務商等,提供了創(chuàng)新匯聚的樞紐,通過數(shù)據(jù)交互激發(fā)組織創(chuàng)新活力,形成多元主體驅動的創(chuàng)新模式。未來可能會有多種形態(tài)的開放組織出現(xiàn),但有競爭力的組織形態(tài)必然與其數(shù)據(jù)匯聚和交互能力匹配。
數(shù)據(jù)驅動的創(chuàng)新不僅能夠揭示海量數(shù)據(jù)間的復雜關系,洞察顆粒化場景并賦能,而且能夠推進和深化理論機制的多樣化探索路徑,甚至帶來新能力的動態(tài)涌現(xiàn)。可以預期,這種新型創(chuàng)新范式將成為科學發(fā)現(xiàn)最重要的范式和路徑。
創(chuàng)新倫理:普遍參與、負責任創(chuàng)新與維護競爭的公共價值
區(qū)別于以往傳統(tǒng)技術革新帶來的倫理問題,數(shù)字時代的科技倫理生發(fā)于創(chuàng)新過程本身,數(shù)據(jù)、數(shù)據(jù)關系成為科技發(fā)展方向的重要引導,以介入社會基礎運行的方式徹底重塑人的主體性與獨特性,導致自然秩序和社會關系的多元改變。數(shù)據(jù)驅動下的社會發(fā)展趨向、數(shù)字平臺成為新型社會基礎設施帶來的變革,以及創(chuàng)新效率提升中的壟斷等都成為新的難題與挑戰(zhàn)。
科技發(fā)展方向:公眾知情與參與的重要性。當下科技創(chuàng)新產生的一些影響一旦發(fā)生則不可逆轉,這就使得傳統(tǒng)的社會適應機制——試錯并糾正——變得不再適用。為避免少數(shù)專業(yè)修養(yǎng)深厚但全局知識和責任感不足的科技專家倉促作出影響長遠的科研決策,公民對相關科技發(fā)展趨向應具有平等的知情權和發(fā)言權,開源開放的創(chuàng)新特征也正與這一挑戰(zhàn)形成呼應。與民眾重要權益相關的數(shù)據(jù),應秉持以開放為原則的價值理念,最大限度保障公眾利益和社會福利??傊跀?shù)據(jù)與數(shù)據(jù)關系驅動的科技創(chuàng)新范式中,透明公開是首要的倫理遵循,以保障科技發(fā)展促進人類文明進步與福祉增加。
負責任創(chuàng)新:數(shù)據(jù)、算法黑箱與風險治理。由于數(shù)據(jù)量大、復雜度高,數(shù)據(jù)驅動的算法決策往往具有內部機制不透明的“黑箱”特點,且隨著數(shù)據(jù)交互能力與共享能力不斷提升,給用戶和社會帶來未知風險的概率也越大。近些年來,創(chuàng)新范式越來越強調“負責任”的維度以應對這些風險,國內外提出的諸多新興科技治理理念,如“建構性技術評估”“預期性治理”等,更多標志著倫理維度的深度嵌入?!柏撠熑窝芯颗c創(chuàng)新”的理念更是將倫理考量直接納入創(chuàng)新過程本身,確??萍歼M步不僅僅追求經(jīng)濟效益,更重要的是要在尊重人類價值觀、社會規(guī)范和環(huán)境保護的前提下開展創(chuàng)新。
制約大企業(yè)壟斷:為開源開放賦予新的倫理價值。數(shù)字時代的創(chuàng)新范式演進更多依賴數(shù)據(jù)、數(shù)據(jù)關系交互共享產生的正向循環(huán),也因此更容易導致壟斷的產生。當前的壟斷形式正在從傳統(tǒng)的價格壟斷轉變?yōu)槠脚_壟斷,大型平臺企業(yè)通過提供免費服務的方式掌握數(shù)據(jù)流量,規(guī)模經(jīng)濟和范圍經(jīng)濟效應十分顯著,規(guī)模效應遞增的特點也由“邊際”轉變?yōu)椤百|變”甚至“涌現(xiàn)”,有可能導致市場結構和競爭關系的根本改變。同時,市場內生的制約因素也在不斷涌現(xiàn),開源開放這類創(chuàng)新組織有可能削弱先行者的市場支配地位。在數(shù)字時代,由于對數(shù)據(jù)和應用場景的巨大需求,開源開放有可能成為非頭部企業(yè)發(fā)展的內在訴求。但由于先行者的優(yōu)勢更加突出,需要加大對開源開放的鼓勵和引導,使之成為企業(yè)社會責任的標識和追求,成為社會認同的創(chuàng)新文化,以約束頭部大型平臺企業(yè)的壟斷風險,提升創(chuàng)新效率,促進創(chuàng)新收益的公平分享。
(作者分別為中國社會科學院大學教授、中國社會科學院財經(jīng)戰(zhàn)略研究院博士后、清華大學講師)
- 標簽: