如果按照聰明和笨、勤奮和懶惰來(lái)劃分,世人大致可分為四類(lèi):聰明且勤奮、笨但勤奮、聰明卻懶惰、笨且懶惰。一般而言,前兩種人成功的幾率會(huì )比較大。因此,人們總結出“勤能補拙是良訓,一份汗水一份才”的成功經(jīng)驗。進(jìn)而得出了 “聰明人都在下笨功夫,愚蠢的人都在找捷徑”這樣看似很有道理的名言警句。與此同時(shí),人們又常說(shuō)“聰明是一種天賦,勤奮是一種選擇”,因此大家往往會(huì )把勤奮看成一種美德,而把聰明貶低為“小聰明”。但是,在現實(shí)生活中靠勤奮成功的人,總是給人一種很悲壯的感覺(jué),令人尊重但并不讓人羨慕。如果可以選擇,我們當然希望選擇聰明。
聰明往往是指一個(gè)人機智靈活,學(xué)習中具有舉一反三、觸類(lèi)旁通的能力。這樣的人不費多少力氣就能掌握某種知識和技能,而且善于解決復雜問(wèn)題,尤其是以前沒(méi)有處理過(guò)的問(wèn)題。而勤奮則是指認認真真努力干好每一件事情,不怕吃苦,踏實(shí)肯干。這樣的人默默持久的堅持,有一種水滴石穿、永不言棄的精神。
經(jīng)過(guò)了60多年的發(fā)展,人工智能(Artificial Intelligence, AI)就是父母口中所說(shuō)的那個(gè)別人家的孩子,看上去毫不費力卻取得了很大的成功。其實(shí),今天的AI只是一個(gè)勤奮、聽(tīng)話(huà)、精力充沛、幾近完美的“笨小孩”。比如,打敗圍棋九段柯潔和李世石的AlphaGo存儲了多達100萬(wàn)盤(pán)棋譜,它正是通過(guò)學(xué)習這些數據才總結出柯潔和李世石下棋的策略,進(jìn)而提前做出布局。而柯潔和李世石兩個(gè)人加起來(lái)終其一生也不可能下到100萬(wàn)盤(pán)棋。盡管后來(lái)AlphaGo的升級版AlphaGo Zero已經(jīng)無(wú)需再輸入棋譜,而是從零基礎開(kāi)始,通過(guò)自己左右互搏自學(xué)成才。AlphaGo Zero不斷探索和累積經(jīng)驗,現在已碾壓AlphaGo。但是,我們卻很難把AlphaGo和AlphaGo Zero與“聰明”關(guān)聯(lián)起來(lái)。因為它們的成功更多來(lái)自“勤能補拙”,就像是我們自己家的那個(gè)懂事勤奮又刻苦的孩子,確實(shí)取得了很大成功,但是著(zhù)實(shí)相當不易,非常辛苦!我們由衷地為孩子高興,卻又總覺(jué)得苦了孩子,總希望他們能多一點(diǎn)聰明,少一點(diǎn)辛勞!同樣的道理,我們也希望未來(lái)的AI更多地贏(yíng)在“智能”而不是“人工”上。
對于未來(lái)AI的發(fā)展,大家都做出了很多預測。概括起來(lái),大致可以總結為以下六個(gè)方面的發(fā)展趨勢。如果在這些方面不斷取得新突破,就會(huì )使AI不僅勤奮而且聰明,可更好地滿(mǎn)足人們的需要。
2021年10月24日,中共中央、國務(wù)院《關(guān)于完整準確全面貫徹新發(fā)展理念做好碳達峰碳中和工作的意見(jiàn)》提出大力發(fā)展綠色低碳產(chǎn)業(yè),為 AI賦能產(chǎn)業(yè)提出了新要求——綠色化助力碳中和。清華大學(xué)智能產(chǎn)業(yè)研究院院長(cháng)張亞勤提出AI+IoT綠色低碳應用場(chǎng)景,一是清潔能源和傳統能源的融合領(lǐng)域,AIoT技術(shù)可以監測碳排放,智能調度;二是信息和通信技術(shù)產(chǎn)業(yè)本身,大型的數據中心、5G等快速發(fā)展,消耗了很多能源,AI可以應用其中實(shí)現節能減排;三是新興產(chǎn)業(yè),比如在綠色城市、綠色交通等領(lǐng)域,AIoT也大有可為。其實(shí),未來(lái)AI自身的發(fā)展也應該沿著(zhù)綠色低碳方向進(jìn)行。當下的AI正在“野蠻生長(cháng)”,其算法、數據和算力這三大基石也在進(jìn)行規模擴張式發(fā)展。深度神經(jīng)網(wǎng)絡(luò )的模型規模越來(lái)越大,參數越來(lái)越多,因此所需要訓練樣本的規模越來(lái)越大,訓練網(wǎng)絡(luò )所需的算力必須越來(lái)越強,對資源的消耗必然越來(lái)越高。這樣的發(fā)展顯然是與綠色低碳背道而馳。以OpenAI提出的自然語(yǔ)言處理領(lǐng)域的GPT模型為例,其強大的功能是建立在超大的訓練語(yǔ)料、超多的模型參數,以及超強的計算資源之上。GPT模型的參數量為1.17億,預訓練數據量5GB;GPT-2的參數量為15億,預訓練數據量40GB;GPT-3的參數量為1750億,預訓練數據量45GB。據說(shuō),GPT-4的參數量將達到100萬(wàn)億,比GPT-3還要大500倍。同時(shí),針對監督學(xué)習來(lái)說(shuō),數據量的增長(cháng)需要很多人力進(jìn)行樣本標注,從而產(chǎn)生了一批又一批被AI“累死”的人。為此,有人提出了“難道有多少人工,才有多少智能?”這樣的靈魂拷問(wèn)。 反觀(guān)人類(lèi)的智慧體現在“否定”“遺忘”“有所為有所不為”等哲學(xué)上。這樣的智慧是在做減法,通過(guò)主動(dòng)“選擇”走上了一條綠色極簡(jiǎn)的發(fā)展道路。為了實(shí)現綠色低碳智能系統,我們希望未來(lái)AI的發(fā)展方向應該是做“減法”而不是做“加法”。一方面構建更為靈巧的網(wǎng)絡(luò )模型,通過(guò)輕量化的模型降低對數據量和算力的需求;另一方面,構建更為高效廣泛的共享復用機制,針對AI大模型,加大開(kāi)放、共享的廣度和深度,提高預訓練模型的效益,從而從宏觀(guān)上實(shí)現綠色低碳的總體效果??傊?,“創(chuàng )新、協(xié)調、綠色、開(kāi)放、共享”五大發(fā)展理念為未來(lái)AI的發(fā)展指明了方向,提出了根本遵循。人工智能的發(fā)展歷程經(jīng)常被劃分為兩代,即知識驅動(dòng)的AI和數據驅動(dòng)的AI。第一代AI主要基于知識庫和推理機來(lái)模擬人類(lèi)的推理和思考行為。其代表性成果就是IBM公司的Deep Blue和Deeper Blue,于1997年5月打敗了當時(shí)的國際象棋冠軍卡斯帕羅夫。知識驅動(dòng)的AI具有很好的可解釋性,而且知識作為一種數據和信息高度凝練的體現 , 也往往意味著(zhù)更高的算法執行效率。但是,其缺點(diǎn)在于完全依賴(lài)專(zhuān)家知識。一方面,將知識變成機器可理解可執行的算法十分費時(shí)費力;另一方面,還有大量的知識或經(jīng)驗難以表達建模。因此,知識驅動(dòng)的AI的應用范圍非常有限。 第二代AI則基于深度學(xué)習來(lái)模擬人類(lèi)的感知,如視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等。其代表性成果就是深度神經(jīng)網(wǎng)絡(luò ),通過(guò)收集大量的訓練數據并進(jìn)行標注,然后訓練設計好的深度網(wǎng)絡(luò )。這類(lèi)AI不需要領(lǐng)域知識,只需要通過(guò)大數據的訓練就可以達到甚至超過(guò)人類(lèi)的感知或識別水平。這類(lèi)AI具有通用性強、端到端的“黑箱”或傻瓜特性。但是,也正是由于其“黑箱”特性,才使得第二代AI算法非常脆弱,依賴(lài)高質(zhì)量、帶標記的大數據和強大的算力。因此,具有魯棒性差、不可解釋?zhuān)约安惶煽康绕款i問(wèn)題。 為此,清華大學(xué)張鈸院士提出第三代AI,希望將知識驅動(dòng)和數據驅動(dòng)結合起來(lái),充分發(fā)揮知識、數據、算法和算力四要素的作用,建立可解釋的魯棒AI理論。為了探索知識與數據雙驅動(dòng)AI的落地,華為云提出了知識計算的概念。它把各種形態(tài)的知識,通過(guò)一系列AI技術(shù)進(jìn)行抽取、表達后協(xié)同大量數據進(jìn)行計算,進(jìn)而產(chǎn)生更為精準的模型,并再次賦能給機器和人。目前,知識計算在若干垂直行業(yè)獲得初步成功。為此,華為云把明確定義的應用場(chǎng)景、充沛的算力、可以演進(jìn)的AI、組織與人才的匹配歸納為影響行業(yè)AI落地的4個(gè)關(guān)鍵要素。但是,這種垂直行業(yè)成功的AI距離通用AI卻是漸行漸遠。未來(lái),數據與知識雙驅動(dòng)的通用AI將是一項極具挑戰性的課題。習近平總書(shū)記在2021年5月中國科協(xié)第十次全國代表大會(huì )上的講話(huà)指出:“以信息技術(shù)、人工智能為代表的新興科技快速發(fā)展,大大拓展了時(shí)間、空間和人們認知范圍,人類(lèi)正在進(jìn)入一個(gè)人機物三元融合的萬(wàn)物智能互聯(lián)時(shí)代”。為此,我們的研究對象將由過(guò)去的物理 - 信息系統(CPS)向物理-信息-人類(lèi)社會(huì )更復雜的系統擴展。人類(lèi)所面臨的許多問(wèn)題具有不確定性、脆弱性和開(kāi)放性,同時(shí)人類(lèi)也是智能機器的服務(wù)對象和最終“價(jià)值判斷”的仲裁者,因此,人類(lèi)智能與機器智能的協(xié)同將是貫穿始終的。這就需要將人的作用或認知模型引入到AI中,從而形成“人機混合智能”或“混合增強智能”。 人機混合增強智能有兩種形態(tài),一種是人在回路中(Human-in-the-loop)的混合增強智能;一種是人在回路上(Human-on-the-loop)的混合增強智能,或者說(shuō)基于認知計算的混合增強智能。前者將人作為一個(gè)計算節點(diǎn)或者決策節點(diǎn)放置于整個(gè)智能回路中;后者則將人的認知模型引入到AI系統,形成一種類(lèi)人的AI。其實(shí)“人機混合”這一概念并不陌生,人與動(dòng)物一個(gè)最重要的區別就是人會(huì )制造和使用工具,而人使用工具的過(guò)程就是“人機混合”的過(guò)程。機械化時(shí)代,人機混合延伸和增強人的體力;信息化時(shí)代,人機混合延伸和增強人的感知力;在今天的智能化時(shí)代,人機混合增強人類(lèi)的智力,將是人腦主導的“感知力增強”和“智力增強”。比如,可穿戴設備,智能手表、智能眼鏡、智能服裝等,都幫助我們構建以人為中心的智能系統。人機混合增強智能系統的技術(shù)瓶頸在于人機的自然交互或接口技術(shù),這將是未來(lái)AI研究的難點(diǎn)和關(guān)鍵核心問(wèn)題。當前,人機混合智能已經(jīng)有了很多嘗試。比如,可穿戴搬運機器人在馬達驅動(dòng)下支撐人的上半身,減輕搬運重物時(shí)腰部負擔;一些科學(xué)家還嘗試將電極植入人腦中,讓人腦可以隨時(shí)直接從計算機中下載或上傳數據,大幅提升人類(lèi)的認知能力。未來(lái)人機混合增強智能希望能夠建立以人為中心的智能形態(tài),保證它“可用、好用”,而且“可控”。此外,當前的AI由于尚沒(méi)有自主的意識,其價(jià)值觀(guān)主要是由使用者的價(jià)值觀(guān)決定。因此,我們需要通過(guò)人機混合的方式為AI“立心”,從而讓AI更好的為人類(lèi)“立功”。機器學(xué)習尤其是深度學(xué)習的發(fā)展使得人工智能模型越來(lái)越復雜,而這些更復雜更強大的模型變得越來(lái)越不透明。再加上這些模型基本上仍然是圍繞相關(guān)性和關(guān)聯(lián)性建立的,從而導致很多挑戰性的問(wèn)題,如虛假的關(guān)聯(lián)性、模型調試性和透明性的缺失、模型的不可控,以及不受歡迎的數據放大等。其中,最核心的問(wèn)題就是AI的可解釋性。這一問(wèn)題不解決,AI系統就會(huì )存在不可信、不可控和不可靠的軟肋。2019年歐盟出臺《人工智能道德準則》,明確提出AI的發(fā)展方向應該是“可信賴(lài)的”,包含安全、隱私和透明、可解釋等。 2016年,來(lái)自谷歌機器學(xué)習科學(xué)家Ali Rahimi在NIPS大會(huì )上表示,當前有一種把機器學(xué)習當成煉金術(shù)來(lái)使用的錯誤趨勢。同年,美國國防高級研究計劃局制定了“DARPA Explainable AI (XAI) Program”,希望研究出可解釋性的AI模型。關(guān)于“可解釋性”,來(lái)自谷歌的科學(xué)家在2017年ICML會(huì )議上給出一個(gè)定義——可解釋性是一種以人類(lèi)理解的語(yǔ)言 ( 術(shù)語(yǔ) ) 給人類(lèi)提供解釋的能力(Interpretability as the ability to explain or to present in understandable terms to a human)。人有顯性知識和隱性知識,隱性知識就是經(jīng)驗直覺(jué),人可以有效地結合兩種不同的知識;而我們在解釋、理解事物時(shí)必須是利用顯性知識。當前的深度學(xué)習是以概率模型得到了隱性的知識,而顯性知識適合用知識圖譜來(lái)模擬。但是,目前深度學(xué)習和知識圖譜這兩個(gè)世界還沒(méi)有很好地走到一起。 可解釋性要求對AI系統的技術(shù)過(guò)程和相關(guān)的決策過(guò)程能夠給出合理解釋。技術(shù)可解釋性要求AI做出的決策是可以被人們所理解和追溯。在A(yíng)I系統會(huì )對人類(lèi)的生命造成重大影響時(shí),就需要AI系統的決策過(guò)程有一個(gè)合理的解釋、提前的預判與合法的控制。因此可解釋性AI有三大需求,第一是使深度神經(jīng)網(wǎng)組件變得透明;第二是從深度神經(jīng)網(wǎng)里面學(xué)習到語(yǔ)義圖;第三是生成人能理解的解釋。 AI系統不一定有意識,但可以有目的。機器學(xué)習的真正難點(diǎn)在于保證機器的目的與人的價(jià)值觀(guān)一致。AI面臨的重要挑戰不是機器能做多少事,而是知道機器做的對不對。五、非深度神經(jīng)網(wǎng)絡(luò )的人工智能今天AI的成功在很大程度上是大數據和深度學(xué)習的成功。如果把AI未來(lái)的發(fā)展全部寄托在深度神經(jīng)網(wǎng)絡(luò )上,總讓人感到有些單調,盡管目前的網(wǎng)絡(luò )形態(tài)也是多種多樣的。為了保持“物種的多樣性”,有必要研究深度神經(jīng)網(wǎng)絡(luò )以外的AI系統。 南京大學(xué)周志華教授認為,深度神經(jīng)網(wǎng)絡(luò )之所以成功的原因主要是基于逐層加工處理、內置特征變換和模型復雜度三個(gè)關(guān)鍵因素。但是,這三個(gè)因素并沒(méi)有“要求”我們必須使用神經(jīng)網(wǎng)絡(luò )模型;只要能同時(shí)做到這三點(diǎn),別的模型應該也能做深度學(xué)習。為此,他們提出了“深度森林”這種非神經(jīng)網(wǎng)絡(luò )的新型深度學(xué)習模型。深度森林的基礎構件是不可微的決策樹(shù),其訓練過(guò)程并不基于BP算法,甚至不依賴(lài)于梯度計算?!吧疃壬帧本哂杏柧毢?jiǎn)單、效率高等優(yōu)點(diǎn),小規模訓練數據也可運轉,而且在理論分析方面也更容易。因此,成為非深度神經(jīng)網(wǎng)絡(luò )AI系統的一種嘗試。 此外,華南理工大學(xué)陳俊龍教授認為,雖然深度結構網(wǎng)絡(luò )非常強大,但大多數網(wǎng)絡(luò )都被極度耗時(shí)的訓練過(guò)程所困擾。其中最主要的原因是,上述深度網(wǎng)絡(luò )都結構復雜并且涉及到大量的超參數。為此,他提出了寬度神經(jīng)網(wǎng)絡(luò )系統。相對于“深度”結構來(lái)說(shuō),“寬度”結構由于沒(méi)有層與層之間的耦合而非常簡(jiǎn)潔。同樣,由于沒(méi)有多層連接,寬度網(wǎng)絡(luò )亦不需要利用梯度下降來(lái)更新權值,所以計算速度大大優(yōu)于深度學(xué)習。在網(wǎng)絡(luò )精度達不到要求時(shí),可以通過(guò)增加網(wǎng)絡(luò )的“寬度”來(lái)提升精度,而增加寬度所增加的計算量與深度網(wǎng)絡(luò )增加層數相比,可以說(shuō)是微乎其微。當然,也有學(xué)者認為,現有的寬度學(xué)習僅適用于數據特征不多,但對預測實(shí)時(shí)性要求較高的場(chǎng)景。 不管是深度森林還是寬度網(wǎng)絡(luò ),它們的意義在于為我們提供了未來(lái)AI系統的更多可能,以及多元化的新選擇。從而避免出現人們不得不被迫選擇深度神經(jīng)網(wǎng)絡(luò )的無(wú)奈。我們相信,未來(lái)一定還會(huì )有更多的非深度神經(jīng)網(wǎng)絡(luò )的AI系統,因為系統多樣性是改善AI生態(tài)環(huán)境的重要保障。六、開(kāi)放環(huán)境自適應的人工智能今天AI取得的成功基本上都是封閉環(huán)境中的成功,其中的機器學(xué)習有許多假設條件,比如針對數據的獨立同分布假設,以及數據分布恒定假設等。我們通常要假定樣本類(lèi)別恒定,測試數據的類(lèi)別是與訓練數據的類(lèi)別一致,不會(huì )出現訓練時(shí)沒(méi)有遇到的類(lèi)別。此外,樣本屬性也是恒定的,在測試時(shí)也要求屬性特征完備。而實(shí)際情況是,我們現在越來(lái)越多地碰到所謂的開(kāi)放動(dòng)態(tài)環(huán)境。在這樣的環(huán)境中可能一切都會(huì )發(fā)生變化,這就要求未來(lái)的AI必須具備環(huán)境自適應能力,或者說(shuō)要求AI的魯棒性要強。 比如,在自動(dòng)駕駛或無(wú)人駕駛領(lǐng)域,在實(shí)驗室的封閉環(huán)境下,無(wú)論采集多少訓練樣本都不可能涵蓋所有情況,因為現實(shí)世界遠比我們想象的豐富。這樣在自動(dòng)駕駛的過(guò)程中會(huì )遇到越來(lái)越多的以前沒(méi)有見(jiàn)到的特殊情況,尤其是越是突發(fā)事件,越是很少出現的場(chǎng)景,這就對AI系統的自適應性或魯棒性提出極大的挑戰。因此,未來(lái)AI的發(fā)展必須能應對“開(kāi)放環(huán)境”的問(wèn)題,即如何在一個(gè)開(kāi)放環(huán)境下通過(guò)機器學(xué)習進(jìn)行數據分析和建模。 此外,現有AI技術(shù)依賴(lài)大量的高質(zhì)量訓練數據和計算資源來(lái)充分學(xué)習模型的參數。在系統初始建模階段,由于數據充分能夠得到比較理想的效果。然而,在投入使用一段時(shí)期后,在線(xiàn)數據內容的更新,就會(huì )產(chǎn)生系統性能上的偏差,嚴重時(shí)直接導致系統下線(xiàn)。在訓練數據量有限的情況下,一些規模巨大的深度神經(jīng)網(wǎng)絡(luò )也容易出現過(guò)擬合,使得在新數據上的測試性能遠低于之前測試數據上的性能。同時(shí),在特定數據集上測試性能良好的深度神經(jīng)網(wǎng)絡(luò ),很容易被添加少量隨機噪聲的“對抗”樣本欺騙,從而導致系統很容易出現高可信度的錯誤判斷。因此,發(fā)展魯棒性、可擴展性強的智能學(xué)習系統必定會(huì )成為下一代AI系統的重要研究課題。 從以上未來(lái)AI系統發(fā)展的六種形態(tài)以及各自的發(fā)展趨勢來(lái)看,下一步的研究需要系統、全面地借鑒人類(lèi)的認知機理,不僅是神經(jīng)系統的特性,還有認知系統(包括知識表示、更新、推理等),發(fā)展更加具有生物合理性,以及更靈活、更可信可靠的AI系統。唯有如此,未來(lái)AI系統才能夠實(shí)現“不僅勤奮而且更聰明更有智慧”的理想。