91人妻日韩人妻无码专区精品|国产99久久亚洲综合产品|亚洲色精品√1一区三区|亚洲成AV人片久久

云服務(wù)

熱門搜索: 防爆監(jiān)控 電動機 防爆暖通 防爆風機

首頁 行業(yè)資訊 政策解讀 電商會議 人物觀點 電商數(shù)據(jù) 電商干貨 電商報 博文資訊 客戶庫 企業(yè)庫
首頁>新聞詳情

張鈸院士:人工智能發(fā)展的回顧與展望

2024年6月26日 來源:防爆云平臺--防爆產(chǎn)業(yè)鏈服務(wù)平臺 防爆空調(diào) 防爆電氣 防爆電機 防爆風機 防爆通訊 瀏覽 1036 次 評論 0 次

迄今為止,全世界對于“什么是智能”尚無統(tǒng)一認識,但經(jīng)過多年的探索,人工智能已然走出了兩條道路。一條道路是行為主義學派,另一條道路是內(nèi)在主義學派。

其中,行為主義學派主張用機器模擬人類的智能行為?!爸悄堋迸c“智能的行為”是兩個完全不同的概念。“智能”在我們大腦里,人類至今仍對其知之甚少;“智能的行為”則是智能的外部表現(xiàn),可以進行觀察和模擬。因此,行為主義學派人工智能追求的目標是機器行為與人類行為的相似性,而非內(nèi)部工作原理的一致性。目前人工智能的主流是機器智能,這種人工智能與人類的智能只存在行為相似,并非完全一致。內(nèi)在主義學派主張必須用機器模擬人類大腦的工作原理,即類腦計算。這兩個學派按照不同的思路對人工智能進行探索,前者主張除人類這條道路外,機器或其他方法也可以走出一條智能道路;后者主張走向智能道路只能依靠人類。目前這兩種思路都處于探索階段。

人類對人工智能道路的探索始于1956年。當時在美國召開了人工智能研討會,來自數(shù)學、計算機科學、認知心理學、經(jīng)濟學和哲學等不同領(lǐng)域的10位專家經(jīng)過八周的討論定義了人工智能。他們主張通過符號推理、符號表示來做一個能像人那樣思考的機器。在這次會議上,紐維爾(Newell)和西蒙(Simon)演示了一個名為“邏輯學家”的程序。該程序用機器證明了數(shù)學原理第二章中的部分原理,數(shù)學定理證明與推理相似,這表明機器能做類似推理的工作。最終,“人工智能”在這個會議上獲得了定義。

1978年,清華大學成立了人工智能與智能控制教研組,這是中國最早的人工智能教學與科研機構(gòu)。教研組有三十余位教師參與,其中絕大部分來自自動控制領(lǐng)域,而非人工智能。1978年,教研組招收了第一批碩士生,1985年開始招收第一批博士生,已能夠開展一些與人工智能相關(guān)的教學工作,但科研工作進展不大。1982年至1984年,教研組進行調(diào)查研究,訪問了西南、東北等地大量研究所及工廠。結(jié)合所見所聞,教研組確定了以智能機器人作為主要研究方向。

1985年清華大學建立智能機器人實驗室,1986年國家設(shè)立“863”發(fā)展計劃,該計劃將智能機器人作為一個主題。清華大學參加了第一屆智能機器人主題的“863”高技術(shù)研究,從第一屆到第四屆均作為專家單位參加委員會。到了第五屆,清華大學成為開展智能機器人研究的組長單位,1997年,成為空間機器人研究的組長單位?!爸悄芗夹g(shù)與系統(tǒng)”國家重點實驗室自1987年開始籌建,1990年正式成立。在這些工作的基礎(chǔ)上,相關(guān)研究得以開展。當時首先建立了兩個理論。一是問題求解的商空間理論和粒計算理論,在國際上影響很大。2005年,清華大學發(fā)起、組織了國際粒計算會議,每年一次,延續(xù)至今。二是在人工神經(jīng)網(wǎng)絡(luò)方面做了很多早期工作。

人工智能的三個階段

1956年至今,人工智能的發(fā)展分為三個階段,分別是第一代人工智能、第二代人工智能和第三代人工智能。

第一代人工智能的目標是讓機器像人類一樣思考。思考是指推理、決策、診斷、設(shè)計、規(guī)劃、創(chuàng)作、學習等。無論做管理工作還是技術(shù)工作,都需要兩方面的能力,一是在某個領(lǐng)域具有豐富的知識和經(jīng)驗,二是具有很強的推理能力。其中推理是指運用知識的能力,換言之,是從已有知識出發(fā),推出新的結(jié)論、新的知識的能力?;谝陨戏治觯斯ぶ悄艿膭?chuàng)始人提出了“基于知識與經(jīng)驗的推理模型”,該模型的核心是若要實現(xiàn)機器思考,只需將相應(yīng)的知識放入計算機即可。例如,如果要讓計算機像醫(yī)生一樣為患者診斷,只需要把醫(yī)生的知識和經(jīng)驗放到知識庫里,將醫(yī)生看病的推理過程放入推理機制之中,計算機就能為患者實施機器診斷。這一推理模型的核心思想是知識驅(qū)動,通過計算模型來實現(xiàn)讓機器像人類那樣思考。該模型最大的缺點是缺乏自學能力,難以從客觀世界學習知識,所有知識都源于人類灌輸。因此,第一代人工智能永遠無法超越人類。

第二代人工智能源于第一代人工智能的低潮期,主要基于人工神經(jīng)網(wǎng)絡(luò)。1943年,人工神經(jīng)網(wǎng)絡(luò)模型提出,它主要模擬人類腦神經(jīng)網(wǎng)絡(luò)的工作原理。第二代人工智能面臨的主要問題是感性知識的傳授。第一代人工智能主要在符號主義指導下進行,目的是模擬人類的理性行為。但人類除了理性行為外,還有大量的感性行為,而感性行為要用人工神經(jīng)網(wǎng)絡(luò)進行模擬。我們常說知識是人類智慧的源泉,知識是理性行為的基礎(chǔ),這里的知識來自教育,主要指理性知識、分析問題的方法等。但感性的知識難以用語言傳授,也無法從書本上獲得。每一個人最初得到的感性知識是對自己母親的認識。但,具體是什么時候開始對母親有所認識的?又是怎樣實現(xiàn)這種認識的?這些問題到現(xiàn)在仍難以解答。所有感性知識都在不斷觀察、不斷傾聽的過程中學習累積,第二代人工智能深度學習沿用了這個方法。例如,過去我們主要通過編程的方法告訴計算機馬、牛、羊的具體特征,現(xiàn)在則將網(wǎng)上大量馬、牛、羊的照片做成訓練樣本,讓計算機進行觀察和學習即可。學習完畢,再把剩下的樣本作為測試樣本去測試它,識別率能達到95%以上。觀察和傾聽的過程通過人工神經(jīng)網(wǎng)絡(luò)進行,將識別的問題作為分類問題,利用人工神經(jīng)網(wǎng)絡(luò)來分類。通過神經(jīng)網(wǎng)絡(luò)進行學習的過程稱為深度學習,基于深度學習能夠進行分類、預(yù)測和生成等。但是第二代人工智能的所有數(shù)據(jù)(圖像、語音等)均來自客觀世界,它的識別只能用于區(qū)別不同的物體,并不能真正地認識物體。所以第二代人工智能最大的問題是不安全、不可信、不可控、不可靠、不易推廣。

第三代人工智能的基本思路是必須發(fā)展人工智能理論。迄今為止,人工智能尚無較為成型的理論,更多是模型和算法,且第一代和第二代人工智能的模型、算法都有很多缺陷。因此,必須大力發(fā)展科學完備的人工智能理論,在此基礎(chǔ)上,才能發(fā)展出安全、可控、可信、可靠和可擴展的人工智能技術(shù)。對目前的人工智能技術(shù)而言,雖然提高了效率和質(zhì)量,但系統(tǒng)越信息化和智能化,也就意味著越不安全。第一代人工智能運用了知識、算法、算力三個要素,其中最主要的是知識。第二代人工智能則主要用了數(shù)據(jù)、算法和算力三個要素。為了克服人工智能的固有缺點,唯一的辦法是把知識、數(shù)據(jù)、算法和算力這四個要素同時運用。目前得到較多運用的AI工具(大語言模型),就能夠充分利用知識、數(shù)據(jù)、算法、算力這四個要素。清華大學團隊提出了第三代人工智能的三空間模型,將整個感知、認知系統(tǒng)進行連接,為發(fā)展人工智能理論提供了非常好的條件。

深度學習的不安全性

在研究過程中,研究者發(fā)現(xiàn)了人工智能深度學習的不安全性。

其中一個典型案例是:研究者制作了雪山和狗的對比圖,先讓計算機和人看雪山,二者都能判定為雪山,但是只要在圖片上添加一點噪聲,人看雪山仍是雪山,計算機卻會將雪山看成一條狗。這個案例說明,人工智能目前基于深度學習的模式識別跟人類的視覺完全不同,盡管它能夠像人類那樣區(qū)分雪山和狗,但實際上它既不認識狗,也不認識雪山。這里面的關(guān)鍵問題是——什么是狗?應(yīng)該如何定義一條狗?人類通常通過視覺來進行區(qū)分,主要看狗的外形,但什么是狗的外形?狗有各種形態(tài)、各種姿勢,為什么人類的視覺能夠在千變?nèi)f化的外形里確定目標是狗?這個問題的答案,到現(xiàn)在為止尚未弄清楚。最早的計算機識別狗時,狗變換了位置后計算機就不能識別了,這是位移的不變性,這個問題現(xiàn)在已經(jīng)解決。但是尚未解決的問題還有很多。例如,計算機能夠識別固定尺寸的狗,但是把狗變大或變小后都難以識別,這是大小的不變性?,F(xiàn)在計算機只能通過局部紋理來區(qū)分狗和雪山。因此,如果將雪山圖上的某個紋理改成皮毛紋理,即便雪山的形狀保持不變,計算機仍會把雪山誤認為是狗。所以說,到目前為止,人工智能的深度學習仍然不夠安全可靠。

大語言模型的“大模型”與“大文本”

目前比較成功的AI工具,其強大性主要來源于兩個“大”,一是大模型,二是大文本。

第一個大模型的“大”是大的人工神經(jīng)網(wǎng)絡(luò),人工神經(jīng)網(wǎng)絡(luò)可以用來分類、學習數(shù)據(jù)中間的關(guān)聯(lián)關(guān)系,也可以用來預(yù)測。這個巨大的人工神經(jīng)網(wǎng)絡(luò)叫“轉(zhuǎn)換器”。AI工具的能力強大,離不開深度神經(jīng)網(wǎng)絡(luò)的強大。原來的神經(jīng)網(wǎng)絡(luò)是逐字輸入,現(xiàn)在一次能夠輸入2000多字(一個token,粗略地講相當于一個漢字)。人類從1957年到2013年花了56年時間探究文本的語意表示問題,現(xiàn)在的文本不是用符號表示,而是用語意向量表示,這也是最重要的一個突破。過去計算機處理文本只能把它當作數(shù)據(jù)處理,現(xiàn)在可以把它當成知識來處理,即向量表示。此外,還提出了“自監(jiān)督學習”。過去供計算機學習的文本都要做預(yù)處理、預(yù)先標注,此項工作量太大,所以無法支撐計算機大量學習。自監(jiān)督學習是指原來的文本不經(jīng)過任何處理就可以被計算機學習,用前面的文本預(yù)測后面的詞,輸入后預(yù)測下一個,被預(yù)測的內(nèi)容又把再下一個變成輸入,有些類似于接龍式學習方式。

第二個“大”是大文本。計算機實現(xiàn)自監(jiān)督學習后,所有文本不用經(jīng)過任何預(yù)處理就可以學習,文本也由原來的GB量級發(fā)展為TB量級?,F(xiàn)在比較成功的人工智能大約學習了40TB以上,相當于一千多萬本牛津辭典,并且這個學習過程并非死讀,而是理解其中的內(nèi)容。這就使得我們進入了生成式人工智能時代。無論是第一代還是第二代人工智能,都受到三個限制——特定領(lǐng)域用特定模型完成特定任務(wù)?!叭齻€特定”是所謂的“窄人工智能”,即專用人工智能。目前比較成功的AI工具能夠通過其強大的語言生成能力讓人類在與它對話時沒有領(lǐng)域限制,這是人工智能的重大進步。另外,生成多樣性的輸出是目前AI工具的重要特征。它有多樣化的輸出就有可能創(chuàng)新,因為輸出多樣化,難以保證每個輸出都正確,所以越希望它能輸出有創(chuàng)造性,就越要允許它犯錯誤。我們在日常使用一些AI工具時也會發(fā)現(xiàn),有時AI對問題的回答非常機智聰明,有時則是明顯的胡說八道,這就是多樣化輸出的結(jié)果。

目前AI工具產(chǎn)生了兩個重大突破,一是生成語意連貫的類似人類的文本,二是在開領(lǐng)域?qū)崿F(xiàn)了人機自然語言對話。大語言模型是向通用人工智能邁出的一步,有西方專家認為這是通用人工智能的曙光,但它并不是通用人工智能,人類走向通用人工智能依然任重道遠。

走向通用人工智能必須滿足三個條件。第一,系統(tǒng)必須與領(lǐng)域無關(guān)。目前較為成功的AI工具在對話、自然語言處理的問題上做到了與領(lǐng)域無關(guān),但在處理其他大量問題上仍難以實現(xiàn)這一目標。第二,系統(tǒng)與任務(wù)無關(guān),即什么任務(wù)都會做。目前AI工具能進行對話、四則運算、作詩、寫代碼等多種任務(wù),但仍難以完成復雜環(huán)境下的復雜任務(wù)。第三,尚需建立一個統(tǒng)一的理論。因此,人工智能還有很長的路要走。

大語言模型邁向通用人工智能的四個步驟

從大語言模型邁向通用人工智能需要四個步驟。第一步是跟人類進行交互、與人類對齊,第二步是多模態(tài)生成,第三步是與數(shù)字世界交互,第四步是與客觀世界交互。我們并不是說,完成這四步就意味著實現(xiàn)了通用人工智能,而是說通往通用人工智能這個目標,至少需要邁出以上四步。

第一步是與人類對齊。目前AI工具輸出的內(nèi)容不一定正確,若要解決這個問題,必須依靠人類幫助它克服,使之與人類對齊。從AI工具的應(yīng)用實踐來看,它的錯誤需要人類幫助糾正,而且它的錯誤糾正速度和迭代速度都很快。與此同時,我們要看到輸出內(nèi)容的錯誤仍然存在,但我們?nèi)绻胍哂袆?chuàng)造性,就要允許它犯錯誤。

第二步是多模態(tài)生成?,F(xiàn)在已經(jīng)可以用大模型生成圖像、聲音、視頻、代碼等各種模態(tài)的內(nèi)容。隨著技術(shù)的進步,鑒別一個內(nèi)容是由機器生成還是人工完成將會變得越來越困難,這為“造假”提供了非常好的機會?!霸旒佟庇置吧疃仍旒佟?,即用深度學習的辦法“造假”。試想一下,如果以后網(wǎng)絡(luò)上95%的文本都由AI生成,那么我們還能通過網(wǎng)絡(luò)獲取真知與真相嗎?比方說,當一件事情發(fā)生后,網(wǎng)絡(luò)上出現(xiàn)一片支持或者反對意見,這些意見究竟是來自多數(shù)人的真實表達,還是來自少數(shù)人操縱AI歪曲事實?如何有效防止AI工具操縱輿論、混淆視聽,這是需要我們嚴肅考慮的。

目前人工智能領(lǐng)域已經(jīng)實現(xiàn)了三項突破,即開領(lǐng)域生成語意連貫的類似人類的文本。其中,語意連貫是最重要的突破,這個突破后就有了圖像的突破。因為圖像只要求在空間上連貫即可,而視頻則進一步要求時空上的連貫。我們在語言上進行突破,緊接著會有圖像的突破,圖像突破后肯定還會有視頻的突破。在這個發(fā)展過程中,計算的資源要求和硬件都會變得越來越多。

隨著人工智能的發(fā)展,很多人注意到了“涌現(xiàn)”現(xiàn)象。例如,當系統(tǒng)規(guī)模沒有達到一定程度時,生成的圖畫很糟糕、水平較差,但當規(guī)模達到一定程度,生成的大多數(shù)圖畫突然間就變得質(zhì)量很高。這個過程稱為“涌現(xiàn)”,“涌現(xiàn)”是從量變到質(zhì)變的過程。到目前為止,全世界范圍內(nèi)都還無法完全理解“涌現(xiàn)”現(xiàn)象出現(xiàn)的原因。

第三步是AI智能體。大語言模型邁向通用人工智能必須與數(shù)字世界進行連接,首先在數(shù)字世界里具體操作,從而解決問題、感知自己成果的優(yōu)劣,并進行反饋。這個工作對促進大模型的性能向前發(fā)展有很大益處。

第四步是具身智能。具身智能,即具有身體的智能。智能光有腦還不夠,還必須具有身體,這樣才能動口又動手。所以,大語言模型邁向通用人工智能,必須通過機器人與客觀世界連在一起。

人工智能的產(chǎn)業(yè)發(fā)展

當下,信息產(chǎn)業(yè)的發(fā)展非常迅猛,原因在于建立了相關(guān)理論,在理論指導下制作的硬件和軟件都是通用的。過去,信息產(chǎn)業(yè)領(lǐng)域內(nèi)出現(xiàn)了一些具有世界影響力的大型企業(yè),應(yīng)用推廣相應(yīng)技術(shù)并實現(xiàn)信息化,整個鏈條發(fā)展非常迅速。但是,人工智能產(chǎn)業(yè)的發(fā)展缺乏理論,只有算法和模型,而根據(jù)算法和模型建立的硬件和軟件全是專用的?!皩S谩奔匆馕吨袌龊苄?,到現(xiàn)在為止,人工智能產(chǎn)業(yè)還沒有產(chǎn)生具有世界影響力的大型企業(yè),所以人工智能產(chǎn)業(yè)必須跟垂直領(lǐng)域深度結(jié)合才有可能發(fā)展。不過,目前情況也在發(fā)生變化,具有一定通用性的基礎(chǔ)模型的出現(xiàn),肯定會影響產(chǎn)業(yè)發(fā)展。

2020年,全世界人工智能產(chǎn)業(yè)達到10億美元以上的獨角獸企業(yè)一共有40家,2022年變成117家,2024年初達到126家,從這個情況來看,它是逐步增長的。到現(xiàn)在為止,中國有100甚至200家企業(yè)在做大模型。這么多人做基礎(chǔ)模型,他們未來的出路在哪里?

第一個出路是向各行各業(yè)轉(zhuǎn)移,做各個垂直領(lǐng)域的大模型。現(xiàn)在很多行業(yè)都在考慮這個問題,例如石油行業(yè)考慮石油行業(yè)的大模型,金融行業(yè)考慮金融行業(yè)的大模型,所以將來做通用大模型的數(shù)量將越來越少,大多數(shù)做大模型的人才會轉(zhuǎn)向各個垂直領(lǐng)域。第二個出路是最重要的,即經(jīng)過微調(diào)應(yīng)用在產(chǎn)業(yè)里。換言之,提供公開的大模型軟件,讓大家開發(fā)應(yīng)用。第三個出路是跟其他技術(shù)結(jié)合,發(fā)展新的產(chǎn)業(yè)。國外很多獨角獸企業(yè)都將AI工具與其他技術(shù)結(jié)合,發(fā)展新產(chǎn)業(yè),有的是向各個行業(yè)轉(zhuǎn)移,還有的專門做圖像、視頻、語音等。國內(nèi)一些大模型現(xiàn)在也已經(jīng)取得了比較好的發(fā)展。

基于此,勢必要推動人工智能領(lǐng)域的產(chǎn)業(yè)變革。今后無論做硬件還是做軟件,一定要放到基礎(chǔ)模型的平臺當中。過去是在一個零基礎(chǔ)的計算機中制作軟件,效率很低,而現(xiàn)在平臺已經(jīng)學習超過一千萬本牛津辭典,能力水平至少相當于一個高中生,若將同樣的工作放到基礎(chǔ)模型的平臺上進行將會事半功倍,所以采用這個平臺是不可阻擋的趨勢。而這些“高中生”則來源于大模型企業(yè)提供的公開平臺。

大模型的局限性

大模型的所有工作都由外部驅(qū)動,在外部提示下進行。它缺乏主動性,在外部提示下做某事時,主要基于概率預(yù)測的方法,所以會出現(xiàn)一些人類沒有的缺點,即輸出的質(zhì)量不可控。并且它不知道是非對錯,所以它的輸出也不可信。與此同時,它受外部影響太大,只能聽從指令來完成相應(yīng)的事情。但人類則是完全不同的,即使這件事是由別人安排完成,人也能夠在自己的意識控制下進行,所以是可控、可信的。

由此可見,目前的人工智能并不知道自己的所作所為。AI工具尚不能準確分辨對錯,且現(xiàn)在還難以主動進行自我迭代,仍舊需要在人類的操作下進行。未來的人工智能最多成為人類的助手,在人類的監(jiān)控下進行操作,只有少數(shù)工作可以完全交給機器獨立完成。有研究機構(gòu)曾做過關(guān)于人工智能對各行各業(yè)影響的統(tǒng)計,列出了大量行業(yè),在未來這些行業(yè)中只有少數(shù)工作可能會被人工智能取代??梢?,人工智能對各行各業(yè)都有重大影響,但大多數(shù)是幫助人類提高工作質(zhì)量和效率,而非取代人類進行工作。

人工智能是探索“無人區(qū)”,其魅力就在于它永遠在路上。我們不能因為它的進展而過于樂觀,也不必因為它的挫折而沮喪,我們需要的是堅持不懈地努力。

我來說兩句
人參與 丨 評論0條)
圖標
注冊 登錄    
評論列表
每頁 10 條,共 0 條

品牌商品

營業(yè)執(zhí)照 | 增值電信業(yè)務(wù)經(jīng)營許可證 | 豫公網(wǎng)安備41130202000490號 | 豫ICP備19015714號-1 (版權(quán)所有 防爆云平臺 © Copyright 2009 - 2024 . All Rights Reserved.)
东宁县| 巴青县| 镇平县| 唐海县| 乡城县| 宣城市| 太谷县| 澄迈县| 丹寨县| 九龙坡区| 滨州市| 邵阳市| 云梦县| 繁峙县| 闽侯县| 青河县| 通山县| 乌兰察布市| 南丰县| 宁德市| 中江县| 沧州市| 乌鲁木齐市| 宝应县| 潜山县| 和平区| 九江县| 克什克腾旗| 栾城县| 大洼县| 景东| 沙湾县| 章丘市| 湖州市| 玛多县| 临泉县| 瑞昌市| 洪雅县| 建德市| 杨浦区| 宁化县|