人工智慧 (AI) 是這個時代的口號。這個概念是由技術專家、學者、記者和風險投資家們共同提出的。正如從技術學術領域過渡到一般流通的許多短語一樣,這句話的使用也有很大的誤解。但這並不是公眾不瞭解科學家的經典案例——在這裡,科學家們常常被公眾所迷惑。我們的時代在某種程度上看到了矽谷的智慧的出現,它的競爭對手是我們自己的娛樂,這讓我們著迷,也讓我們感到恐懼。不幸的是,它分散了我們的注意力。
有一種不同的敘事方式可以講述當前的時代。想想下面這個故事吧,它涉及到人類、電腦、資料和生死抉擇,但它的焦點卻不是在矽谷的幻想。14 年前,當我的配偶懷孕時,我們做了超聲波檢查。房間裡有一個遺傳學家,她指出了胎兒心臟周圍的一些白色斑點。「這些都是唐氏綜合症的標誌,」她說,「現在你的風險已經上升到 20 分之一。」她進一步告訴我們,我們可以通過羊膜穿刺術瞭解到胎兒是否有遺傳修飾。但是羊膜穿刺術是有風險的——在手術過程中殺死胎兒的風險大約是 300 分之一。作為一名統計學家,我決心找出這些數字的來源。長話短說,我發現在英國已經做了 10 年的統計分析,這些白色斑點,反映了鈣的積累,確實是作為唐氏綜合症的預測因子。但我也注意到,在我們的測試中使用的成像機器每平方英吋的畫素比在英國研究中使用的機器多幾百畫素。我回去告訴遺傳學家,我相信這些白色斑點很可能是假陽性——它們確實是「白噪音」。她說:「啊,這就解釋了為什麼我們在幾年前就開始看到唐氏綜合症的發病率上升了; 是新機器來的時候。
我們沒有做羊膜穿刺術,幾個月後一個健康的女孩出生了。但這段插曲讓我感到不安,尤其是在經過一個簡單的計算之後,我相信,在全世界的同一天,成千上萬的人都得到了診斷,他們中的許多人選擇了羊膜穿刺術,而且許多嬰兒都是不必要地死去的。這種情況日復一日地發生,直到它被固定下來。這個事件揭示的問題不是關於我個人的醫療保健; 它是關於一個醫療系統,在不同的地點和時間測量變數和結果,進行統計分析,並在其他地方和時間使用結果。問題不僅在於資料分析本身,還在於資料庫研究人員所稱的「起源」——從廣義上說,資料是在哪裡產生的,從資料中得出了什麼推論,這些推論與目前的情況有多大關聯?雖然受過訓練的人可能會在個案的基礎上解決所有這些問題,但問題是設計一個能夠做到這一點的星球規模醫療系統,而不需要如此詳細的人力監督。
我也是一名電腦科學家,我意識到建立這種基於行星規模的推理和決策系統所需的原理,將電腦科學與統計資料融合在一起,並考慮到人類的公共事業,在我的教育中無處可尋。,在我看來,這些原則的發展——這將需要不僅在醫學領域,而且在商務等領域,運輸和教育——至少是同樣重要的構建人工智慧系統,可以讓我們與他們玩遊戲或感覺運動技能。
不管我們是否很快就能理解「智慧」,我們確實面臨著一個重大挑戰,那就是把電腦和人類結合在一起,以提高人類的生活。雖然這一挑戰被一些人認為是「人工智慧」的產物,但它也可以被看作是一種新的工程分支的創造,但也同樣值得尊敬。就像過去幾十年的土木工程和化學工程一樣,這一新學科的目標是將一些關鍵思想的力量集中起來,給人們帶來新的資源和能力,並做到安全。土木工程和化學工程是建立在物理和化學基礎之上的,而這一新的工程學科將建立在上一個世紀賦予的思想基礎之上——諸如「資訊」、「演算法」、「資料」、「不確定性」、「計算」、「推理」和「優化」。此外,由於新學科的許多重點都將來自於人類和人類的資料。
雖然構建塊已經開始出現,但是將這些塊放在一起的原則還沒有出現,因此這些塊現在以特別的方式組合在一起。
因此,就像人類在土木工程之前建造房屋和橋樑一樣,人類也在進行社會規模的建設,包括機器、人類和環境的推理和決策系統。就像早期的建築和橋樑有時會倒塌——以不可預見的方式和悲慘的後果——許多我們早期的社會規模的推理和決策系統已經暴露出嚴重的概念缺陷。
而且,不幸的是,我們不太善於預測下一個即將出現的嚴重缺陷是什麼。我們缺少的是一個工程學科的分析和設計原則。
目前關於這些議題的公開談話經常使用「人工智慧」作為知識萬用字元,這使得人們很難解釋新興技術的範圍和後果。讓我們開始更仔細地考慮「人工智慧」在最近和歷史上都被用來指代什麼。
在過去的幾十年裡,大多數被稱為「人工智慧」的東西,尤其是在公共領域,被稱為「機器學習」(ML)。ML 是一個演算法領域,它融合了統計學、電腦科學和其他許多學科 (見下文) 的思想,設計了處理資料、預測和幫助決策的演算法。在對現實世界的影響方面,ML 是真正的東西,而不僅僅是最近。事實上,在 90 年代初,這一過程就已經很明顯了,而在本世紀初,像亞馬遜這樣的高瞻遠矚的公司已經在他們的業務中使用了 ML,在欺詐檢測和供應鏈預測中解決了任務關鍵的後端問題,並建立了創新的消費者應對服務,比如建議系統。隨著資料集和計算資源在接下來的 20 年裡快速增長,很明顯,ML 很快就會給亞馬遜帶來強大的動力,而實際上,任何一家公司都可以將決策與大規模資料繫結在一起。新的商業模式將會出現。「資料科學」一詞開始被用來指代這一現象,反映了 ML 演算法專家與資料庫和分散式系統專家合作構建可伸縮、健壯的 ML 系統的需求,並反映了由此產生的系統的更大的社會和環境範圍。
在過去的幾年裡,這種觀念和技術趨勢的融合被重新命名為「人工智慧」。這種品牌重塑值得商榷。
從歷史上看,「人工智慧」這個詞是在 20 世紀 50 年代末被創造出來的,它指的是在軟體和硬體上實現的令人興奮的願望,即擁有人類水平智慧的實體。我們將使用「人類模仿人工智慧」一詞來指代這種渴望,強調認為人工智慧實體應該是我們中的一員,如果不是身體上至少是精神上的 (無論那意味著什麼)。這在很大程度上是一個學術企業。雖然相關的學術領域,如操作研究、統計、模式識別、資訊理論和控制理論已經存在,並且經常受到人類智力 (和動物智慧) 的啟發,這些領域可以說是專注於「低水平」的訊號和決策。比如說,一隻松鼠能夠感知它所居住的森林的三維結構,並在它的樹枝間跳躍,這對這些領域來說是鼓舞人心的。「人工智慧」的目的是關注一些不同的東西——人類的「高階」或「認知」能力,以「理性」和「思考」。然而,60 年後,高層次的推理和思考仍然難以捉摸。現在被稱為「人工智慧」的發展主要集中在與低層次模式識別和運動控制相關的工程領域,以及在統計學領域——這門學科專注於在資料中尋找模式,並做出有根據的預測、假設和決策的測試。
事實上,著名的「反向傳播」演算法在 20 世紀 80 年代早期被大衛·魯埃爾哈特重新發現,現在被認為是所謂的「人工智慧革命」的核心,它首先出現在 20 世紀 50 年代和 60 年代的控制理論領域。它的早期應用之一是在阿波羅飛船朝向月球的過程中優化推進器。
自 20 世紀 60 年代以來,已經取得了很大的進步,但可以說,它並不是源於對人類模仿人工智慧的追求。相反,就像阿波羅宇宙飛船一樣,這些想法常常被隱藏在幕後,而且一直是研究人員專注於特定工程挑戰的傑作。雖然沒有公諸於世,但研究和系統建造在文件檢索等領域,像是文字分類、欺詐檢測、推薦系統、個性化搜尋、社會網路分析、規劃、診斷和 A / B 測試取得重大成功,這些公司包括 Google、Netflix、Facebook 和 Amazon。
人們可以簡單地將所有這些稱為「人工智慧」,事實上,這似乎已經發生了。這樣的標籤可能會給優化或統計研究人員帶來驚喜,他們醒來後發現自己突然被稱為「人工智慧研究人員」。但是,先把研究人員的標籤放在一邊,更大的問題是,使用這個單一的、定義不明確的首字母縮略詞,會妨礙人們對智力和商業問題的廣泛理解。
在過去的二十年裡,在工業和學術界取得了重大進步,這是對人類模仿人工智慧的一種補充性渴望,而人工智慧通常被稱為「智慧增強」(IA)。在這裡,計算和資料被用來創造增加人類智力和創造力的服務。搜尋引擎可以被看作是 IA 的一個例子 (它增強了人類的記憶和事實知識),自然語言的翻譯 (它增強了人類交流的能力)。以計算為基礎的聲音和影象是藝術家的調色盤和創意增強器。雖然這種服務可能涉及高層次的推理和思考,但目前他們並不這麼做——他們主要從事各種型別的字串匹配和數字運算,這些操作捕獲了人類可以利用的模式。
希望讀者能容忍一個最後的首字母縮寫詞,讓我們大致設想一下「智慧基礎設施」(II) 的一門學科,即一種計算、資料和物理實體的網路,使人類的環境更加支援、有趣和安全。這樣的基礎設施開始出現在交通、醫藥、商業和金融等領域,對個人和社會有著巨大的影響。這有時出現在討論出現一個「物聯網」,但這一努力通常指的僅僅是問題的「東西」在網際網路上——而不是更壯觀的挑戰與這些「東西」相關能力的分析這些資料流對世界的發現事實,以及與人互動的過程和其他「東西」遠比僅僅是位更高層次的抽象。
例如,回到我的個人軼事,我們可以想象我們生活在一個「社會規模的醫療系統」中,它建立了資料流和資料分析流程,在醫生和裝置之間放置在人體周圍和周圍,從而能夠幫助人類智慧診斷和提供治療。該系統將從人體細胞、DNA、血液檢測、環境、人口遺傳學和大量的藥物和治療的科學文獻中吸收資訊。它不僅僅只關注一個病人和一個醫生,而是關注所有人類之間的關係——就像目前的醫學測試允許在一組人 (或動物) 身上做的實驗一樣,讓他們來照顧其他人類。它將有助於維持相關性、起源和可靠性的概念,而目前的銀行體系將重點放在金融和支付領域的這些挑戰上。而且,儘管人們可以預見到在這樣一個系統中出現的許多問題——涉及隱私問題、責任問題、安全問題等——這些問題應該被恰當地視為挑戰,而不是展示障礙。
我們現在遇到了一個關鍵問題: 研究經典的人類模仿人工智慧是最好還是唯一的方法來關注這些更大的挑戰?事實上,在最近的成功案例中,有一些是與人類模仿 AI 相關的領域,如計算機視覺、語音識別、遊戲和機器人技術。因此,或許我們應該等待這些領域的進一步進展。這裡有兩點需要說明。首先,雖然人們不會從閱讀報紙中瞭解到,人類模仿人工智慧的成功實際上是有限的——我們遠遠沒有實現人類模仿人工智慧的願望。不幸的是,在人類模仿人工智慧上取得有限進展的興奮 (和恐懼) 導致了過度活躍和媒體關注的水平,而這在其他工程領域並不存在。
其次,更重要的是,這些領域的成功既不充分也不需要解決重要的 IA 和 II 問題。在充分性方面,考慮自動駕駛汽車。要實現這樣的技術,需要解決一系列的工程問題,這些問題可能與人類能力 (或人類缺乏能力) 的關係不大。整體運輸系統 (II 系統) 可能更接近於當前的空中交通管制系統,而不是現有的鬆散耦合的、面向前方的、粗心大意的駕駛員。它將比目前的空中交通管制系統更加複雜,特別是使用大量資料和自適應統計模型來通知細粒度的決策。正是這些挑戰需要站在最前沿,而在這樣的努力中,關注人類模仿的人工智慧可能會讓人分心。
就需要論證而言,人們有時認為,模仿人類的 AI 包含 IA 和 II 的期望,因為模仿人類的 AI 系統不僅能夠解決 AI 的經典問題(如在圖靈測試中所體現的那樣),而且它也將是我們解決 IA 和 II 問題的最好選擇。這樣的爭論幾乎沒有什麼歷史先例。土木工程是通過設想一個人工木匠或磚匠的創造來發展的嗎?化學工程應該被設計成一個人造化學家嗎?更有爭議的是: 如果我們的目標是建立化工廠,我們是否應該先創造一個人工化學家,然後再研究如何建造化工廠?
一個相關的論點是,人類的智力是我們所知道的唯一的一種智力,我們應該把它當作第一步來模仿。但事實上人類並不是很擅長某些推理——我們有失誤、偏見和侷限。此外,關鍵的是,我們並沒有進化來執行現代 II 系統必須面對的那種大規模決策,也沒有去應對 II 環境中出現的那種不確定性。可能有人會說人工智慧系統不僅會模仿人類的智慧,而且還會「糾正」它,還會擴充套件到任意大的問題。但是,我們現在處於科幻小說的領域——這種推測性的論點,雖然在小說的背景下很有娛樂性,但不應該是我們在面臨嚴重的 IA 和 II 問題時的主要策略。我們需要根據它們自身的價值來解決 IA 和 II 的問題,而不是僅僅作為人類模仿 AI 議程的必然結果。
在人類模仿人工智慧研究中並非中心主題的 II 系統中,不難找到演算法和基礎設施方面的挑戰。II 系統需要能夠管理快速變化且可能在全球範圍內不連貫的分散式知識庫。這樣的系統必須在及時、分散式的決策過程中處理雲邊緣的互動作用,並且必須處理長尾現象,即在某些個人身上有大量的資料,而大多數人的資料很少。它們必須解決跨行政和競爭邊界共享資料的困難。最後,尤其重要的是,II 系統必須將經濟理念,例如激勵和定價,納入統計和計算基礎設施的領域,這些基礎設施將人類與彼此聯絡起來,並對貨物進行估價。這樣的系統可以被視為不僅僅是提供服務,而是創造市場。有一些領域,如音樂、文學和新聞,迫切需要這些市場的出現,資料分析將生產者和消費者聯絡起來。這必須在不斷演變的社會、倫理和法律規範的範圍內完成。
當然,經典的人類模仿人工智慧問題也很有趣。然而,當前的焦點做人工智慧研究通過收集的資料,「深度學習」的部署基礎設施和系統的示範模仿某些狹隘的人類技能——小的新興解釋性原則——傾向於轉移注意力從經典的人工智慧的主要開放問題。這些問題包括需要將意義和推理引入到執行自然語言處理的系統中,需要推斷和表示因果關係,需要開發可計算的不確定性表示,以及開發制定和追求長期目標的系統的需要。這些都是人類模仿人工智慧的經典目標,但在當前的「人工智慧革命」中,很容易忘記它們還沒有被解決。
IA 也將是非常重要的,因為在可預見的將來,計算機將無法與人類的能力相匹配,以抽象地解釋現實世界的情況。我們需要經過深思熟慮的人類和計算機的互動來解決我們最緊迫的問題。我們希望計算機能激發人類創造力的新水平,而不是取代人類的創造力 (無論這意味著什麼)。
這是約翰·麥卡錫 (John McCarthy),他是達特茅斯大學 (Dartmouth) 的一名教授,不久就開始攻讀學位。
他創造了「人工智慧」這個詞,顯然是為了區別來自諾伯特·維納 (當時是麻省理工學院的一位老教授) 的研究議程。維納創造了「控制論」來指代他自己的智慧系統願景——這一願景與運營研究、統計、模式識別、資訊理論和控制理論密切相關。另一方面,麥卡錫強調了與邏輯的聯絡。有趣的是,在麥卡錫的專業術語下,維納的思想議程在當前的時代中佔據了主導地位。然而,這種情況當然只是暫時的; 在人工智慧領域,鐘擺的擺動幅度更大。
在大多數領域。)
但我們需要超越麥卡錫和維納的特定歷史視角。
我們需要認識到,目前關於人工智慧的公開討論,聚焦於一個狹窄的行業子集和一個狹窄的學術領域,這可能會讓我們對整個 AI、IA 和 II 所呈現的挑戰和機遇視而不見。
我們應該討論的不是關於科幻小說中超級人類機器的噩夢,而是關於人類需要瞭解和塑造技術,因為它在他們的日常生活中變得越來越現實和有影響力。此外,在這種理解和塑造中,需要來自各行各業的各種不同的聲音,而不僅僅是技術上調諧的對話。狹隘地關注人類模仿的人工智慧,可以防止適當範圍的聲音被聽到。
儘管工業將繼續推動許多發展,學術界也將繼續發揮重要作用,不僅是提供一些最具創新性的技術想法,而且還將把來自計算和統計學科的研究人員與其他研究人員結合起來。
這些學科的貢獻和觀點是迫切需要的——尤其是社會科學、認知科學和人文學科。
另一方面,儘管人文科學和科學是我們前進的必要條件,但我們也不應該假裝我們在談論的是一種前所未有的規模和範圍的工程努力——社會的目標是建造新的藝術品。這些工件應該按照要求構建。我們不希望建立系統來幫助我們進行醫療、交通選擇和商業機會去發現這些系統並不真正起作用的事實——他們犯的錯誤在人類生活和幸福方面造成了損失。在這方面,正如我所強調的,對於以資料為重點和以學習為重點的領域來說,還有一門工程學科尚未出現。儘管後一領域似乎令人興奮,但它們還不能被視為一門工程學科。
此外,我們應該接受這樣一個事實:我們正在見證的是一個新的工程分支的誕生。「工程」一詞經常出現。
在狹隘的意義上——在學術界和其他地方——用的是冷酷無情的機械,以及人類失去控制的負面含義。但是工程學科可以是我們想要的。
在當今時代,我們有一個真正的機會去構想一些歷史上的新事物——以人為中心的工程學科。
我將拒絕給這個新興學科一個名字,但是如果這個縮寫「AI」繼續被用作佔位符的術語,那麼讓我們意識到這個佔位符的真正侷限性。讓我們擴大視野,降低宣傳力度,並認識到未來的嚴峻挑戰。
Michael I. Jordan