一個與Wojciech Zaremba的AI入門

iTunes的
 Google Play
縫合
 RSS

克雷格大砲[00:00] - 嘿，這是Craig Cannon，你正在聽Y Combinator的播客。今天的客人是Wojciech Zaremba，他是OpenAI的聯合創始人。 OpenAI是一家非牟利的AI研究公司。他們專注於發現和製定安全人造一般情報的途徑。這一集是AI的一個引言，因為我們有幾個人工智能訪談，而且它們往往比這個更具體。好的，我們走了。嘿，今天我們有Wojciech Zaremba，我們會談論AI。那麼，Wojciech，你能給我們一個快速的背景嗎？

Wojciech Zaremba [00:30] - 我是OpenAI的創始人，我正在從事機器人技術，我認為深度學習和人工智能是機器人技術的重要應用。在此之前，我在Google Brain工作了一年，並在Facebook AI Research工作了一年，同時畢業於...我在紐約大學完成了博士學位。

克雷格大砲[00:55] - 你能解釋一下你怎麼把它拉下來嗎？這似乎很少見

Wojciech Zaremba [00:58] - 所以，這兩個組織的偉大之處在於它們專注於研究，所以在我的博士期間，我實際上是在那裡發表論文。我強烈推薦這兩個組織，當然還有OpenAI。

克雷格大砲[01:15] - 是的，好的，所以大多數人可能不知道OpenAI是什麼，那麼你可以給出一個快速的解釋？

Wojciech Zaremba [01:21] - 所以，OpenAI著重於人性化建設AI，我們是一群研究人員和工程師，共同合作，基本上試圖弄清楚人造，一般人工智能的缺失是什麼，以及如何在最有利於整個人類的方式。 OpenAI得到Elon Musk和Sam Altman的大力支持，我們總共投資了10億美元。

克雷格大砲[02:04] - 這是相當多的那麼，是什麼意思，我知道一些，但是什麼是OpenAI項目？

Wojciech Zaremba [02:10] - 所以呢，還有幾個大型的項目同時進行。我們也有，我們也在做基礎研究，所以讓我先列舉大型項目。這些是機器人技術，所以在機器人技術方面，我們正在努力操縱，我們認為操縱是完整的，它是機器人技術中最無法解決的部分之一。

克雷格大砲[02:37] - 對不起，只是為了澄清，這是什麼意思？

Wojciech Zaremba [02:40] - 所以這就意味著在機器人中基本上有三個主要的任務。一個是運動，這意味著如何擺脫，讓我們說如何走，如何從A點移動到B點。其次是導航，它在復雜的環境中移動，例如平面或建築物，以及實際上，你必須弄清楚你以前訪問過哪些房間，哪個不是，哪裡去了。最後一個是操作，所以這意味著你想要抓住一個對象，就是說打開一個對象，把對象放在不同的位置。第三個是目前最困難的一個。所以，事實證明，當涉及任意對象時，當前的機器人不能僅僅掌握任意對象。對於任何對象，可以手工編碼一個解決方案，所以說，只要在工廠裡說，我們有同樣的對象，像我一樣，我不知道，我們正在生產眼鏡，而且存在手編解決方案，有一種方法，通過代碼來寫程序，說：“讓我們把手放在玻璃的中間，然後讓我們關閉它。”但是到目前為止，沒有辦法，寫一個程序，使它能夠掌握任意對象。

克雷格大砲[04:13] - 好的，有了你，然後，很快，其他的OpenAI項目呢？

Wojciech Zaremba [04:19] - 所以，另一個與玩複雜的電腦遊戲有關，第三個與玩大量的電腦遊戲有關，你可能會問為什麼有趣？在某種意義上，我希望看到，所以人類...有一個令人難以置信的技能，能夠非常快地學習，它與以前的經驗有關。所以說，即使你沒有打過排球，如果你是第一次嘗試，在10到15分鐘之內，你就能掌握如何實際，如何玩。它與以前從不同遊戲中獲得的經驗有關。如果你把一個孩子，等等，如果你把一個嬰兒放在排球場上，並要求他或她玩，這將會失敗慘敗。但是，我的意思是說，由於它有大量其他遊戲的經驗，或者讓我們說其他生活的情況，它能夠實際轉移所有的知識。所以，在OpenAI，我們可以把大量的電腦遊戲和電腦遊戲結合起來，很容易量化你在電腦遊戲中的表現。目前最好的AI系統，所以，首先，許多電腦遊戲可能會編寫一個很好的解決方案，或者播放得很好的程序。還有結果來自於強化學習的結果，或者在所謂的深度強化學習方面，表明可以學習如何玩電腦遊戲，這些都是類似的，初步的結果來自DeepMind。但同時，同時，要實時執行需要很長時間才能學習玩電腦遊戲。所以，例如，Atari遊戲，例如，在實時執行方面，需要大約三年的時間來學習玩簡單的遊戲。我的意思是說，它可能會非常麻痺，所以在現在的電腦上訓練它需要幾天的時間，但對於人來說，這樣做的時間要短一些。在10分鐘內，

克雷格大砲[07:12] - 教會如何玩和贏？

Wojciech Zaremba [07:13] - 是。

克雷格大砲[07:13] - 好的。那是通過你，給它反饋嗎？

Wojciech Zaremba [07:17] - 所以在電腦遊戲的情況下它的運作方式，反饋來自於分數，所以它會看看遊戲中的得分，並嘗試優化它。而且，我會說這是合理的，但我會同時說，這對我來說並不那麼令人滿意。那麼，為什麼對我來說並不那麼令人滿意，所以，這種基礎強化學習的假設是，那就是有一些環境和環境，你是一個代理人，你是通過執行行動和獲得獎勵而在環境中行事的環境。而獎勵可能被認為是讓我們說，快樂，等等。而主要的問題是，找出現實世界中的獎勵是不容易的。此外，其他潛在的假設是能夠重置環境，以達到重複相同的情況，因此系統可以嘗試數千或數百萬次來實際完成遊戲。所以有一些小的差異。人們還認為，以某種方式將硬編碼成系統獎勵可能是有可能的，但我會說，這實際上是一個很大的問題，那是一個未解決的問題。像我的侄子玩電腦遊戲的時候，他實際上並沒有看得過分，因為他看不懂。

克雷格大砲[08:46] - 哇，好的

Wojciech Zaremba [08:46] - 是的，他們可以打得很好。所以，我的意思是說，可能是獎勵有點不一樣，可能是獎勵來自於喜歡看到一個很好的，在遊戲中聽到一個很好的聲音，但是我會說這是一個什麼是非常不清楚如何建立一個系統，什麼系統應該優化，所以在某種意義上說，如果我們有一個要優化的指標，可以建立一個可以優化的系統，但事實證明，在許多情況下，不是那麼容易我會說，這實際上是為什麼我想要機器人工作的動機之一，因為在機器人的情況下，它更接近我們關心的系統。所以，我的意思是說，比方說，你想讓你的機器人為你準備炒雞蛋，所以問題是，我應該如何建立獎勵？而在電腦遊戲中，實際上，你會看到的很好的東西是非常頻繁地得到獎勵，所以，讓我們說，任何時候你殺死敵人，或者說，不會死，這是非常好的，但是如果炒蛋，它這意味著人們如何寫系統的獎勵，這意味著從手到平底鍋的距離。然後，我們要說，不管怎樣，我們必須量化蛋如果你能夠打開一個雞蛋，或者說，如果你把它充分炒好，那麼如何量化就變得非常困難了沒有辦法重置系統，如何將系統重置到同一個地方？所以，這些都是一個根本的問題，而且他們是為什麼我對機器人的個人興趣，實際上這些挑戰會告訴我們如何解決這個問題。

克雷格大砲[10:49] - 所以，我們首先定義一些事情。那麼，什麼是人工智能，什麼是機器學習，那麼什麼是深度學習？

Wojciech Zaremba [10:57] - 好的，這些都是不錯的問題。

克雷格大砲[11:00] - 好的。

Wojciech Zaremba [11:02] - 因此，人工智能實際上是非常廣泛的，它是非常廣泛的領域，機器學習是這個領域的一部分，在某種意義上，人工智能包括任何寫作，任何試圖通過一些智慧解決一些問題的軟件。它可能是手工編碼的解決方案，基於規則的系統，是的，所以，實際上很難說什麼是人造智能。你可以這麼說，所以，初始版本，例如穀歌搜索，是基於，它是避免任何機器學習，它是...有一個明確定義的算法，稱為PageRank，基本上PageRank計數了多少來鏈接來自其他網站，這就是人工智能。它本質上是為您做智能的系統。然後，Google搜索開始使用機器學習，因為它有助於提高結果，但同時他們希望避免一段時間，因為更難解釋結果，而且更難實際了解系統的功能。那麼什麼是機器學習？機器學習，本質上是一種構建方式，或者讓我們說，基本上，你有數據，而您希望通過一些行為來生成基於數據的程序。所以，最常見的例子是機器學習的分支，所謂的“監督學習”，所以你有一對例子，X逗號Y，這意味著“我想把X映射到例如，即使電子郵件是垃圾郵件也不是垃圾郵件，或者說，甚至是圖像，什麼是圖像的類別，或者例如，我應該向誰推薦給定的產品？並且，根據這些數據，你想生成程序，某種類似的，一個黑框或一些功能，對於新的例子，可以給你一個奇怪的答案。這是監督學習的一個例子。但是，這個意義上，機器學習意味著你想從數據生成程序。

克雷格大砲[13:59] - 好的。

Wojciech Zaremba [14:00] - 這通常是一種統計機器學習方法，所以不管怎樣，你計算偶數事件多少次，發生事件發生等等。

克雷格大砲[14:11] - 好的，有了你，然後第三個深入學習。

Wojciech Zaremba [14:14] - 所以，深入學習，這也是機器學習的一個範例，背後的想法是荒謬的簡單。

克雷格大砲[14:32] - 好的。

Wojciech Zaremba [14:34] - 所以，人們意識到，如我所說，如果你想，機器學習意味著你獲取數據作為輸入，並將程序作為輸出，深入的學習說，計算的程序，那麼我實際上在做什麼這個數據應該涉及很多步驟。不是一步，而是很多。

克雷格大砲[15:03] - 好的。

Wojciech Zaremba [15:05] - 而且，就這一點而言，在深度學習的意義上。所以，你可能會問，為什麼現在這麼受歡迎，以及它與以前有什麼不同？所以如果你假設你做一個計算步驟，我們假設你收集你的數據，你有一個if語句，或者是少量的if語句，那麼就像例如說，如果你有不，我們假設你的數據是股票市場上的一個錄音，而你說的是，你會根據大於或者小於某事的價值出售或購買，或者說，根據誰是新總統，或許你正在作出一些決定。因此，從某種意義上說，在模型基於單步的情況下，人們能夠在數學上證明大量的東西，而在需要多個計算步驟的模型方面，數學證明非常弱。長期以來，具有單步計算的模型，它們是執行許多計算步驟的性能不佳的模型。但是最近呢這種改變了，對很多人而言，很長一段時間才明白，真正的智慧不能一步到位，但這需要很多的步驟。但是，到目前為止，很多系統實際上是以他們的方式工作的，非常淺，非常淺，但同時卻非常巨大。那是什麼意思呢可以讓我們說出感興趣的任務，讓我們說推薦，你可以產生大量的功能。我們來談幾千。這些功能就是說，比如說我們想做電影推薦，你可以說，“電影是長於還是短於兩個小時？是比一個小時還是短一個小時？“那就是兩個功能。你可以說，“這是戲劇，它是驚悚片，還有別的嗎？”你可以產生這些數量，然後，或者讓我們說100,000，這實際上是一個合理的價值，然後你的淺分類器可以基本確定在這些功能的組合上，要么向你推薦它，要么不推薦它。

克雷格大砲[17:41] - 好的。

Wojciech Zaremba [17:43] - 在深入學習的情況下，您可以說：“讓我們把它結合起來進行多個步驟”。這實際上是完全不一樣的，在深入學習的情況下，深入學習的最成功實例就是神經網絡。

克雷格大砲[18:07] - 好的，我們來定義一下。

Wojciech Zaremba [18:09] - 所以神經網絡也是非常簡單的概念。這是很久以前人們想出來的，這意味著，這就是...它有...你有一個輸入，這可能是說，矢量，或者它可能有一些額外的結構，比如，讓我們說圖像，所以它是好的矩陣，二維和...神經網絡，它是一系列層，層由矩陣表示，您所做的是將您的輸入乘以矩陣，並應用一些非線性運算，並再次乘以通過一個矩陣，並應用非線性運算，你可能會問：“為什麼我甚至需要應用這個非線性運算？”事實證明，如果你可以乘以兩個矩陣，它可以減少乘以單個矩陣。像兩個線性運算符的組合可以寫成單線性運算符。您可以將這些矩陣相乘在一起，結果可以將其壓縮成單矩陣。而且，非線性是類似的，它們是古典的非線性，但是，就我所說的而言，它們是非常多的變體，但是我剛剛描述的就是所謂的工作神經網絡，所以它本質上是採取輸入，乘以一個矩陣，非線性乘以矩陣，非線性的例子是，有一些稱為，一個是古典的，稱為Sigmoid，所以sigmoid是一個具有“S”字符形狀的“S”字母的函數，它接近於零。對於負值，它增長到零的一半，然後在值越大時變為1，調製輸入的種類，這是激活函數的最經典版本。事實證明，一個更簡單的經驗工作方式更好，這被稱為ReLU，整改線性單位，而這一個，這是荒謬的簡單。 ReLU最大為0，x。所以，當你的負數值為零時，你有正值，只需複制該值就可以了。所以，你可能會問。首先，深入學習的成功是什麼，為什麼我們實際上相信它有效，為什麼，什麼變化，以及為什麼與之前有很大的不同，還有一些差異。

克雷格大砲[21:27] - 是啊。

Wojciech Zaremba [21:29] - 這是一個很好的問題-

克雷格大砲[21:30] - 不，這正是我要去的地方，但是我事先要問，為什麼神經網絡現在是一件事情，而不是過去呢？

Wojciech Zaremba [21:41] - 主要的區別是突然間我們可以訓練他們來解決各種各樣的問題，讓我們說一系列的問題，這就是監督學習中的問題，所以比任何其他的方法都更好，可以將這些例子映射到標籤上，然後在保留測試數據的數據，他們勝過其他任何事情，在許多情況下，他們獲得超人的結果。

克雷格大砲[22:06] - 這只是我們可以訪問的計算能力的一個功能嗎？

Wojciech Zaremba [22:10] - 當涉及到模型，而神經網絡是模型的一個例子，總是有這個問題。那麼，如何找出一個模型的參數。所以有一些訓練程序，而神經網絡最常見的過程就是所謂的隨機梯度下降，程序也很簡單，事實證明，它在經驗上是非常有效的。所以，人們出來了大量的學習算法，隨機梯度下降是一種學習算法的一個例子，還有其他的。假設有一些叫做Hebbian學習的東西是受到人類大腦神經元學習的動機。但是，到目前為止，這一點在經驗上是最好的。

克雷格大砲[23:00] - 好的，那麼讓我們去看看你自己問的問題，那就是“為什麼現在呢？”現在呢，讓人們關心現在呢？

Wojciech Zaremba [23:12] - 所以，20年前，人們如何訓練神經網絡有幾個小小的差異。而且計算能力大大增加。所以，我可以談論重大進展。所以，我會說，這是一個先進的事情，這是一個超前，其實是一個老的，但它似乎是非常關鍵的，這就是所謂的捲積神經網絡。

克雷格大砲[23:47] - 好的，這是什麼意思？

Wojciech Zaremba [23:52] - 這實際上是一個非常簡單的概念。所以，讓我們說你的輸入是一個圖像，我們假設你的圖像大小是200 x 200，也就是說三種顏色，所以總共的數值實際上是12萬，所以如果你願意的話實際上將它壓縮成一個矢量，這個矢量將是這個大小，可以，你可以想，如果你願意，讓我們說應用神經網絡，基本上乘以一個矩陣，讓我們說，如果你會喜歡有類似大小的乘法的輸出，我們說120,000，那麼突然之間，矩陣，乘以它，將是一個巨大的大小。而學習，學習包括神經網絡估計參數。事實證明，從經驗上說，這根本不起作用，如果你使用反向傳播的算法，你會得到相當差的結果。人們意識到，在圖像的情況下，您可能需要乘以一點點特殊的矩陣，也允許做更快的計算。因此，您可以將神經網絡視為對輸入應用一些計算，因此神經網絡對輸入應用一些計算，您可能希望在某種意義上約束該計算，因此您可能會想到，因為您將有幾個層也許最初你想做很本地的計算，而且在每一個地方應該是非常相似的。所以，你想在中心應用相同的計算方法，也許在後面你需要一些多樣化，但是你想以相同的方式對圖像進行預處理。所以這個想法是，當你拍攝一張圖像，或者任何一個實際上是二維的結構時，那麼另一個例子就是你可以聽到聲音，並且可以通過應用傅里葉變換來將聲音變成圖像，所有的，就像a-

克雷格大砲[26:26] - 那麼，很像波形呢？

Wojciech Zaremba [26:28] - 是的，所以你採取一個波形，你應用傅里葉變換，本質上，在X軸你有時間，因為演講下降，在Y軸上你有不同的頻率，這是一個圖像，和言語 - 識別系統，它們也可以處理聲音，因為它將是一個形象。

克雷格大砲[26:55] - 我沒有意識到，這真的很酷。好的。

Wojciech Zaremba [26:58] - 這就是為什麼我在說，技術...而且，作為一種側軌，關於神經網絡的很酷的事情是，以往是專門處理文本，圖像，聲音的人？而且，這幾天，這是同一群人。

克雷格大砲[27:21] - 嗯，真的很棒。

Wojciech Zaremba [27:23] - 他們使用相同的方法。所以，回到什麼是卷積神經網絡，正如我所提到的，你想在整個放置圖像上應用相同的計算，本質上卷積神經網絡說，當我們拍攝圖像時，讓我們連接神經元與本地值圖像，讓我們一遍又一遍地複制相同的波形。所以，這樣你會倍增，種種。在中心，角落中乘以矩陣中相同的值。因此，卷積的輸入是一個圖像，輸出也是一種圖像，你可以認為，還有一些具體的詞彙，所以在這種三維圖像中，你有高度，你有還有深度，所以讓我們說，如果圖像是三維的，然後你應用卷積，你可以改變深度尺寸的數量，通常人們去，讓我們說，我不知道，100維等等。

克雷格大砲[28:48] - 好的，給你

Wojciech Zaremba [28:49] - 然後你有幾個這些層，然後有所謂的“完全連接的層”，這只是傳統的矩陣。所以，我會說，這是一個進步，實際上發生在20年前，已經。另外一個可能聽起來很有趣，但很長一段時間以來，人們不相信可以訓練深層神經網絡，而且他們正在考慮什麼是正確的學習算法，而且原來，所以，我們來說，當你訓練一個神經網絡時，你可以通過將權重初始化為一些隨機值來開始，事實證明，小心你初始化的大小是非常重要的。而且，如果你把它設置為正確的值，我甚至可以給你一些，就說直覺是什麼意思，結果是，最簡單的算法，這被稱為隨機梯度下降，實際上是很好的。

克雷格大砲[30:00] - 好的。

Wojciech Zaremba [30:01] - 所以，在某種意義上說，就像我所說的，我們說，神經網絡的層次，它們是多重的，它們乘以矩陣的輸入和你想要保留的屬性，你不希望值的大小來吹你也不希望它縮小。而且如果你是多重的，如果你選擇隨機的初始化，那麼很容易選擇一些初始化，你會知道，這個大小會不斷增加，然後如果你有10層，那就說他們，你乘二兩兩兩兩？

克雷格大砲[30:42] - 是啊。

Wojciech Zaremba [30:43] - 那麼突然之間的產出是完全不同的，學習不再發生了。如果你只是選擇它們，這是一個選擇像初始權重大小的變體的問題，如果你設置它，可以說，輸出與輸入的大小相同，那麼一切正常。

克雷格大砲[31:05] - 所以，基本上只是調整這些數值，證明你可以用神經網絡來做到這一點？

Wojciech Zaremba [31:10] - 是。

克雷格大砲[31:11] - 哦，哇，好的

Wojciech Zaremba [31:12] - 這太可笑了，讓我們說，人們長期以來沒有意識到這一點，但這是什麼。

克雷格大砲[31:17] - 什麼時候，何時何地發生這種情況？

Wojciech Zaremba [31:20] - 實際上發生在多倫多大學。

克雷格大砲[31:23] - 哦好的。

Wojciech Zaremba [31:24] - 所以在杰弗裡·亨頓實驗室。所以瘋狂的是，人們在如何訓練深層神經網絡方面有幾個方案，一個叫做生成性預訓練。所以讓我們說有一些方案的工作要做，為了達到神經網絡的這種狀態，突然間你可以使用這個算法叫隨機梯度下降，所以有一個完整的涉及程序，在有一點，杰弗裡問他的學生，你知道，將它與最簡單的解決方案進行比較，這將是調整大小，並且顯示出有多大的差異。

克雷格大砲[32:14] - 太瘋狂了，男人。哦，我的上帝啊，好的。有一個更廣泛的問題就是這樣，那麼過去發生的事情呢，說五年來激動人們呢？

Wojciech Zaremba [32:27] - 所以，我會說最令人驚嘆的是所謂的ImageNet結果。那麼首先我應該告訴你，五年前電腦視野在哪裡？然後我會告訴你什麼是ImageNet，然後我會告訴你關於結果。因此，計算機視覺是一個領域，本質上，您嘗試使圖像有意義，像計算機試圖解釋圖像上的內容。而且說得很簡單，“哦，在圖像上有一隻母牛，一匹馬，”但對於一台電腦來說，圖像只是數字的集合。所以，它是一個龐大的數字矩陣，很難說，哦，如何解釋什麼是內容是非常困難的。而且，人們出現了各種各樣的方案，你知道，你可以想像，我不知道，讓我們量化一下棕色的顏色，這樣你可以說是一個馬。像一個簡單的東西人們當然出來了更聰明的解決方案，但係統相當糟糕。我的意思是，你可以給系統餵一張天空的照片，這是告訴你有一輛車。

克雷格大砲[34:00] - 所以，不是那麼好

Wojciech Zaremba [34:01] - 是的，是的。費飛李，費飛李是斯坦福大學的教授。她和她的學生一起收集了大量的圖像數據，數據集稱為ImageNet，它由1,000個類別中的一百萬張圖像組成，實際上是最大的圖像數據集。

克雷格大砲[34:33] - 而一個課堂，只是為了澄清，像“汽車”可能是一個課嗎？

Wojciech Zaremba [34:37] - 是的，所以，有...數據集，我會說，不完美，它有例如它不包含人，這是在那裡的約束之一。它含有大量的狗品種。所以這是一個奇怪的事情，但與此同時，我的意思是，這本質上是深入學習的數據集。

克雷格大砲[35:05] - 狗的種類

Wojciech Zaremba [35:07] - 不，事實如此之大。那麼，發生了什麼事情呢，真的有很多團隊參與了ImageNet的比賽。讓我們說，即使我在說，在那裡有一千個課，所以如果你有一個猜測，一個隨機的猜測，那麼你的猜測是正確的概率基本上是0.1％。這個度量有些不同，你實際上，如果你做了五個猜測，如果其中一個是正確的，那麼你是好的，因為可能還有一些其他的對象，等等。我記得，當我看到有人製作了這個系統的時候，有人創建了那個有50％錯誤的系統，我印象深刻，好的，我就像“哦，男人”，就像1000個班它可以說有50％的錯誤是什麼，我感到非常深刻的印象。但是，在競爭中，就像所有的隊伍都有25％左右的錯誤率，差距在1％左右，比如阿姆斯特丹大學的一個團隊，日本隊，像很多人一樣在世界各地，以及由杰弗裡·亨頓（Geoffrey Hinton）領銜的多倫多大學的團隊，自己的團隊是亞歷克斯·克里傑夫斯基（Alex Krizhevsky）和伊利亞·斯克斯克（Ilya Sutskever），他們實際上已經達到了15％。所以，讓我們說，所有其他的球隊，他們都是25％，差距是1％，而這兩個人，他們達到了15％，好嗎？而且，瘋狂的事情是，我們...所以我們已經在這個數據集上三年了，錯誤大幅下降，我記得像明年這樣的錯誤就像11％，8％，我是那樣，你記住，當時我在想，“有什麼限制？你好嗎？“而且我在想5％，那是最好的。即使他們有力量看到他們能獲得多遠，他們花費了大量的時間，讓我們來看看其他的圖像和比較，以便能夠弄清楚是什麼，我的意思是說，這不是對人而言簡單例如，如果你有很多品種的狗，而且，就像誰知道。但是讓我們說，如果你可以使用一些外部的圖像來比較一下，那就有所幫助。但從某種意義上說，在幾年之內，人們就下了3％的錯誤，這實際上是超人的表現。而且，正如我所說，以前的計算機視覺系統需要拍攝天空，他們告訴你這是一輛汽車。突然間，你正在超人的表現，事實證明，這些結果不僅僅局限於計算機視覺，人們可以獲得驚人的其他系統，讓我們說，語音識別，

克雷格大砲[38:38] - 因為這是根本的問題，對吧？因為，不是，我的意思是，對於不在現場的人，像我一樣，計算機視覺，計算機圖像識別，將種植人工智能並不一定是直觀的。那麼我的意思是後來呢？

Wojciech Zaremba [38:55] - 所以，從某種意義上說，瘋狂的是，同樣的架構可以用於各種任務，突然之間，似乎無關緊要的領域，他們開始受益於彼此。所以，同時，語言識別中的問題可以非常相似的方式解決，你可以基本上講話，應用傅里葉變換，然後語音開始看起來像一個圖像。而且你應用類似的對象識別網絡來識別那裡的聲音，像一個音素，所以音素就像是一種聲音，所以你可以把它變成文本。

克雷格大砲[39:52] - 所以這是正確的，所以它去了圖像後的演講，然後，是的。

Wojciech Zaremba [39:56] - 而下一件大事本質上是一個翻譯。翻譯對於人來說非常令人驚訝，這是Ilya Sutskever的結果。所以，翻譯是另一個實際上由它自己跳過的領域的例子。關於翻譯的一個瘋狂的事情是，輸入是長度可變的，輸出的長度是可變的，甚至不清楚如何用神經網絡消費它，如何產生可變長度輸入，可變長度輸出。 Ilya出來了一個想法。有一種叫做循環神經網絡的東西，所以，意思就是說復現神經網絡和卷積神經網絡，他們分享一個想法，這就是...你可能想要使用相同的參數，如果你做類似的東西，而在卷積的情況下網絡，這意味著讓我們在空間中分享相同的參數，所以讓我們在角落中應用與圖像中間相同的變換，等等，在復現神經網絡的情況下，他們評估...將讀取文本左到右。我可以消費第一個字，可以創建一些隱藏的狀態表示，然後，下一步，當我消耗下一個單詞時，我可以把它與這個隱藏的表示，通用的下一個隱藏的表示，你正在應用相同功能再次，這個功能消耗隱藏的表示和下一個字，隱藏的表示和單詞，隱藏的表示和單詞。所以這比較簡單，很酷的是，如果你這樣做，不管輸入的長度，你有一樣的網絡大小。而且，他的模式如何工作，這就是描述一種名為“序列到序列”的文章。序列本質上是消耗逐字，一個你想要翻譯的句子，然後當你要生成翻譯時，你基本上開始逐字排出，最後，當你遇到一個點時，那就結束了。

克雷格大砲[42:34] - 這太酷了。

Wojciech Zaremba [42:35] - 這對人們來說是非常令人驚訝的，當時他們得到了體面的表現，他們無法打敗一個基於短語的系統，現在它的表現還不錯。喜歡，很久以前已經。還有，是的。另一個問題是人們所擁有的，所以如果神經網絡系統像翻譯一樣，大規模部署它的問題就是計算量很大，而且在深入的學習文獻中，有各種各樣的想法做事情的方式，訓練後計算方式便宜，所以有可能丟棄大量的權重，或者，基本上把32位浮標變成更小的數字，等等。而且，很大程度上，這就是為什麼東西在很大程度上部署在生產系統中的原因，但基於神經網絡的解決方案實際上是出乎意料的。

克雷格大砲[43:49] - 還有幾件我想要定義的東西，一般的聽眾？所以，有幾個字被扔在很多，所以，狹窄的AI，一般AI，然後超級智能。你能打破分歧嗎？

Wojciech Zaremba [44:04] - 當然。所以，我們所有的AI幾乎都是狹窄的AI。沒有人建成，到目前為止，一般AI。沒有人建立超級智能。所以，狹義的AI意味著人工智能，所以就像一塊解決單一預定義問題的軟件。通用AI意味著它是一個軟件，可以解決巨大的，大量的問題，所有的問題。所以你可以說人類是一般的，它是一般的智能，因為你可以給任意問題，人類可以解決它，但是，例如，開瓶器，只能解決瓶子開啟。

克雷格大砲[44:52] - 對。

Wojciech Zaremba [44:53] - 所以，很多時候，當我們看到任何軟件，我們的軟件，它很好地解決單一問題的任何工具。例如，我們的象棋遊戲程序不能開車。而且，對於任何問題，我們必須創建一個單獨的軟件，一般的人工智能是一個可以解決任意問題的軟件。那麼，我們怎麼知道它甚至是可行的？因為我們有一個具有這樣一個屬性的生物的例子。

克雷格大砲[45:40] - 那麼，超級智慧就是，我假設下一步是嗎？

Wojciech Zaremba [45:45] - 基本的超級智能意味著它比人類更聰明，是的。

克雷格大砲[45:54] - 涼。所以考慮到這一點，考慮到這一點，我們基本上處於一個狹窄的AI的狀態，在這一點上，你覺得是什麼樣的，這個東西的現狀是什麼？在未來五年左右，你會看到哪裡？

Wojciech Zaremba [46:11] - 所以，正如我所說的那樣，機器學習本質上是有各種各樣的範式，所以其中一個是監督學習，有一些叫無監督的學習，還有一些叫強化學習的東西，到目前為止，監督的學習範式是唯一一個非常有效的工作，它可以應用於商業應用程序。所有其他人不是真的在那裡。所以你問我我們在哪裡，所以我們可以解決這個問題，其他問題，他們需要進一步的工作，很難計劃，想法，使它們工作需要多長時間。與當代人工智能非常不同的是我們正在使用完全相同的技術。同時，大多數業務問題都可以被視為監督學習，因此只要我們有足夠數量的輸入示例，以及我們想要預測的內容，就可以用現有的技術來解決，正如我所說，第一個可以非常豐富，就像輸出可能是一個句子一樣，而現在的系統也很好地運行，但是它需要專家來訓練它。

克雷格大砲[47:58] - 那麼，那麼我們看到相當可觀的炒作，你怎麼看呢？

Wojciech Zaremba [48:06] - 這個領域同時被低估和過度誇張，所以。從業務應用的角度來看，只要有一對示例，表示映射的對，就像輸入的是什麼，輸出是什麼？我們可以經常得到超人的表現，但在所有其他領域，我們仍然不在，而且還不清楚需要多長時間。所以，我們來舉一些例子，就像推薦系統一樣，你經常有像亞馬遜這樣的公司，他們有數百萬用戶的例子，他們知道他們買的是什麼，當他們高興的時候，這就是一個例子一個非常適合神經網絡的任務，學習向新用戶推薦的內容。同時，Google知道您是什麼好的搜索查詢，因為在“搜索結果”頁面上，您點擊您感興趣的鏈接，因此應首先顯示。而在其他領域，實際上往往更加困難。如果說，蘋果採摘機器人，很難提供有監督的數據，告訴我們如何將手臂向蘋果移動，這樣就更複雜了。同時，檢測蘋果在哪裡的問題，它在哪裡更好地定義，並且可以外包給人來註釋大量的圖像，並給蘋果本地化，而且很多時候，這個問題的其餘部分可以由工程師編寫，但是如何將手指放在蘋果上，或如何抓住它的問題，這是不是很好科學地解決了。

克雷格大砲[50:22] - 那麼現在我有幾個問題呢。如果人們有興趣更多地學習AI，也許在OpenAI工作或做某事，你會如何推薦他們參與和教育自己？

Wojciech Zaremba [50:40] - 所以說，開始的好地方是Coursera，Coursera很不錯。還有很多TensorFlow教程，TensorFlow是一個訓練神經網絡的框架的例子。此外，Andrej Karpathy在斯坦福大學的課程非常方便，您可以在YouTube上找到它。

克雷格大砲[51:10] - 是的，然後在實際練習？

Wojciech Zaremba [51:16] - 在TensorFlow教程的許多問題的情況下，所以，我相信安德烈的課程，可能會有功課，而在TensorFlow練習的情況下，經常會容易的提出一些隨機的想法，讓我們說你比如說，你可以選擇一個簡單的任務，讓我們分類數字，然後分類數字圖片，讓我們分配他們的課程，你可以嘗試下載一些圖片其他來源，像一個Flickr，讓我們嘗試對它進行分類或標記。

克雷格大砲[52:05] - 好的，因為你們正在努力，機器人在這一點上，其他的事情就是自動化，特別是很多這些低級的藍領工作。對未來，也許在未來10年，你對這些工作有什麼看法？

Wojciech Zaremba [52:29] - 所以我相信我們必須向人們提供基本的收入。我非常強烈地認為，這其實是唯一的辦法。所以，我不認為40歲的士司機可能會每十年改造一次。我認為這可能是非常困難的。另一個瘋狂的事情是...人們通過工作來定義自己，這可能是另一個大的社會問題。同時，他們甚至不喜歡他們的工作，比如說，如果你問一個人，“你想讓你的孩子在超級市場上賣，在超級市場上做賣家嗎？”他們會回答“不，”也許這是可能的生活在世界上，資源豐富，人們只能享受生活。

克雷格大砲[53:45] - 我想我們必須找出一個方法。也許人們總是會找到目的，但我覺得，如果自動化實際上發生在人們談論的程度上，這樣會更容易找到目的，將來會更加重要。那就像對你的影響呢？這可能激發了你在機器人和AI工作，有沒有你真正喜歡的書籍或電影或媒體？

Wojciech Zaremba [54:13] - 有一本非常好的書叫“Homo Deus”。它實際上描述了人類的歷史，然後說出來，對未來或我們前進的方向有各種預測。這是一個很好的我的意思是沒有列表，有很多有關AI的電影，怎麼會出錯。

克雷格大砲[54:47] - 什麼是最好的？

Wojciech Zaremba [54:48] - 我覺得她很好

克雷格大砲[54:50] - 好的。

Wojciech Zaremba [54:51] - 是的，前Machina也不錯。

克雷格大砲[54:54] - 很好，你有什麼其他的最後一件事嗎？

Wojciech Zaremba [54:59] - 不，謝謝。

克雷格大砲[55:01] - 好的，很酷，謝謝，男人。好的，謝謝你的聽。請記住訂閱該節目，並在iTunes上查看。做完之後，你可以永遠跳過這一節。如果您想了解有關YC的更多信息，或者閱讀演示筆記，可以查看blog.ycombinator.com。下週見。