深度學習的狀態：從開發人員和 VC 的角度

已發表: 2017-09-05

Nikhil Kapur 討論深度學習的狀態，首先是作為一名學生開發人員，現在是一名 VC

一個星期六，我在 Unilever Foundry 和 Padang.co 巨大的 Level 3 辦公室參加了深度學習和 TensorFlow 研討會。再次沉浸在開發世界中是有趣的一天，我很享受與同桌的所有對話，其中一個經營著一家家族企業並將學習 ML/深度學習作為一種愛好（他是一個編程愛好者），另一個來自Zalora 的營銷部門希望在她的工作中應用一些人工智能。

我們開始在我們的機器上設置 TensorFlow 和 Keras（TensorFlow 的抽象），然後開始修補一些常見的深度學習問題和示例，例如使用 MNIST 數據集。從一個簡單的文本識別小 NLP 模型開始，我們深入研究了卷積神經網絡，結果證明它非常有趣。

我們使用的是現成的預訓練模型，例如 Inception V3，但正在使用我們自己的數據集並重新訓練模型以解決不同的問題，例如“這是貓還是狗？” 該課程的目標是了解深度學習的基礎知識並嘗試參數和特徵。如果您現在感到嫉妒，那麼我建議您去 Playground.tensorflow.org 玩，這是工作坊中最容易獲得的部分！

非常感謝 Sam Witteveen 和 Martin Andrews 組織了這次活動。我在這裡講述了我得出的一些觀點，以及我認為深度學習和人工智能的總體方向，尤其是從 VC 的角度來看。

從開發人員的角度進行深度學習

為了提供一些背景知識，我對“人工智能”有相當多的了解。大學二年級時，我在德勤的技術諮詢部門實習。我和我的朋友 Ujjwal Dasgupta 一起，他後來最終獲得了 ML 碩士學位，現在在谷歌工作，我花了幾個月的時間在 IBM Datastage（一個數據倉庫軟件）上製作了一個改進的 ETL（Extract-Transform-Load）流程。當時，總是比我更有遠見的 Ujjwal 向我介紹了數據挖掘，我開始關注 Andrew Ng 的講座和在線課程。

明年夏天，我在這個主題上花費的時間很感興趣，我想更深入地研究 ML。我很幸運被分配到 Mozilla 的一個項目，使用基於機器學習的編譯器 — Milespot GCC 來提高 Firefox 的性能。使用這個 ML 編譯器，我能夠編譯 Mozilla Firefox 的代碼，從而將程序加載時間縮短約 10%。

然後在我的期末論文中，我無法放棄 ML。我與德國人工智能研究所 DFKI 合作開展了一個極具挑戰性的項目，使用一個簡單的網絡攝像頭進行眼動追踪。 DFKI 的團隊將其用於特定應用程序 Text 2.0。 他們使用特殊的高清攝像頭來跟踪您的眼睛，並相應地通過自動滾動、自動翻譯、彈出詞典等超酷功能來增強文本。

我們決定用一個簡單的網絡攝像頭做同樣的事情，因為印度沒有人有錢購買那個特殊的高清攝像頭。準確地說，我們在這方面失敗了，在我們的跟踪中只達到了大約 70% 的準確率。但這是我參與過的最激動人心的項目之一。

為你推薦：

資源

元界將如何改變印度汽車業

資源

反暴利條款對印度初創企業意味著什麼？

資源

教育科技初創公司如何幫助印度的勞動力提高技能並為未來做好準備……

消息

本週新時代科技股：Zomato 的麻煩仍在繼續，EaseMyTrip 發布強...

特徵

印度初創公司走捷徑尋求資金

據報導，數字營銷初創公司 Logicserve Digital 從替代資產管理公司 Florintree Advisors 籌集了 80 盧比的資金。

消息

數字營銷平台 Logicserve 獲得 80 盧比的資金，更名為 LS Dig...

那麼，為什麼我要讓你厭煩這些細節呢？主要是為了讓你了解一下我在研究工程時人工智能所處的位置。甚至幾十年前，深度學習和機器學習就已經存在，但直到最近 10 年，該領域才開始成熟。過去幾年到底發生了什麼變化？

嗯，首先，摩爾定律將我們帶到了這樣一個地步，即存儲和處理成本對於在家中實施機器學習的人來說變得最小。你現在可以在自己的機器上運行幾乎所有的基本模型，如果你購買了一個好的 GPU（不再那麼昂貴），它可以將你的計算時間優化近 10 倍，以便能夠運行複雜的模型。

《連線》雜誌對這一變化有很好的報導。

有線雜誌-深度學習

一年中芯片中的晶體管數量（注意 Y 軸是對數刻度！）。資料來源：Assured-Systems

cb 洞察-深度學習

改變的另一件事是企業已經意識到自動化的必要性。因此，雖然該領域的併購活動大幅增加，但在過去 5 年中，風投們一直在向該領域投入大量資金。

投資者對深度學習的展望

那麼，我們現在的立場是什麼？投資者或初創公司應該如何看待這種極端的 AI 嗡嗡聲？在我看來，人工智能初創公司有四個關鍵方面，所有這些方面都需要結合起來才能形成一家強大的公司。

人才：一切從這裡開始。在初創公司中，團隊顯然是最重要的方面，而在 AI 初創公司中，它是公司真正的引擎。獲得強大的數據科學和計算機工程人才來微調這些預先構建的模型將是人工智能初創公司的關鍵，這就是為什麼美國和中國的初創公司可能在其他地區處於領先地位。新加坡確實有一小部分數據科學人才，很可能是建立人工智能公司的好地方。也就是說，最優秀的人才最終可能會有機地或無機地進入科技巨頭。谷歌收購 DeepMind 正是為了獲得深度學習領域的一些最優秀人才。
數據：如果團隊是引擎，那麼數據就是人工智能初創公司的汽油。如果沒有大量乾淨和結構化的數據，您不太可能從阻礙業務應用程序的訓練有素的系統中獲得任何準確性。由於模型的預測能力對輸入數據的核心依賴性，與小型初創公司相比，大型公司在提出更好、更準確的系統方面可能具有顯著優勢。這是一個令人不安的想法，打破常規的唯一方法是生成和利用您自己的專有數據。像 Salesforce 這樣的記錄系統在這方面將非常重要。
模型：所有大型科技巨頭目前都在推出自己的人工智能係統（開發平台、庫、訓練模型），為未來的人工智能開發創建平台。尚未確定誰將贏得這場戰爭，但從頭開始創建模型的需求遲早會結束。只有對於真正複雜的系統，才需要從基礎開始構建模型，但在大多數情況下，您的數據科學家將能夠重用現成的模型並使用自己的數據重新訓練它們。你怎麼知道你已經達到了最好的模型呢？由 Union Square Ventures 支持的 Numerai 正在以一種非常聰明的方式解決這個問題，通過眾包給 ML 專家並在財務上激勵他們建立更好的模型。
業務問題：這就是事情變得有趣的地方。首先，用戶並不關心您的系統是否是自動化的。人工智能係統旨在優化您自己的組織，讓機器執行人類的任務，而不是讓用戶驚嘆。因此，解決特定的業務問題是提供良好用戶體驗並因此增加粘性的關鍵。

其次，大多數科技巨頭將限制自己建立一個廣泛而通用的平台。雖然 Salesforce、Hubspot 等科技公司正在涉足人工智能，但它們很可能會成為一條收購路線。 Salesforce 已經宣布了愛因斯坦（儘管尚未正確執行其聲明），並且 Hubspot 每週都會在其博客上撰寫有關 AI 的文章。它只顯示了他們對該領域的興趣，以及他們針對特定問題的難度。這就是初創公司可以利用的差距所在，而我們的投資組合公司 Saleswhale 正是在走這條路。

在我看來，如果一家初創公司通過自動化解決了一個非常有針對性的問題，該問題會影響使用其係統在途中收集的專有數據的足夠多的人，那麼它很可能是一項非常有利可圖的業務，並且進入壁壘很高。然而，據我所知，這在該地區不太可能是一個獨角獸規模的機會，而不是在科技巨頭還活著的時候。

[Nikhil Kapur 的這篇文章首次出現在 Medium 上，經許可轉載。]