Der Stand des Deep Learning: Aus Entwickler- und VC-Perspektive

Veröffentlicht: 2017-09-05

Nikhil Kapur spricht über den Stand des Deep Learning, zuerst als Student Developer und jetzt als VC

Ich verbrachte einen Samstag in einem Deep-Learning- und TensorFlow-Workshop im gigantischen Level-3-Büro von Unilever Foundry und Padang.co. Es war ein lustiger Tag, wieder in die Welt der Entwickler einzutauchen, und ich habe all die Gespräche mit meinen Tischkollegen genossen, von denen einer ein Familienunternehmen führt und ML/Deep Learning als Hobby lernt (er ist ein begeisterter Programmierer) und der andere aus Die Marketingabteilung von Zalora möchte KI in ihrer Arbeit anwenden.

Wir begannen damit, TensorFlow und Keras (eine Abstraktion von TensorFlow) auf unseren Maschinen einzurichten, und fingen dann an, an einigen der üblichen Deep-Learning-Probleme und Beispielen herumzubasteln, wie z. B. die Verwendung des MNIST-Datensatzes. Angefangen mit einem einfachen kleinen NLP-Modell zur Texterkennung tauchten wir in Convolutional Neural Networks ein, mit denen es wirklich Spaß machte, herumzuspielen.

Wir verwendeten vorgefertigte Standardmodelle wie Inception V3, spielten aber mit unseren eigenen Datensätzen herum und trainierten das Modell neu, um verschiedene Probleme wie „Ist das eine Katze oder ein Hund?“ zu lösen. Ziel des Kurses war es, die Grundlagen des Deep Learning zu verstehen und mit Parametern und Funktionen zu experimentieren. Wenn Sie jetzt neidisch sind, dann schlage ich vor, dass Sie sich mit Playground.tensorflow.org beschäftigen, es war der einfachste Teil des Workshops, den Sie bekommen haben!

Ein großes Dankeschön an Sam Witteveen und Martin Andrews für die Organisation. Ich zähle hier einige der Perspektiven auf, die ich dabei hatte, und wo ich Deep Learning und KI im Allgemeinen sehe, insbesondere aus einer VC-Perspektive.

Deep Learning aus der Perspektive eines Entwicklers

Um ein bisschen Hintergrund zu geben, ich hatte ziemlich viel Kontakt mit „KI“. Im zweiten Studienjahr absolvierte ich ein Praktikum im Technology Consulting-Bereich von Deloitte. Zusammen mit meinem Freund Ujjwal Dasgupta, der später einen Master in ML machte und jetzt bei Google ist, verbrachte ich ein paar Monate damit, einen verbesserten ETL-Prozess (Extract-Transform-Load) auf IBM Datastage, einer Data-Warehousing-Software, zu entwickeln. Damals führte mich Ujjwal, der immer viel vorausschauender war als ich, in das Data Mining ein, und ich fing an, die Vorlesungen und Online-Kurse von Andrew Ng zu verfolgen.

Fasziniert von der Zeit, die ich bereits mit dem Thema verbracht hatte, wollte ich im nächsten Sommer tiefer in ML eintauchen. Ich hatte das Glück, bei Mozilla einem Projekt zugeteilt zu werden, um die Leistung von Firefox mit einem auf maschinellem Lernen basierenden Compiler – Milespot GCC – zu verbessern. Mit diesem ML-Compiler konnte ich den Code von Mozilla Firefox so kompilieren, dass die Programmladezeit um etwa 10 % verbessert wurde.

Und für meine Abschlussarbeit kam ich dann von ML nicht mehr los. Ich habe mit dem DFKI, dem Deutschen Institut für Künstliche Intelligenz, zusammengearbeitet, um an einem äußerst anspruchsvollen Projekt zu arbeiten, bei dem ich eine einfache Webcam für das Eyetracking verwendet habe. Das Team des DFKI nutzte dies für eine bestimmte Anwendung, Text 2.0. Sie verwendeten eine spezielle HD-Kamera, um Ihre Augen zu verfolgen und den Text entsprechend mit megacoolen Funktionen wie Auto-Scroll, Auto-Translate, Popup-Wörterbuch usw. zu erweitern.

Wir entschieden uns, dasselbe mit einer einfachen Webcam zu tun, weil niemand in Indien das Geld hatte, diese spezielle HD-Kamera zu kaufen. Um genau zu sein, sind wir daran gescheitert und haben nur eine Genauigkeit von etwa 70% in unserem Tracking erreicht. Aber es war eines der aufregendsten Projekte, an denen ich gearbeitet hatte.

Für dich empfohlen:

Wie Metaverse die indische Automobilindustrie verändern wird

Wie Metaverse die indische Automobilindustrie verändern wird

Was bedeutet die Anti-Profiteering-Bestimmung für indische Startups?

Was bedeutet die Anti-Profiteering-Bestimmung für indische Startups?

Wie Edtech-Startups dabei helfen, die Mitarbeiter weiterzubilden und zukunftsfähig zu machen

Wie Edtech-Startups Indiens Arbeitskräften helfen, sich weiterzubilden und zukunftsfähig zu werden ...

New-Age-Tech-Aktien in dieser Woche: Zomatos Probleme gehen weiter, EaseMyTrip-Posts steigen...

Indische Startups nehmen Abkürzungen bei der Jagd nach Finanzierung

Indische Startups nehmen Abkürzungen bei der Jagd nach Finanzierung

Das digitale Marketing-Startup Logicserve Digital hat Berichten zufolge INR 80 Cr an Finanzmitteln von der alternativen Vermögensverwaltungsfirma Florintree Advisors aufgebracht.

Digitale Marketingplattform Logicserve Bags INR 80 Cr-Finanzierung, Umbenennung in LS Dig...

Warum langweile ich Sie also mit diesen Details? Hauptsächlich, um Ihnen ein wenig Geschichte darüber zu geben, wo KI war, als ich meine Technik durchgearbeitet habe. Deep Learning und ML gab es bereits vor Jahrzehnten, aber erst in den letzten 10 Jahren hat das Gebiet seine Reife erlangt. Was genau hat sich in den letzten Jahren verändert?

Nun, zum einen hat uns Moores Gesetz an einen Punkt gebracht, an dem die Kosten für Speicherung und Verarbeitung für jemanden, der ML zu Hause implementiert, minimal wurden. Sie können jetzt so ziemlich alle Basismodelle auf Ihrem eigenen Computer ausführen, und wenn Sie eine gute GPU kaufen (die nicht mehr so ​​​​kostspielig ist), kann sie Ihre Rechenzeit um fast das Zehnfache optimieren, um komplexe Modelle ausführen zu können.

Das Magazin Wired hat einen großartigen Beitrag zu dieser Änderung veröffentlicht.

kabelgebundenes Magazin – Deep Learning

Anzahl der Transistoren in Chips über das Jahr (beachten Sie, dass die Y-Achse eine logarithmische Skala ist!). Quelle: Assured-Systems

cb Insights-Deep Learning

Eine andere Sache, die sich geändert hat, ist, dass Unternehmen die Notwendigkeit der Automatisierung erkannt haben. Während die M&A-Aktivitäten in diesem Bereich enorm zugenommen haben, haben VCs daher in den letzten 5 Jahren Geld in den Bereich gesteckt.

Investorenausblick auf Deep Learning

Wo stehen wir also jetzt und wie sollte ein Investor oder Startup dieses extreme Summen von KI sehen? Aus meiner Sicht gibt es bei einem KI-Startup vier wesentliche Aspekte, die alle zusammenkommen müssen, um ein starkes Unternehmen zu formen.

  • Talent: Hier fängt alles an. Während in einem Startup das Team offensichtlich der wichtigste Aspekt ist, ist es in einem KI-Startup der eigentliche Motor des Unternehmens. Der Zugang zu starken Data-Science- und Computertechnik-Talenten zur Feinabstimmung dieser vorgefertigten Modelle wird für KI-Startups von entscheidender Bedeutung sein, und deshalb haben US-amerikanische und chinesische Startups wahrscheinlich einen Vorsprung gegenüber anderen Regionen. Singapur hat ein winziges bisschen Data-Science-Talent und ist wahrscheinlich ein guter Ort, um Ihr KI-Unternehmen zu gründen. Allerdings werden die besten Talente wahrscheinlich entweder organisch oder anorganisch zu den Technologiegiganten wechseln. Googles Übernahme von DeepMind war genau das, ein Spiel, um einige der besten Köpfe im Bereich Deep Learning zu gewinnen.
  • Daten: Wenn das Team der Motor ist, dann sind Daten das Benzin in einem KI-Startup. Ohne große Mengen sauberer und strukturierter Daten ist es unwahrscheinlich, dass Sie aus Ihrem trainierten System eine Genauigkeit herausholen können, die die Geschäftsanwendungen behindert. Aufgrund der zentralen Abhängigkeit der Vorhersagefähigkeiten eines Modells von den eingegebenen Daten haben große Unternehmen wahrscheinlich einen erheblichen Vorteil gegenüber kleinen Start-ups, wenn es darum geht, bessere und genauere Systeme zu entwickeln. Dies ist ein beunruhigender Gedanke, und der einzige Weg, die Form zu durchbrechen, besteht darin, Ihre eigenen proprietären Daten zu generieren und zu nutzen. Ein Aufzeichnungssystem wie Salesforce wird in diesem Aspekt von enormer Bedeutung sein.
  • Modell: Alle großen Tech-Giganten bringen derzeit ihre eigenen KI-Systeme (Dev-Plattform, Bibliotheken, trainierte Modelle) auf den Markt, um DIE Plattform für die KI-Entwicklung von morgen zu schaffen. Es steht noch nicht fest, wer den Krieg gewinnen wird, aber die Notwendigkeit, Modelle von Grund auf neu zu erstellen, wird früher oder später vorbei sein. Nur für wirklich komplexe Systeme müssten Sie mit dem Erstellen Ihrer Modelle von Grund auf beginnen, aber in den meisten Fällen kann Ihr Data Scientist Standardmodelle wiederverwenden und sie mit eigenen Daten neu trainieren. Woher wissen Sie jedoch, dass Sie das bestmögliche Modell erreicht haben? Numerai, unterstützt von Union Square Ventures, geht dieses Problem auf sehr intelligente Weise an, indem es Crowdsourcing an ML-Experten richtet und ihnen finanzielle Anreize gibt, bessere Modelle zu bauen.
  • Geschäftsproblem: Hier wird es interessant. Erstens ist es einem Benutzer egal, ob Ihre Systeme automatisiert sind oder nicht. KI-Systeme sollen die eigene Organisation optimieren und eine Maschine die Aufgabe eines Menschen erledigen lassen, nicht um einen Benutzer zu begeistern. Daher ist die Lösung eines bestimmten Geschäftsproblems der Schlüssel zu einer guten Benutzererfahrung und damit zur Erhöhung der Klebrigkeit.

Zweitens werden sich die meisten Technologiegiganten darauf beschränken, eine breite und generische Plattform aufzubauen. Während Technologieunternehmen wie Salesforce, Hubspot usw. auf KI aufspringen, wird ihr Weg wahrscheinlich ein Akquisitionsweg sein. Salesforce hat Einstein bereits angekündigt (obwohl seine Ankündigungen noch nicht ordnungsgemäß umgesetzt werden müssen) und Hubspot schreibt jede Woche in seinem Blog über KI. Es zeigt nur, wie interessiert sie an dem Bereich sind, aber auch, wie schwierig es für sie ist, spezifische Probleme anzusprechen. Hier liegen die Lücken, die ein Startup ausnutzen kann und unser Portfoliounternehmen Saleswhale geht genau diesen Weg.

Wenn ein Startup mithilfe von proprietären Daten, die seine Systeme unterwegs sammeln, durch Automatisierung ein sehr gezieltes Problem löst, das eine ausreichende Anzahl von Menschen betrifft, ist es in meinen Augen wahrscheinlich ein sehr lukratives Geschäft mit starken Eintrittsbarrieren. Soweit ich sehen kann, ist dies jedoch unwahrscheinlich, dass dies eine Gelegenheit in der Größe eines Einhorns in der Region ist, nicht solange die Technologiegiganten noch am Leben sind.


[Dieser Beitrag von Nikhil Kapur erschien zuerst auf Medium und wurde mit Genehmigung reproduziert.]