Chatbots y el futuro de las aplicaciones en India
Publicado: 2016-06-24Era abril de 2015 y acababa de regresar a un verano abrasador en la India de mi etapa inicial en Londres. No estaba contento con el calor, pero nunca he sido bueno para adaptarme al cambio climático. Estoy mimado por el clima de California y mi mudanza a las frías calles de Shoreditch el año anterior tampoco fue fácil. Pero el clima tuvo poco que ver con mi decisión de sudar en la humedad de Mumbai.
Quería ver cómo el estallido de la adopción de teléfonos inteligentes había impactado la vida de aquellos que tradicionalmente estaban acostumbrados a una vida sin dependencia de la tecnología. Hubo bastantes tendencias que sobresalieron, pero una en particular. El vertiginoso crecimiento de la mensajería, especialmente de WhatsApp. Fue esta comprensión lo que impulsaría mi contribución a Haptik, un servicio de asistencia personal por chat.
Pero probablemente no estés aquí para leer sobre mi viaje. Entonces, vayamos a la verdadera razón por la que estás aquí.
Los chatbots se promocionan como el futuro de las aplicaciones, pero ha habido excelentes ejemplos de cómo y por qué nunca alcanzarán este destino.

Cuando Sundar Pichai lanzó Allo como el Asistente de Google basado en chat en Google IO, dijo: “Creo que estamos en un momento fundamental. Nosotros, como Google, hemos evolucionado significativamente en los últimos 10 años y creemos que estamos preparados para dar un gran salto en los próximos 10... Realmente queremos dar el siguiente paso y ayudar más a nuestros usuarios. Así que hoy anunciamos el asistente de Google”.
¡Pero Google ya llegó tarde a la fiesta!
Satya Nadella, CEO de Microsoft, ha sostenido su opinión de que los "agentes" asistidos por IA como Cortana van a cambiar la forma en que usamos la web.
David Marcus, líder de Facebook Messenger, lanzó Facebook M el año pasado diciendo: “Es un paso emocionante para permitir que las personas en Messenger hagan cosas en una variedad de cosas, para que puedan tener más tiempo para concentrarse en lo que es importante en sus vidas. ”
A principios de este año, Dag Kittlaus, el hombre detrás de Siri, lanzó Viv, casi como un Siri 2.0 con todas las capacidades de un asistente. Su video de demostración probablemente apareció en la pantalla de la computadora de todos los entusiastas de los chatbots.
Pero no todo el mundo es creyente.
Existen contraargumentos sobre el éxito y la viabilidad de las pantallas de chat y el comercio conversacional. Connie Chan, socia de a16z, publicó un extenso artículo en Twitter sobre por qué el comercio conversacional no es el camino a seguir. El concepto de jardines amurallados muestra por qué las plataformas de chat no resuelven realmente el problema de las aplicaciones. Dan Grover expresa lo que muchos quieren decir con respecto a los bots, el diseño y por qué es posible que los bots no reemplacen las aplicaciones.
Imaginar el futuro de las aplicaciones y compartir ideas novedosas sobre el tema se ha convertido en una tendencia entre las mentes obstinadas (inteligentes) de la raza humana. En estas mareas de opiniones fuertes, las empresas indias no están bien representadas. Mi experiencia en Haptik me ayuda a contribuir con ideas sobre lo que creo que podría ser el futuro de nuestra interacción con los teléfonos móviles.
Pero, ¿por qué hablamos de 'chatbots'?
Para responder a esta pregunta debemos observar la evolución de la forma preferida de “hacer las cosas”.
Las personas realizan entre 100 y 200 transacciones todos los días. Desde el envío de mensajes de texto, la respuesta a correos electrónicos, la configuración de recordatorios y la realización de pedidos para el almuerzo, la lista continúa. Nos encanta hacer transacciones. Tal vez porque nos hace sentir productivos. Entonces, cuando Jobs puso un teléfono inteligente en nuestras manos, eso nos hizo sentir poderosos y naturalmente hicimos la transición de teléfonos viejos/tontos.
Luego vino la tienda de aplicaciones y estimuló nuestra fascinación por probar nuevas interfaces para hacer las cosas. Antes de que nos diéramos cuenta, nuestra necesidad de experimentar nos tenía sobrecargados de aplicaciones. Hoy en día, hay 4,1 millones de aplicaciones en Google y App Store combinadas.
Pero esto no es solo un problema de memoria del teléfono (hardware). De hecho, limitamos la capacidad de atención humana.
La memoria humana es débil y requiere activación frecuente. Para no perderse entre la multitud, la idea inicial fue crear “ganchos” para las empresas.

Los ganchos son lo que las personas asocian instantáneamente con una empresa/marca cuando escuchan el nombre o ven el logotipo.
Luego comenzamos a aprovechar estos ganchos y las empresas comenzaron a luchar por la dominación. Las crecientes ambiciones llevaron a una especie de convergencia y una superposición considerable en las cosas que podía hacer una aplicación.
Como un esfuerzo por mantenerse a la cabeza, las nuevas empresas adoptaron la estrategia de hacer que sus servicios fueran accesibles desde otras aplicaciones. Comenzaron a asignar equipos separados para crear y mantener API (y SDK en algunos casos) que otras aplicaciones pueden consumir para incluir su experiencia en nuevas interfaces.
Entonces, la "Aplicación-A" también podría proporcionar las funciones y servicios de la "Aplicación-B" mediante el uso de su API. Curiosamente, "App-B" podría hacer lo mismo con "App-A". Bueno, lo has adivinado. Ahora App-A o App-B prácticamente compiten entre sí en lugar de fortalecer sus propuestas de valor individuales.
Estas ambiciones han dado una nueva dirección a la trayectoria de la tecnología de software. Una trayectoria hacia la inexistencia de apps independientes.
Las aplicaciones en 2016 parecen menos empresas y más una representación digital de tareas/transacciones en las que un usuario participa diariamente/semanalmente. Nos estamos alejando de los anzuelos de una empresa a un mapeo mental abstracto de su propuesta de valor.
Aquí es donde entran los chatbots
Cuando quedó claro que la solución era algo más que espacio de almacenamiento, las empresas vieron una gran oportunidad. Se cuestionaba la interfaz real y los medios subyacentes para completar estas tareas (aplicaciones). WeChat comenzó a experimentar con algo poderoso en su mercado chino patentado. De hecho, han hecho un hermoso trabajo al hacerse cargo de este mercado hercúleo en su totalidad. De hecho, puedo decir que WeChat es una parte innata de la vida diaria china. Su enfoque está bien redactado en esta publicación de blog de Dan Grover.
Hay mucho que aprender sobre las expectativas humanas de la tecnología en su publicación. Debemos desbloquear la emoción humana de sentirse relajado y ayudar a la creación de un espacio-tiempo mental libre. Esto es subjetivo para las personas en función de sus entornos. Por ejemplo, el acceso a los horarios de trenes "correctos" es un problema excepcionalmente importante en países como India frente a Japón, donde los trenes casi siempre llegan a tiempo.
De hecho, estaba emocionado cuando ellos (WeChat) hicieron su gran lanzamiento en India. Lamentablemente, no fue tan poderoso como lo es para la gente en China.

Traté de buscar un restaurante aquí en Mumbai, India, llamado "Delicadeza de China" en WeChat, pero no obtuve ningún resultado relevante. Ni siquiera funcionó para 'Techcrunch'.
El mundo occidental, junto con partes de Asia y Europa, todavía necesitan una solución culturalmente relevante para este problema. En esta intersección de ver las aplicaciones como tareas y la necesidad de tener una interfaz culturalmente neutral para hacer las cosas, comienza la discusión sobre el comercio conversacional. Es importante tener en cuenta que la pantalla de chat es solo una de las implementaciones. Esto debe verse como una oportunidad para crear una interfaz universal en la que convergen estas tareas (aplicaciones).

Pero, ¿por qué la pantalla de chat?
Para que una interfaz sea verdaderamente revolucionaria, el requisito previo más crítico es la adopción. Las personas deben sentirse cómodas y dispuestas a utilizarlo activamente. El crecimiento que desafía la gravedad de WeChat, WhatsApp y Facebook Messenger hizo que el mundo (aquellos que estaban mirando) se diera cuenta de cómo el chat era una interfaz de usuario natural. Con una barra de envío de mensajes, una foto de perfil y un estado en línea, las posibilidades de una pantalla de chat permiten una curva de aprendizaje casi plana. No solo por la tecnología amigable, el chat es comercialmente aceptable por la larga cola de usuarios. La mensajería funciona bien con baja conectividad a Internet y eso es fundamental para volverse relevante para aquellos que aún no son testigos de los teléfonos inteligentes e Internet.
La próxima ola de usuarios de teléfonos inteligentes 3B tendrá una transición natural al comercio conversacional debido a una curva de aprendizaje plana. Es como la interfaz de SMS que siempre han usado, pero capaz de mucho más. Esto hace que el chat sea una interfaz extremadamente lucrativa para el futuro.
Pero en palabras de David Marcus, “Es el primer día de una nueva era”. Recuerde lo que pensamos sobre las empresas que hacen la transición de su sitio web tradicional a una experiencia móvil.
Recomendado para ti:
En el mundo de las startups, la fiesta siempre está donde está la gente. El chat se convirtió en algo más que hablar con tus amigos. Iba a convertirse en un lugar para prestar (todo tipo de) servicios. Todo, desde juegos hasta asesoramiento legal, ahora está disponible a través de un chat-bot. Una vez estaba creando una lista de todos los servicios basados en texto con tecnología de chat/Ai. Después de 53 empresas, dejé de contar. Pero asumiendo que ya sabes todo esto, vayamos al grano. Con los servicios vienen las experiencias y las transacciones, las cuales requieren estandarización.
Si vas a 10,000 pies por encima, puedes ver todo este ruido dividido en 3 segmentos:
- Plataforma : Empresas que simplemente quieren poseer la capa sobre la cual cualquier empresa/jugador puede crear experiencias.
- Jugador : empresas que desean crear experiencias inteligentes, predictivas e inclusivas asumiendo la propiedad final de algunos casos de uso.
- Agregador : empresas que crean una interfaz que es un agregador de otras aplicaciones (ellos mismos agregadores en la mayoría de los casos) y cumplen mediante redirección.


Plataformas (por ejemplo, Facebook Messenger/WeChat/Viv):
- Construye la capa de chat subyacente
- Proporciona una API abierta que permite a las empresas y entusiastas crear bots de chat.
- Proporciona los elementos que se pueden utilizar para crear experiencias coherentes.
Ventajas:
- Tiene una audiencia masiva existente que usa el producto todos los días.
- Construir un bot es bastante sencillo después de leer la documentación.
- Chatea con tus amigos y empresas dentro de una interfaz
Contras:
- Es un menú masivo como la tienda de aplicaciones y el descubrimiento es un problema.
- Sobrecarga de mensajes (amigos y empresas/transacciones en una vista)
- La calidad de la experiencia depende de la capacidad de una empresa para construir un bot
Jugadores (por ejemplo, Haptik / Operador / Allo / ChatBot para X):
- Construye toda la experiencia (chat + elementos + pagos)
- Crea una capa de inteligencia para brindar una experiencia inclusiva y contextual
- Por lo general, selecciona algunos casos de uso para un enfoque más profundo
Ventajas:
- Optimizado para mejores experiencias con enfoque en pocos casos de uso
- Grandes apuestas por Machine Learning y NLP (Natural Language Processing) para tener conversaciones predictivas, inteligentes y semánticas
- Puede conocer las preferencias de un usuario y aumentar las ofertas con el tiempo
Contras:
- Casos de uso limitado
- Cree una base de usuarios y canales de distribución desde cero
- Dependencia de la cooperación de los socios
Agregador (Justdial/HelpChat/SnapDeal, etc.):
- Una aplicación para muchos casos de uso
- Cree una vista similar a la de un navegador que redirija a sitios asociados para completar
- Si existe el chat, permanece como una capa para soporte avanzado
Ventajas:
- Descargue una aplicación en lugar de muchas (ahorre memoria del teléfono)
- Comparación entre proveedores de servicios
- Una sencilla interfaz de bricolaje en la que no es necesario hablar con nadie.
Contras:
- Redirección a aplicaciones/sitios web de socios para completar transacciones
- Falta de consistencia en la experiencia de descubrimiento y finalización.
- Requiere que lo haga usted mismo, en lugar de pedirle a alguien que lo haga
- Difícil dar una experiencia personalizada.
En pocas palabras, le estás diciendo a alguien que haga las cosas por ti, o estás haciéndolas tú mismo.
El enfoque de Haptik y la inteligencia artificial
Cuando las cosas comenzaron a salirse de proporción, Haptik tuvo que sincronizar las grandes apuestas. Usamos nuestra ventaja de ser pioneros para tomar algunas decisiones basadas en datos.
La conversación que eventualmente llevó a nuestra decisión comenzó con Aakrit (CEO) y yo desayunando una mañana. El menú (de comida) era una lista interminable de cosas y me era imposible decidir mi pedido. Me llamó la atención lo similar que era este menú a nuestra tienda de aplicaciones/juegos. La tienda de aplicaciones es un menú enorme de cosas que puedo hacer cuando estoy ocupado o aburrido.

Piensa en cuando abres tu teléfono. O está ocupado y quiere hacer algo (llamar, enviar mensajes de texto, responder, publicar, cargar, compartir) o está aburrido y quiere entretenerse/educarse/mejorarse (juegos, fotos, descubrir, leer). Las aplicaciones de tu teléfono y, lo que es más importante, tus notificaciones dicen mucho sobre ti. Son las elecciones que hiciste cuando te dieron el menú.
Pero los menús son confusos y frustrantes cuando buscas algo específico. Entonces, se nos ocurrió una teoría simple:
Si controla los elementos de un menú, controla las elecciones que se pueden hacer. Si controlas las opciones, puedes predecir las decisiones. Saber cómo las personas invierten su tiempo y qué elecciones hacen cuando se les da un menú fijo define sus inversiones mentales (espaciales). Estos son los metadatos de sus llamados "intereses" que pueden usarse para proporcionar experiencias hipercontextuales.
Esta teoría condujo a un experimento que eventualmente perfeccionó los servicios en los que Haptik se enfoca actualmente.
Pero, ¿por qué no convertirse en una “plataforma” que pueda convertirse en la futura App Store?
Mi amigo y ex miembro del equipo de Haptik, Raveesh Bhalla, tiene una buena cita inspirada en Batman: "O mueres como una aplicación o vives lo suficiente para convertirte en una plataforma". Suena y se siente increíble fantasear con convertirse en una plataforma en la que empresas de todo el mundo creen herramientas y bots. Lamentablemente, las barreras de entrada para crear un impacto global son más que una idea. Estos son algunos requisitos previos, especialmente para el chat:
- Una gran base de usuarios existente altamente comprometida (10M+ DAU)
- Una razón intrínseca/caso de uso que hace que el proveedor de la plataforma sea esencial en su teléfono
- Debe estar disponible y ser relevante para una audiencia global.
- Ha resuelto el paradójico problema catch-22 de cómo los usuarios se anteponen a los proveedores de servicios
Un buen ejemplo es Facebook o WeChat. Ahora pueden proporcionar más que solo redes sociales porque las bases del intercambio entre pares (texto/fotos) los hacen esenciales en todos los teléfonos. Una vez que se convierten en parte de la vida cotidiana de una masa crítica de usuarios, pueden liberar valor proporcionando algo más que valor social.
Convertirse en una plataforma es un cambio de estado o una transición en lugar de una idea con la que empezar. Puede diseñar estrategias para aumentar las posibilidades de que su empresa se convierta en una plataforma. Pero, no es un proyecto de fin de semana que puedes lanzar como startup. Haptik, entre muchas otras empresas, tiene la ambición de convertirse algún día en una plataforma. Pero no podríamos haberle hecho justicia si ayer hubiésemos elegido esa dirección.
Esta decisión fue fácil. Pero existir de forma independiente y realmente brindar el servicio de un asistente personal era complicado. Teníamos que saber mucho sobre cada usuario individual para brindar experiencias mágicas. Podríamos construir un bot simple que le hiciera un montón de preguntas e intentara descifrar las respuestas, pero seamos sinceros, los bots de chat apestan (ahora mismo).

Estas son algunas de mis experiencias mientras probaba los (supuestamente) chatbots impulsados por IA en Luka y Facebook M.
- La mayoría de ellos "no son realmente" inteligentes.
- Solo se ven geniales en las demostraciones.
- Difícil confiar en que un bot realmente te entienda
- Toma demasiado tiempo para ir y venir
- Carece de la capacidad de tener conversaciones personalizadas/contextuales
Muy bien resumido en este artículo de TC.
Un buen asistente personal debe ser inteligente y comprender el contexto. Debe ser capaz de tener una conversación bidireccional semántica; un diálogo.
Hacer que los chatbots sean más inteligentes
Empresas como Google y Facebook tienen el lujo de que mil millones de usuarios compartan fotos y mensajes en su plataforma. Sin acceso a este tipo de datos de usuario, las nuevas empresas deben ser creativas y utilizar métodos inteligentes.
Se puede aprender mucho de la cantidad de notificaciones que un usuario recibe de una persona o empresa en particular. El contexto de esas notificaciones (de qué aplicaciones provienen, a qué hora, etc.) y cómo un usuario interactúa con ellas representa la información de lo que les importa.
- ¿Qué aplicaciones tienen los usuarios en su teléfono?
- ¿Existe una tendencia de lanzar una aplicación con respecto a la hora del día y la ubicación?
- ¿Qué aplicaciones utilizan más los usuarios?
- ¿Cuántas veces revisan su teléfono?
- ¿Tienen muchas reuniones o pasan la mayor parte de su tiempo en Instagram?
- ¿Cuántos datos usan en el teléfono?
Estas preguntas y más brindan información que las empresas inteligentes pueden usar para crear experiencias contextualmente relevantes.
Lo que funciona para Haptik es la IA (inteligencia artificial) habilitada por humanos. Piénselo de esta manera, cuando envía un mensaje en Haptik, nuestro bot hace el primer intento de descifrar lo que quiere decir. Si no puede alcanzar el 99% de precisión, el bot se romperá (en segundo plano) y le pedirá a un ser humano real que lo ayude a resolver esta consulta. Luego, la solicitud se relaciona con un humano relevante (asistente) que se elige en función de la edad, la geografía y la experiencia para responder. Por lo tanto, es más probable que el bot responda a un usuario que pregunta sobre recomendaciones para una buena comida italiana en Nueva Delhi. Pero una solicitud de restaurantes que admiten mascotas en Mumbai que tienen excelentes hamburguesas vegetarianas será atendida por un asistente en Mumbai. Este asistente, mientras fue contratado, habría sido categorizado como un entusiasta y le encanta hablar con los usuarios sobre los mejores lugares para comer.
A medida que el asistente responde, el bot aprende y guarda contexto para futuros usuarios de esa demografía. También aprende el significado de lo que se solicitó y lo relaciona con una de nuestras categorías de tareas predefinidas. Es extremadamente difícil para un bot comprender y responder a usuarios de diversos orígenes culturales. Aquí es donde los humanos reales ayudan a nuestro bot a aprender sobre estas interacciones. Si bien este enfoque lleva tiempo y estamos en las primeras etapas, la belleza estará en escala.
Nuestro bot pronto podrá comprenderlo como persona en función de sus chats anteriores y responder en la jerga de chat a la que está acostumbrado. Entonces, cuando dices "Estás tardando mucho" o "Estás tardando tanto". El bot puede interpretar su impaciencia y regresar con una actualización de estado sobre su solicitud.
Por ejemplo:
Establece un recordatorio de despertar diario en Haptik para las 9 a.m. Resultado: Sabemos que te levantas a las 9 am.
Cuando inicie la aplicación para este recordatorio, lo más probable es que esté en su casa. Resultado: conocemos la zona en la que vives.
Nos pregunta sobre las mejores rutas/tráfico entre 2 puntos. Resultado: Conocemos las áreas entre las que viaja habitualmente.
Si ha pedido el almuerzo a una dirección específica varias veces, lo más probable es que sea su lugar de trabajo. Resultado: Conocemos el área en la que trabajas.
Con información sutil, podemos hacer cosas realmente geniales. Podemos organizar una llamada telefónica si no pospones el recordatorio para despertarte. Notificarle 30 minutos después de despertarse con la ruta más rápida al trabajo o la opción de reservar un taxi. Además, le permite reservar con anticipación sus comidas mientras se dirige al trabajo y tal vez recibir un café en su mesa antes de llegar allí.
Pero eso no es todo.
El siguiente paso para hacer que los chatbots sean más inteligentes es... bueno, otros chatbots.
Creamos e implementamos chatbots que han aprendido cómo los usuarios enmarcan oraciones y ejecutan pruebas en el chatbot principal que enfrenta el consumidor. Este es un proceso continuo que se ejecuta las 24 horas del día, los 7 días de la semana para enseñarle al bot cómo usuarios similares (lo más probable) preguntarían sobre diferentes casos de uso.

Este es el resultado de algo que llamamos "Modo genio", que aprende sobre los usuarios y predice los próximos movimientos.
¿Adónde va todo esto?
Cada empresa tiene una opinión subjetiva sobre lo que creen que es el futuro de su industria. Todos optimizan para encontrar su lugar en el gran esquema de las cosas. En mi opinión subjetiva, creo que todos nuestros esfuerzos (aplicaciones) convergerán en un objetivo singular de reducir el espacio mental y el tiempo necesarios para hacer las cosas. La distribución móvil está llegando a su límite y se requieren algunos cambios de paradigma urgentes e importantes.
Como innovadores y creadores, no solo debemos optimizar la interacción con nuestro producto, sino también compartir la responsabilidad de reducir la carga mental de los usuarios de nuestros productos. Ayude a los humanos a crear y deshacerse de ser esclavos de las notificaciones.
La buena noticia es que la selección natural nos está guiando en esta dirección. Las limitaciones humanas de la memoria fuerzan la consolidación de las aplicaciones en el espacio limitado disponible en la página de inicio del cerebro.
Entonces, si está creando para usuarios móviles, estas son algunas de las cosas para las que debe prepararse durante los próximos 5 años:
- Huella móvil : poner los teléfonos inteligentes en manos del próximo 3B.
- Curvas de aprendizaje planas : los teléfonos inteligentes pondrán Internet en manos de personas que no han aprendido antes las interfaces móviles (long tail). Las experiencias de usuario y las interfaces deberán reinventarse para que sean fáciles de usar para los nuevos usuarios.
- Accesibilidad a Internet : Internet confiable de alta velocidad disponible para todos. Piense en oxígeno para las generaciones futuras.
- Convergencia de aplicaciones en tareas : no existirán aplicaciones independientes que realicen una función fija y ocupen memoria en su teléfono. Las cosas convergerán en algo más centralizado. Se trata de una interfaz para esto, el chat es solo uno de ellos.
- Sea siempre personalizado : el aprendizaje automático ha llegado a un punto en el que todos los usuarios de teléfonos móviles esperan una experiencia personalizada. (Por ejemplo: cronometrar las notificaciones en función de la urgencia y la relevancia para los usuarios).
- SmartPhones y SmartExperiences : se esperará la comprensión de las preferencias y la presentación contextual de los datos de cada experiencia móvil. (Ej: Predicción de próximas tareas y recordatorios contextuales)
El ganador debe imaginar y ejecutar en la interfaz dentro de la cual a los usuarios de 7B les gustaría hacer las cosas. Seguramente va a ser un paseo experimental divertido.
Agradeciendo a Alisha y Vaibhav por la corrección de pruebas, Shreya por todas las creatividades y Laksh por la tracción. Esto no sería posible sin ti.






