Fundada por antiguos becarios Thiel, la aplicación de tutoría de idiomas con IA Speak comenzó su andadura en Seúl, Corea del Sur. Pero al entrar en el mercado estadounidense, tendrá que competir con rivales más conocidos como Duolingo.
En un viaje a Seúl en 2018, Connor Zwick pasó junto a lo que parecían rascacielos normales. Pero pronto se enteró de que estaban llenas de aulas, dedicadas a la enseñanza del inglés, y anuncios de esas clases estaban pegados en los techos de taxis y vallas publicitarias. Le cayó el veinte: el mayor mercado para su entonces incipiente aplicación de aprendizaje de idiomas Speak estaba aquí, no en Silicon Valley, donde se encontraba su sede. “Aprender inglés allí era como una obsesión”, recuerda. “Había una demanda latente.”
Pero la formación lingüística que se ofrecía a menudo era ineficaz. Los estudiantes pasaban horas aprendiendo lo básico a partir de libros de texto y vídeos pregrabados, supervisados por profesores que carecían de fluidez. Los métodos anticuados enfatizaban el aprendizaje de gramática y vocabulario en lugar de hablar en voz alta. “Todo era tan académico y había miedo a cometer errores”, dijo Zwick.
Además: Grupo Unacem emitió bonos municipales por US$360 millones en Estados Unidos
Para Zwick, el bullicioso centro de Seúl y su demanda constante de enseñanza del inglés fueron tanto inspiración como oportunidad: crear un verdadero tutor de IA que pudiera reemplazar al tutor humano y ofrecer un espacio sin juicios para que los estudiantes cometieran y corrijeran errores mientras hablaban otro idioma. La promesa: “Nadie va a saber si has dicho algo embarazoso”, dijo.
Hoy en día, Speak cuenta con un coach de IA basado en voz que representa escenarios como pedir bebidas en un restaurante, pedir indicaciones para llegar a un destino turístico o charlar con un compañero para ayudar a practicar el habla de un nuevo idioma en situaciones reales. Construido principalmente sobre los modelos de OpenAI, el objetivo es animar a los usuarios a practicar la pronunciación en voz alta de palabras y frases de uso común. Los estudiantes también pueden crear sus propias situaciones desde cero mediante el software de IA que solicita. Funciones como las clasificaciones y las rachas que registran el uso diario ayudan a mantener la consistencia. Y no es solo para los que aprenden inglés. Speak ofrece sus juegos de rol y planes de lecciones para otros cinco idiomas: coreano, español, japonés, francés e italiano.
Hoy en día, unas 15 millones de personas han descargado Speak para practicar conversaciones con su tutor interactivo de IA y se han vuelto más fluidas y seguras hablando en un idioma extranjero. Esa tracción ha ayudado a la startup, valorada en 1,000 millones de dólares, a alcanzar un hito reciente: la empresa ha anunciado hoy que cuenta con más de 100 millones de dólares en ingresos anuales. En gran parte se debe a la fortaleza de su negocio de consumo. Los usuarios empiezan gratis en la app y pagan entre 80 y 200 dólares para acceder a más contenido.
Pero Speak también empezó a expandirse hacia el sector empresarial en 2024, cuando algunos de sus consumidores pidieron a los empleadores que cubrieran sus costes. Actualmente, unas 500 empresas, incluyendo KPMG y HD Hyundai, ofrecen suscripciones a Speak principalmente a empleados en Corea del Sur. Y tras ganar terreno en otros países como Japón y Taiwán, Speak comenzó a hacer un impulso concertado en el mercado estadounidense a principios de este año en junio.
Es un progreso impresionante, pero queda mucho camino por recorrer para alcanzar a su mayor rival. Los ingresos de Speak son eclipsantes respecto a los de Duolingo, que el año pasado registró 724 millones de dólares en ventas y proyecta que su negocio se disparará hasta 1,020 millones de dólares a finales de este año. También apuesta mucho por la IA y ahora ofrece videollamadas informales para aprender idiomas con su personaje de IA, Lily, cumpliendo la misión del multimillonario CEO Luis Von Ahn de crear un tutor automatizado que pueda enseñar un idioma extranjero a cualquiera de forma fácil y asequible.
Zwick es muy consciente del dominio de Duolingo, especialmente en EU, pero cree que Speak está bien diferenciado. Duolingo está orientado a mejorar la gramática y el vocabulario, argumenta. El enfoque de Speak está en la fluidez conversacional, el desarrollo de la memoria muscular del lenguaje y el refinamiento de la pronunciación para que la gente se sienta cómoda hablando en voz alta. Todo está en el nombre: Zwick afirma que la gente habla entre cinco y diez veces más en Speak que en otras aplicaciones para aprender idiomas.
Y Zwick no duda en cómo esas diferencias se traducen en las experiencias de la gente usando Duolingo en comparación con Speak. “Los juegos móviles que también te enseñan idiomas son, al final del día, formas de sentirte menos mal por usar el móvil cuando estás aburrido. Es una alternativa más saludable a Candy Crush, por así decirlo”, le dijo a Forbes. “Y creo que lo que intentamos hacer aquí… es algo un poco más serio.”
Speak ha atraído la atención de pesos pesados del capital riesgo como Khosla Ventures, Accel y OpenAI Startup Fund, recaudando alrededor de 160 millones de dólares en capital total. Pero recaudar fondos en 2016, cuando se fundó Speak, no fue fácil. No a mucha gente le importaba el aprendizaje de idiomas ni la IA, y algunos inversores incluso preguntaron a los fundadores si la aplicación era una estrategia secreta para recopilar y vender datos, dijo Zwick. Pero su visión sobre la promesa de Corea del Sur fue premonitoria. El socio de Accel Ben Quazzo, que voló a la conferencia de usuarios de la startup en la ciudad de Taipéi y lideró su ronda Series C de 78 millones de dólares el pasado diciembre, dijo que la decisión de Speak de centrarse en el mercado surcoreano fue intencionada: un “sandbox” para probar el producto en uno de los mercados de aprendizaje de idiomas más competitivos. “No estamos vendiendo como una app de dopamina o de compromiso”, dijo Quazzo. “Vendemos un proceso educativo para llevarte a un resultado final.”
Zwick conoció a su cofundador Andrew Hsu a través de la beca Thiel en 2012. Acababa de abandonar Harvard para lo que él llama un “año sabático de aprendizaje profundo” y estaba construyendo su primera startup, una herramienta de estudio y aplicación móvil llamada Flashcards+, que más tarde fue adquirida por la empresa de tecnología educativa Chegg. En Hsu, encontró un espíritu afín, un chico que abandonó su doctorado en Stanford en 2011 para unirse a la beca. Fascinados por la IA, ambos se colaron en clases en la Universidad de California, Berkeley y Stanford, perfeccionando su comprensión de técnicas básicas de aprendizaje automático como el aprendizaje por refuerzo. Incluso escucharon las conferencias del cofundador de OpenAI, John Schulman, sin que nunca los pillaran.
Hoy en día, OpenAI es fundamental para el crecimiento de la empresa. A medida que los modelos de IA siguen mejorando, también lo hace la app de Speak, que utiliza los modelos para actualizar automáticamente los planes de clase según el rendimiento de los usuarios y puede hacer cosas como la corrección de acento, algo que no era posible cuando se fundó Speak. Sven Strohband, socio y director general de Khosla Venture y uno de los primeros inversores, recuerda las versiones de principios de 2017 de Speak, que aún no podían mantener conversaciones completas con IA, pero sí entendían correctamente los acentos extranjeros. “Eran IA-first antes de que fuera realmente guay ser IA-first, para ser honesto”, dijo Strohband.
