El reconocimiento de voz se está integrando en casi todos los aspectos de la vida moderna, pero aún existe una gran brecha: los hablantes de idiomas minoritarios y aquellos con acentos marcados o trastornos del habla como el tartamudeo suelen tener menos capacidad para utilizar herramientas de reconocimiento de voz que controlan aplicaciones, transcriben o automatizan tareas, entre otras funciones.
Tobi Olatunji, fundador y CEO de la startup de reconocimiento de voz clínico Intron Health, quiere cerrar esta brecha. Afirma que Intron es la base de datos de reconocimiento de voz clínico más grande de África, con su algoritmo entrenado en 3,5 millones de clips de audio (16,000 horas) de más de 18,000 colaboradores, principalmente profesionales de la salud, representando a 29 países y 288 acentos. Olatunji dice que al tener la mayoría de sus colaboradores en el sector de la salud se asegura de que los términos médicos se pronuncien y capturen correctamente para sus mercados objetivos.
«Porque ya hemos entrenado en muchos acentos africanos, es muy probable que el rendimiento básico de su acceso sea mucho mejor que cualquier otro servicio que utilicen», dijo, agregando que los datos de Ghana, Uganda y Sudáfrica están creciendo y que la startup está segura de desplegar el modelo allí.

El interés de Olatunji en la tecnología de la salud proviene de dos aspectos de su experiencia. Primero, recibió formación y ejerció como médico en Nigeria, donde vio de primera mano las ineficiencias de los sistemas en ese mercado, incluyendo cuánta documentación necesitaba ser completada y lo difícil que era rastrear todo.
«Cuando era médico en Nigeria hace unos años, incluso durante la escuela de medicina y ahora, me irritaba fácilmente haciendo una tarea repetitiva que no merecía el esfuerzo humano», dijo. «Un ejemplo simple es que teníamos que escribir el nombre del paciente en cada orden de laboratorio que hagas. Y algo tan simple, digamos que estoy viendo a los pacientes y necesitan obtener algunas recetas, necesitan obtener algunos análisis. Tengo que escribir manualmente cada orden para ellos. Es frustrante para mí tener que repetir el nombre del paciente una y otra vez en cada formulario, la edad, la fecha, y todo eso. … Siempre me pregunto, ¿cómo podemos hacer las cosas mejor? ¿Cómo podemos facilitar la vida de los médicos? ¿Podemos quitar algunas tareas y asignarlas a otro sistema para que el médico pueda pasar su tiempo haciendo cosas muy valiosas?»
Estas preguntas lo impulsaron a la próxima fase de su vida. Olatunji se mudó a los EE. UU. para cursar una maestría en informática médica en la Universidad de San Francisco y luego otra en ciencias de la computación en Georgia Tech.
Luego adquirió experiencia en varias empresas de tecnología. Como científico investigador de lenguaje natural clínico (NLP) en Enlitic, una empresa del Área de la Bahía de San Francisco, construyó modelos para automatizar la extracción de información de informes de texto de radiología. También trabajó para Amazon Web Services como científico de aprendizaje automático. Tanto en Enlitic como en Amazon, se centró en el procesamiento de lenguaje natural para la salud, dando forma a sistemas que permiten que los hospitales funcionen mejor.
