Retomamos con fuerza el diario de DIA4A para poneros al día de los avances realizados hasta la fecha. Como recordaréis, hemos conseguido que el modelo de detección de objetos y personas desempeñe su cometido sobre las imágenes capturadas a través de la cámara frontal del robot. Ahora que llegan los primeros resultados es momento de traducirlos a entregables. Entre estos, contamos la documentación técnica y ejecutiva de cada modelo y, por supuesto, el cuaderno de pruebas.

Para elaborar el cuaderno de pruebas, hemos desglosado cada modelo en sus funcionalidades básicas. Para acreditar que estas se han alcanzado, hemos acordado grabar un vídeo del robot desempeñando cada funcionalidad. Con la idea de que el vídeo fuese más vistoso y, sobre todo, no abusar del uso de comandos escritos, de cara a hacerlo más atractivo para alguien con un perfil no tan técnico, optamos por aprovechar la Google Cloud Speech To Text API. Como imaginareis, es un servicio de Google que permite la transcripción multi-idioma de voz a texto. Hacemos un paréntesis aquí, para indicar que paralelamente estamos desarrollando nuestro propio modelo de Speech To Text en castellano.

El objetivo para registrar nuestra prueba unitaria para este primer modelo (y para el resto de pruebas unitarias) era grabar un vídeo en el que:

  1. Se explica la prueba a realizar.
  2. Una persona se acerca al robot y le da una orden concisa en forma de comando de voz (por ejemplo: empieza)
  3. El robot en ese momento activa el modelo y empieza a publicar la salida de lo que va reconociendo.
  4. La persona le pide al robot que detenga la prueba mediante otro comando de voz (por ejemplo: termina)
  5. Una segunda persona explica las salidas generadas.

Entrando en detalles:

Para los que os gusta algo más de detalle, os explicamos un poco más a fondo el proceso. Lo primero es comentar algo sobre el nodo de ROS que encapsula la llamada a la API Speech To Text de Google. Este nodo se encuentra desplegado en el robot (a diferencia del nodo que encapsula el modelo desarrollado, que se encuentra en nuestras máquinas ya que requiere del uso de GPU para sus predicciones). La razón de esto es que se trata un nodo ligero que no realiza una computación per se, sino que delega en la API de Google, entonces lo primero será conectarse al robot y levantar este nodo.

Con ello, esperamos que la transcripción de cualquier voz humana que se detecte a través de los micrófonos del robot, sea publicada a través de un topic de ROS. A partir de aquí, se trata de escuchar en dicho topic y detectar el comando de activación de la prueba (algo así como “empieza” o “reconoce”) tras el cual se ejecuta una suscripción al topic de la cámara del robot y el modelo desarrollado comienza a identificar, hasta que se pronuncia el comando de finalización de la prueba (por ejemplo “termina”) “ y se desconecta del topic de la cámara, deteniéndose las predicciones.


Gracias a los compañeros de la URJC por el nodo que encapsula la Google Cloud Speech To Text API.

dia4ra cdtiEl proyecto empresarial de DATAHACK CONSULTING SL., denominado “DESARROLLO DE INTELIGENCIA ARTIFICIAL EN ROBOTS APLICADOS AL TRATAMIENTO DEL ALZHEIMER Y LA DEMENCIA” y número de expediente 00104725 / SNEO-20171211 ha sido subvencionado por el CENTRO PARA EL DESARROLLO TECNOLÓGICO INDUSTRIAL (CDTI)

MÁSTER EXPERTO EN BIG DATA & ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

Ya llevamos unas cuantas entradas del diario y, aunque hemos mencionado un poco de qué va el proyecto, nos gustaría contarlo más a fondo para que entendáis por qué es tan especial para nosotros.

DIA4RA (acrónimo de Desarrollo de Inteligencia Artificial para Robótica Asistencial) es un proyecto pionero que ha surgido de datahack, con la colaboración del laboratorio de robótica de la URJC (Universidad Rey Juan Carlos). Nuestro objetivo es desarrollar un Robot Inteligente para dar asistencia a Enfermos de Alzheimer y otras formas de demencia, asociadas al envejecimiento.

Deep Learning y Robótica para el tratamiento del Alzhéimer

Según las últimas previsiones, el progresivo envejecimiento de la población a nivel mundial va hacer que el número de enfermos de Alzhéimer, y otras formas demencia, aumente vertiginosamente en las próximas décadas. Esto, junto con el hecho de que los costes del tratamiento de este tipo de enfermedades ha aumentando rápidamente en los últimos años. Se ha pasado de los 604.000 millones de dólares en 2010 a más de un 1 billón de dólares esperados para el 2018 y 2 billones dólares en 2030 (datos a nivel mundial). Lo cual va hacer que la incorporación de elementos robóticos, capaces de interactuar y relacionarse con las personas, sea una gran oportunidad no solo para reducir estos costes, sino también para ayudar en la asistencia que este tipo de personas necesitan y reducir el grado de avance de la enfermedad.

El objetivo de DIA4RA es dotar a la plataforma robótica humanoide “Pepper” de las capacidades necesarias para que lleve a cabo las tareas de tratamiento, asistencia y cuidado de personas con Alzhéimer y demencia. Esto lo estamos consiguiendo con la implementación de técnicas y algoritmos de IA (Inteligencia Artificial). Estamos trabajando dentro del área de Deep Learning, usando Redes Neuronales Profundas (DNN) y métodos de entrenamiento innovadores. Estos permiten el desarrollo de modelos de IA ágiles, capaces de aprender con pocos datos y que pueden ser entrenados y desplegados tanto en infraestructuras cloud como on-premise. También estamos abordando aproximaciones híbridas de los distintos tipos de aprendizajes: supervisado, semi-supervisado, auto-supervisado, no supervisado y por refuerzo, similares a los que emplea el propio cerebro humano. En total, está previsto desarrollar un total de ocho modelos de deep learning.

Cómo lo vamos a hacer y qué habilidades tendrá:

La integración de estos modelos en el robot la estamos haciendo a través del sistema ROS (Robotic Operating System). Este no solo nos permite tener un mayor control sobre los componentes del robot, sino que también da mayor margen a la hora de implementar y desplegar los modelos de deep learning. Así, pretendemos conseguir un robot inteligente capaz de:

Todos estas capacidades servirán para que el robot sea capaz de desenvolverse e interactuar con las personas que se encuentren en el centro donde va ser desplegado, un CRE (Centro de Referencia Estatal) para el tratamiento de personas Alzhéimer. También podrá usarse para hacer terapias con los paciente, evaluando su situación y tomando datos que podrán ser analizados para ver las medidas a tomar.

Así, DIA4RA no es solo un proyecto donde vamos a integrar las últimas tendencias tecnológicas, en robótica y deep learning. También es un espacio de trabajo dónde vamos a ver cómo influye y qué tipo de relación se establece entre este tipo de ente robótico y los ancianos y otras personas con los que va a interactuar.

dia4ra cdtiEl proyecto empresarial de DATAHACK CONSULTING SL., denominado “DESARROLLO DE INTELIGENCIA ARTIFICIAL EN ROBOTS APLICADOS AL TRATAMIENTO DEL ALZHEIMER Y LA DEMENCIA” y número de expediente 00104725 / SNEO-20171211 ha sido subvencionado por el CENTRO PARA EL DESARROLLO TECNOLÓGICO INDUSTRIAL (CDTI)

MÁSTER EXPERTO EN BIG DATA & ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

chevron-down