https://topflightapps.com/ideas/build-mental-health-chatbot/
Guía amigable
para los fundadores para construir un chatbot de salud mental: análisis de
enfoques alternativos
Konstantin
Kalinin
31 de agosto
de 2022
En este blog,
nos encantaría hablar sobre los diferentes enfoques para desarrollar un chatbot
mental. Siga leyendo para aprender cómo crear un bot terapéutico que realmente
pueda ayudar a sus pacientes en lugar de decirles que se suiciden (más sobre
eso a continuación). Discutiremos algunas de las mejores prácticas y varias
herramientas a su disposición.
Principales
conclusiones:
Tanto los
pacientes como los terapeutas están de acuerdo en que los chatbots de salud
mental podrían ayudar a los clientes a manejar mejor su propia salud mental. Al
mismo tiempo, ningún chatbot puede reemplazar las interacciones humanas de la
vida real con un profesional de la salud.
Los dos
enfoques principales para desarrollar un chatbot terapéutico incluyen modelos
abiertos y orientados a objetivos, con los correspondientes patrones de diálogo
guiados y de flujo libre.
Algunas de las mejores herramientas para construir y mantener un chatbot de salud mental son DialogFlow y Rasa.
Tabla de
contenido:
¿Qué es un
chatbot de salud mental?
Beneficios de
los chatbots mentales
¿Cómo
funcionan los bots de salud mental?
Últimos
desarrollos de PNL con respecto a los chatbots
¿Qué
herramientas podemos usar para construir un chatbot mental?
Ejemplos de
chatbots de salud mental exitosos
¿Qué es un
chatbot de salud mental?
Los chatbots
son programas informáticos que utilizan tecnologías de IA para imitar
comportamientos humanos. Pueden entablar conversaciones de la vida real con
personas analizando y respondiendo a sus comentarios. Los chatbots utilizan la
conciencia contextual para comprender el mensaje del usuario y brindar una
respuesta adecuada.
Los chatbots
de salud mental brindan autoevaluación y pautas para ayudar a las personas a
superar la depresión, el estrés, la ansiedad, los problemas para dormir, etc.
El software
que muestra la inteligencia de un chatbot a los usuarios puede tomar muchas
formas:
-aplicación
móvil personalizada
-Mensajería
instantánea
-experiencia
en línea basada en avatar
La forma que
elija para un bot mental dependerá principalmente de cómo imagina que sus
pacientes interactúan con el programa.
Beneficios de
los chatbots mentales
¿Por qué hay
una necesidad de chatbots mentales? ¿Cuáles son los factores clave para que los
terapeutas desarrollen un chatbot de salud mental y para que los pacientes lo
usen?
ACCESIBILIDAD
En primer
lugar, los chatbots ayudan a aliviar las barreras asociadas con el estigma de
acceder a los servicios de salud psicológica y las barreras geográficas en el
asesoramiento presencial. Brindan información instantánea las 24 horas del día,
los 7 días de la semana y sirven excepcionalmente bien para aquellos que
trabajan en turnos no convencionales.
Los usuarios
disfrutan del anonimato que ofrecen los chatbots, ya que es más probable que
revelen información confidencial a un chatbot que a un terapeuta humano (según
un estudio reciente).
AHORRO DE
COSTES
Los chatbots
mentales también ofrecen ahorros de costos en forma de gastos de viaje y cargos
telefónicos para los pacientes. En cuanto a los profesionales, pueden centrarse
en personas en estado crítico y trabajar con datos de salud descubiertos por
IA, lo que implica una mayor eficiencia.
COVID-19 PUSO
A LOS CHATBOTS TERAPÉUTICOS EN UN MAPA
La pandemia
de COVID-19 realmente puso a los chatbots en el centro de atención. La pandemia
exacerbó la necesidad de asesores de salud mental, que rara vez estaban
disponibles debido a la repentina afluencia de pacientes.
Al final
resultó que, los proveedores de primera línea no están lo suficientemente bien
capacitados para brindar apoyo psicológico de emergencia. Según una encuesta
nacional de 2021, el 22 % de los adultos usaba un chatbot de salud mental y el
47 % dijo que estaría interesado en usar uno si fuera necesario.
Entre el
grupo demográfico anterior, el 60% dijo que comenzó a usar durante COVID-19, y
el 44% dijo que usa chatbots exclusivamente, es decir, sin hablar con un
terapeuta humano.
¿CUÁL ES LA
EVIDENCIA QUE RESPALDA LA EFICACIA DE LA IA PARA LA SALUD MENTAL EN GENERAL?
A corto
plazo, los chatbots pueden mitigar el daño psicológico del aislamiento y
permitir que las personas expresen sus inquietudes. Además, recibir apoyo
emocional positivo puede afectar positivamente la salud mental de los
pacientes.
Para aquellos
que usaron chatbots, la mayoría de los encuestados tuvieron una experiencia
positiva. Sin embargo, solo unos pocos profesionales y expertos los utilizaron.
Aún así, según una encuesta reciente , la mayoría de los profesionales de la
salud están de acuerdo en que los chatbots pueden ser útiles en el cuidado
mental y piensan que son relativamente importantes.
Relacionado:
Guía de desarrollo de aplicaciones de aprendizaje automático
¿Cómo
funcionan los bots de salud mental?
Aquí hay una
descripción general de alto nivel de una arquitectura de chatbot simple: la
canalización para un sistema de diálogo:
arquitectura
simple de chatbot Crédito de la imagen: Sowmya Vajjala et al., de “Practical
Natural Language Processing”
Reconocimiento
de voz
Dependiendo
de cómo esté configurado el chatbot, usamos algoritmos listos para usar que
transcriben la entrada del usuario en texto natural. Para los chatbots basados
en texto, este paso estaría excluido.
Comprensión
del lenguaje natural
Este paso
tiene como objetivo procesar la entrada del usuario utilizando el procesamiento
de lenguaje natural. En pocas palabras, el sistema trata de captar la intención
y el estado emocional del usuario (análisis de sentimiento). El software
también intenta extraer varias entidades (parámetros/atributos) relacionadas
con la entrada del usuario.
intención de
las entidades
Administrador
de diálogos y tareas
Este módulo
trata de controlar el flujo del diálogo. Esto se basa en las diferentes piezas
de información que se almacenan a lo largo de la conversación. En otras
palabras, el administrador de diálogo desarrolla una estrategia (o reglas) para
navegar de manera efectiva por el diálogo en función de la información
ingresada por el usuario y el contexto general.
Generación de
lenguaje natural
El
administrador de diálogo decide cómo responder al usuario, y el módulo de
generación de lenguaje natural crea una respuesta en un formato amigable para
los humanos. Las respuestas pueden ser predefinidas o tener una forma más libre.
Síntesis de
texto a voz
Como paso
opcional, el módulo de síntesis de voz vuelve a convertir el texto en voz para
que el usuario pueda escucharlo.
Últimos
desarrollos de PNL con respecto a los chatbots
Los
algoritmos de NLP de última generación suelen utilizar grandes redes neuronales
(el llamado aprendizaje profundo) para aprender los matices del lenguaje y
realizar tareas complejas con una intervención mínima (es decir, comprensión
del lenguaje natural y generación de lenguaje natural).
Estos son los
principales modelos utilizados en tales redes neuronales lingüísticas:
MODELO
GENERATIVO
Le permite
entrenar un modelo para generar (salida) resultados que tengan características
similares a las que se han entrenado en el conjunto de datos.
modelo generativo
Parte
de este proceso involucra el modelado del lenguaje. Esencialmente, estamos
tratando de responder: "¿Cómo podemos predecir mejor la siguiente
secuencia de palabras (resultados) dada una secuencia inicial de
palabras?"
Ejemplo : si
entrena el modelo con suficientes datos de "terapia", la implicación
es que el modelo actuará de manera estadísticamente consistente con lo que
diría un "terapeuta".
MODELO
PREENTRENADO
Entrena el
modelo en un corpus de datos mucho más general y luego aplica un conjunto de
datos anotados más pequeño para que el modelo pueda ajustarse en función de los
detalles de su problema.
modelo
preentrenadoEjemplo : los modelos grandes de NLP generalmente se entrenan en
cantidades masivas de datos (corpus) que se encuentran en Internet. El modelo
puede aprender a responder de forma más adecuada si tenemos un conjunto de
datos más dedicado en el que centrarse (es decir, además de la gran base de
conocimientos generales a partir de la cual se entrena previamente el modelo).
MODELO DE
TRANSFORMADOR
Modelo de red
neuronal que intenta tener en cuenta cómo se usan las palabras en contexto (en
lugar de una sola palabra a la vez). Este modelo puede rastrear la relación
entre las palabras en una oración y decidir qué partes de la secuencia de
palabras merecen atención.
¿Qué
herramientas podemos usar para construir un chatbot mental?
¿Qué
herramientas serían las más apropiadas para construir un chatbot de salud
mental? Depende de una serie de factores, que incluyen pero no se limitan a:
¿Si la
conversación está orientada a objetivos o si queremos que sea más abierta?
Si la
conversación está orientada a objetivos, ¿ya tenemos trazado el flujo de la
conversación?
¿Cuántos
datos conversacionales de la vida real tenemos a mano?
¿Qué
características generales buscamos? ¿Estas características vienen listas para
usar o tienen que ser hechas a la medida, específicas para la aplicación?
¿Con qué
plataformas queremos integrar el chatbot (por ejemplo, aplicación móvil,
aplicación web, mensajería, etc.)?
Algunos
sistemas de creación de chatbots, por ejemplo, DialogFlow, vienen con ciertas
integraciones listas para usar.
¿Necesitamos
funciones como voz a texto (STT) o texto a voz (TTS)?
¿El chatbot
necesita ser compatible con varios idiomas?
¿El chatbot
necesita realizar llamadas a la API de back-end para usar datos recopilados o
externos?
¿Qué tipo de
análisis planeamos recopilar?
CONSTRUCCIÓN
DE BOTS TERAPÉUTICOS ORIENTADOS A OBJETIVOS
Considere
usar un chatbot orientado a objetivos si desea guiar a su paciente a través de
un conjunto fijo de preguntas (o procedimientos) durante una sesión de
asesoramiento. También debe considerar este enfoque si tiene datos de
conversación muy limitados o necesita una protección explícita para enmarcar
cómo fluiría la conversación.
FLUJO DE
DIÁLOGO
DialogFlow es
una de las plataformas en la nube de creación de diálogos más populares de
Google. Podemos usar la interfaz de usuario web de DialogFlow para comenzar con
el desarrollo de inmediato (se requiere una codificación o instalación inicial
mínima). Luego, para escenarios más avanzados, proporcionan la API de
DialogFlow para crear agentes conversacionales avanzados.
FLUJO DE
DIÁLOGO ES
En términos
generales, trazamos cómo se puede desarrollar una conversación potencial.
Luego, DialogFlow usa NLP para comprender la intención del usuario (y recopilar
entidades) y, en base a eso, da las respuestas apropiadas.
flujo de
diálogo ESLa NLU mejora a medida que recopilamos más datos de conversación. El
flujo de conversación se mantiene en función de cómo DialogFlow realiza un
seguimiento explícito del contexto. La versión ES se basa en reglas y está
destinada a cubrir aplicaciones más sencillas.
Lea también:
Cómo desarrollar una aplicación de procesamiento de lenguaje natural
Las
respuestas son generalmente estáticas (es decir, basadas en opciones
predefinidas). Sin embargo, las respuestas se pueden hacer más dinámicas
llamando a las API de back-end de la plataforma con solicitudes de webhook. Así
es como funciona DialogFlow en el back-end:
flujo de
diálogo
(Crédito de la imagen: Lee Boonstra, de
"La guía definitiva para la IA conversacional con Dialogflow y Google
Cloud")
Me gustaría
enfatizar que la plataforma tiene las funciones más necesarias listas para
usar, pero la contrapartida es que DialogFlow es un sistema cerrado y requiere
comunicaciones en la nube. En otras palabras, no podemos operarlo usando
servidores locales.
Algunas de
las características destacadas que vienen listas para usar incluyen:
soporte para
voz a texto y texto a voz
opciones para
revisar y validar su solución de chatbot
integraciones
a través de múltiples plataformas
análisis
incorporado
FLUJO DE
DIÁLOGO CX
Mientras que
DialogFlow ES debe reservarse para chatbots simples (es decir, si es una
empresa nueva o pequeña), recomendamos usar DialogFlow CX para chatbots más
complejos o al desarrollar una aplicación empresarial. Los principios básicos
detrás de ES todavía se aplican a CX.
Así es como
DialogFlow CX lo ayuda a crear un chatbot de salud mental más avanzado:
admite flujos
grandes y complejos (cientos de intentos)
múltiples
ramas de conversación
diálogo
repetible, comprensión de la intención y el contexto de expresiones largas
trabajar con
equipos que colaboran en grandes implementaciones
flujo de
diálogo CX
RASA
En general,
Rasa se usaría en escenarios donde la personalización es una prioridad. La
compensación detrás de esta personalización es que se requiere más conocimiento
tecnológico (por ejemplo, Python) para usar estos componentes. Además, requiere
más configuración inicial (incluida la instalación de varios componentes) en
comparación con el uso de DialogFlow (configuración inicial mínima o nula).
También debe
tener en cuenta que Rasa no tiene componentes de interfaz de usuario o los
tiene mínimos que vienen listos para usar.
Rasa tiene
dos componentes principales: Rasa NLU y Rasa Core
RASA NLU
Rasa NLU es
fundamentalmente similar a cómo funciona DialogFlow ES. La plataforma puede
hacer coincidir las intenciones del usuario y recopilar entidades/parámetros
durante las conversaciones. La comprensión del lenguaje natural mejora con la
recopilación y el análisis de más datos de conversación.
Los
componentes de NLU están diseñados con personalización en línea al construir la
canalización: podemos intercambiar componentes en diferentes etapas según el
caso de uso o las necesidades de la aplicación:
NLU
NÚCLEO RASA
Rasa Core
tiene un sistema de gestión de diálogos más sofisticado en comparación con
DialogFlow. El diálogo en Rasa se basa más explícitamente en las historias, lo
que organiza el orden de la intención, la acción y los parámetros que se
recopilan durante el desarrollo del modelo. También es posible entretejer
varias historias juntas usando una lógica personalizada.
historias
rasas
Dado que Rasa
es un marco que prioriza el código, existe un mayor grado de flexibilidad sobre
cómo puede diseñar conversaciones en comparación con DialogFlow. En general,
las respuestas son estáticas (opciones predefinidas), pero se pueden hacer más
dinámicas mediante llamadas a la API.
Aquí hay
algunas características adicionales que puede esperar de Rasa:
más
flexibilidad en la importación de datos de entrenamiento en múltiples formatos
bibliotecas
de código abierto
alojable en
sus propios servidores
Rasa
Enterprise incluye análisis
Además, tenga
en cuenta estas características de las que carece la plataforma Rasa:
no se
proporciona alojamiento
sin
integraciones listas para usar
sin
conversión de voz a texto o de texto a voz (opcionalmente, bibliotecas de
terceros)
CREACIÓN DE
BOTS TERAPÉUTICOS ABIERTOS
Recomendamos
crear un chatbot abierto si desea que las conversaciones sean más charlas (es
decir, un terapeuta de inteligencia artificial que proporcione conversaciones
abiertas y empáticas para aquellos que están pasando por un momento difícil).
Se recomienda
enfáticamente que tenga algunos datos conversacionales con los que trabajar
para ajustar el modelo y minimizar el riesgo de que un modelo transformador
(más sobre eso a continuación) genere respuestas inapropiadas.
Afortunadamente,
las plataformas GPT-3 y BlenderBot funcionan decentemente desde el primer
momento para crear agentes de diálogo abiertos, pero se aprovecha al máximo
cualquiera de los modelos con ajustes finos. Eso es necesario para minimizar el
riesgo de respuestas inapropiadas.
MODELOS
BASADOS EN GPT
GPT-3 utiliza
un modelo de transformador que se entrena en grandes corpus de texto en
Internet. En términos de datos de entrenamiento, los modelos GPT-3 se entrenan
en una variedad de texto como Wikipedia, corpus de libros y varias páginas web
(por ejemplo, de alta calidad como WebText2 y petabytes de datos como Common
Crawl).
GPT-3 se
considera un cambio de juego en el campo de NLP AI, ya que puede usarse para
una gran cantidad de tareas de NLP:
clasificación
de texto
resumen de
texto
generación de
texto, etc. en lugar de una sola tarea específica
Fundamentalmente,
GPT-3 de OpenAI cambia la forma en que pensamos acerca de la interacción con
los modelos de IA. La API de OpenAI ha simplificado drásticamente la interacción
con los modelos de IA al eliminar la necesidad de numerosos lenguajes y marcos
de programación complicados.
La calidad de
la finalización que recibe está directamente relacionada con el mensaje de
capacitación que proporciona. La forma en que organiza y estructura sus
palabras juega un papel importante en el resultado. Por lo tanto, comprender
cómo diseñar un aviso efectivo es crucial para desbloquear todo el potencial de
GPT-3.
gpt 3
#GPT-3 brilla
mejor cuando:
Suminístrelo
con el indicador apropiado
Ajuste el
modelo en función de las características específicas del problema en cuestión
Relacionado:
Chatbots médicos: casos de uso en la industria de la salud
Además, tenga
en cuenta algunos de los inconvenientes al considerar GPT-3 para hacer un
chatbot de salud mental:
sesgo de IA
Dado que
GPT-3 se entrena con grandes cantidades de datos, existe el riesgo de que use
un lenguaje tóxico o diga cosas incorrectas (es decir, que reflejen el conjunto
de datos que se usa para el entrenamiento). Por ejemplo, aquí hay una historia
en la que un bot basado en GPT-3 acordó que un paciente falso debería
suicidarse. Afortunadamente, este problema se puede abordar mediante un ajuste
cuidadoso (es decir, volviendo a entrenar el modelo en conjuntos de datos
enfocados para que pueda emular el comportamiento de conversación adecuado).
OpenAI tiene
una tendencia a restringir el acceso a la API para aplicaciones de mayor
riesgo. Necesitará permiso para usar su tecnología GPT-3 en una aplicación en
vivo.
Considere las
plataformas en línea como alternativas de GPT, como Forefront , que le permiten
aprovechar sus recursos informáticos con facilidad/restricciones mínimas si lo
anterior plantea un problema.
declaración de vanguardia
También puede considerar otras alternativas, como GPT-2 (es decir, una iteración anterior) o posiblemente DialoGPT para el entrenamiento del modelo fuera de línea y usar el ajuste fino si es necesario.
Desafortunadamente, la contrapartida es que los modelos anteriores tienen menos
parámetros. Y así, la profundidad y la calidad de las respuestas pueden ser
menos impresionantes en comparación con GPT-3.
Aquí hay un
prototipo de chatbot terapéutico que armamos en Topflight, usando un modelo
GPT-3.
BlenderBot es
una plataforma de creación de chatbots de Facebook. Su modelo de transformador
fue entrenado en grandes cantidades de datos conversacionales.
Los
principales puntos de venta de BlenderBot incluyen optimizaciones para tener
una personalidad, ser empático, mostrar un uso atractivo del conocimiento
basado en un conjunto de datos personalizado y combinar a la perfección todas
estas cualidades.
Facebook se
esfuerza por mantener el sistema adaptable a escenarios en los que el tono de
la persona cambia de una broma a una seriedad. Por lo tanto, las versiones
posteriores de BlenderBot codifican la información recuperada durante las
conversaciones en la memoria a largo plazo (es decir, usan un conjunto de
entrenamiento dedicado y una sesión de chat múltiple). Además, la plataforma
puede buscar información en Internet e integrar ese conocimiento en
conversaciones en tiempo real.
El enfoque
más accesible para crear un agente basado en BlenderBot es usar un servicio en
línea como Forefront . Alternativamente, las API de BlenderBot se pueden
encontrar aquí para realizar ajustes sin conexión. Sin embargo, los recursos
computacionales para ejecutar estos modelos son muy exigentes. Recomiendo ir
con una opción en línea.
Ejemplos de
chatbots de salud mental exitosos
Repasemos
algunos chatbots mentales exitosos que existen.
RÉPLICA
Replika es un
compañero de chatbot personal de IA desarrollado en 2017 por Kuyda. El
propósito de la aplicación es permitir que el usuario establezca una conexión
emocional con su chatbot personalizado y desarrolle una relación única para las
necesidades individuales de la persona.
ejemplo de chatbot de salud mental Replika
Los usuarios pueden nombrar a su compañero y seleccionar sus características, como el peinado, el color de la piel, la ropa, etc. A partir de ahí, el chatbot formulará gradualmente respuestas más específicas en función de sus interacciones con él.
¿Cómo
funciona Replica?
Inicialmente,
estaba completamente programado en base a scripts con los que el ingeniero
tenía que trabajar. Sin embargo, gradualmente, el equipo se volvió más
dependiente del uso de una red neuronal (su propio modelo GPT-3) a medida que
recopilaban más datos de conversación de los usuarios finales. Como resultado,
su sistema ahora usa una combinación de respuestas con guión y de IA.
AYBOT
Desarrollado
en 2017 en Stanford por un equipo de psicólogos y expertos en IA, utiliza PNL y
CBT (terapia conductual cognitiva) cuando conversa con el usuario sobre cómo ha
sido su vida durante una conversación de diez minutos (máximo).
Realiza un
seguimiento de todos los textos y emojis, por lo que las respuestas se vuelven
más específicas con el tiempo (haciendo referencia a conversaciones
anteriores).
ejemplo de chatbot mental Woebot
Woebot se creó inicialmente para apuntar a adultos jóvenes
en la universidad y la escuela de posgrado y está disponible en iOS y Android,
no pretende reemplazar la terapia real.
Los primeros
resultados muestran que los estudiantes universitarios que interactuaron con
Woebot redujeron significativamente los síntomas de depresión en dos semanas.
Recaudó más
de 90 millones de dólares en fondos de la serie B a partir de junio de 2021 y
recibió la designación de dispositivo innovador de la FDA en mayo de 2021 para
tratar la depresión posparto.
WYZA
Desarrollado en 2015 en India para facilitar el asesoramiento basado en los principios de CBT y mindfulness → generalmente disponible a través de individuos bajo un modelo freemium y a través de programas de beneficios para empleadores.
El
chatbot recomienda ejercicios específicos en función de la dolencia del
usuario.
Intenta
abordar la necesidad de triaje de salud mental en países de bajos ingresos
(escasez de especialistas en salud mental) y países de altos ingresos (listas
de espera de 6 a 12 meses antes de que un paciente obtenga ayuda).
ejemplo de
chatbot terapéutico WyzaRecaudó 20 millones de dólares en fondos de la serie B
en 2022 para expandir su negocio y ampliar el soporte multilingüe.
El grupo
demográfico objetivo generalmente son aquellos en el "medio perdido",
donde las aplicaciones de atención plena no son suficientes pero no necesitan
una evaluación psiquiátrica o médica.
Wyza fue
admitido en la Designación de dispositivo innovador de la FDA en 2022. Los
ensayos clínicos muestran que es "igual de comparable a la asesoría
psicológica en persona".
X2AI
Chatbot de
salud mental impulsado por IA escrito por psicólogos. El bot proporciona chats
de autoayuda a través de cambios en los mensajes de texto, similar a enviar
mensajes de texto con un amigo o un entrenador.
Más de 29
millones de personas tienen acceso de pago (consulte su sitio web).
Ejemplo de
chatbot mental de Tess by x2AI
En 2016,
comenzaron a usar estos chatbots para brindar apoyo mental a los refugiados
durante la guerra de Siria.
X2AI también
tiene como objetivo apuntar a veteranos y pacientes con PTSD. Hay un tesoro
oculto de investigación que muestra que su chatbot ha reducido los síntomas de
depresión.
Recaudó
fondos de serie A (no revelados) en 2019.
Lea también:
Cómo construir un chatbot
Si desea
discutir su idea de chatbot terapéutico con una empresa que prioriza el
crecimiento de su negocio además del desarrollo de productos, contáctenos aquí
.
No hay comentarios:
Publicar un comentario