Transcribe audios en cualquier idioma desde WhatsApp con esta IA
El chatbot, denominado Carina, es una aplicación de inteligencia artificial que funciona a través de WhatsApp, ampliando las capacidades del servicio de mensajería al ofrecer asistencia en diversas consultas.
Una de las características más destacadas de este chatbot que funciona en WhatsApp es la posibilidad de transcribir mensajes de audio a texto en varios idiomas, incluidos español, inglés, francés, alemán, italiano y portugués.
Cabe destacar que Carina fue desarrollada por una entidad externa a WhatsApp. En concreto, una startup española con sede en Galicia llamada Carina Chat fue la empresa que estuvo detrás de la construcción de esta inteligencia artificial.
Qué trae Carina IA
Carina es un chatbot desarrollado para operar a través de WhatsApp, cuyas funcionalidades incluyen las características esenciales presentes en otros sistemas de inteligencia artificial similares.
Entre sus capacidades, se encuentra la opción de consultar información sobre el clima y responder a preguntas de diversa índole.
Carina integra datos en tiempo real para proporcionar respuestas actualizadas y precisas. Además, sus respuestas pueden incluir enlaces externos que dirigen a los usuarios hacia fuentes adicionales de información, lo que enriquece la experiencia del usuario al ofrecerle un acceso rápido y directo a datos y recursos relevantes para sus consultas.
Probamos su función del clima con un prompt que integraba varias ideas:
“Qué temperatura hay en este momento en la ciudad de méxico? dame tres recomendaciones de outfit basándote en el clima y considerando que mi estilo es boho chic”.
Carina respondió acertadamente la información del clima y proporcionó una respuesta completa en cuanto a las recomendaciones de atuendos.
Este chatbot utiliza un servicio especializado en pronósticos meteorológicos en tiempo real.
Transcripción de audio de Carina
No obstante, la función más destacada de Carina es la transcripción de audios. Esta característica se demuestra bastante precisa al convertir mensajes hablados a texto, facilitando la comunicación en varias situaciones, desde conversaciones cotidianas hasta contextos profesionales.
Aunque no existe un límite en la cantidad de audios que un usuario puede transcribir, es importante tener en cuenta que la duración de estos puede afectar el tiempo de respuesta del chatbot. Mensajes más largos requerirán naturalmente más tiempo para ser procesados y transcritos correctamente.
Asimismo, el chatbot solo soporta audios en formatos MP3, WAV, FLAC. En Infobae probamos la herramienta y no soportó m4a.
Al enviarle un audio en español de 1:15, tardó menos de un minuto en enviar la transcripción y esta fue bastante acertada. Además, envió un resumen de la información contenida en el audio.
Cabe agregar que el audio era una grabación en la que solo estaba la voz del interlocutor y no habían sonidos de terceros.
Luego, se le pidió transcribir un audio en inglés que incluía varias voces, música de fondo y aplausos. El texto que proporcionó fue correcto, sin embargo, el chatbot no distingue entre interlocutores, sólo presenta un párrafo con toda la transcripción.
Privacidad de los usuarios
La aplicación recaba diversos tipos de información, entre ellos: las páginas y archivos consultados, hora de acceso, versión del navegador, sistema operativo, identificación del dispositivo, páginas visitadas previamente mediante un enlace, dirección IP, información de la aplicación y del dispositivo móvil, ID de sesión, así como cookies.
Además, al interactuar con la funcionalidad de chat, se recopila el número de teléfono del usuario y cualquier dato enviado a través de este medio, incluyendo la voz en caso de solicitar la transcripción de audios y, potencialmente, imágenes presentes en el estado de WhatsApp.
Es importante que los usuarios estén al tanto de que, para ofrecer el servicio, Carina necesita compartir información identificativa del usuario con ciertas entidades.
Entre estas empresas externas con las que Carina comparte datos para respaldar su aplicación se encuentran: OpenAI OpCo y Amazon Web Services, Inc.
Estas compañías actúan como contratistas, proveedores de servicios y otros terceros usados para el soporte de la aplicación.
Fuente: InfoBae