Amazon ha dado un paso significativo en el área de inteligencia artificial y procesamiento de voz con el lanzamiento de Nova Sonic.
Esta nueva tecnología, presentada por la compañía en un evento reciente, promete ofrecer un rendimiento competitivo frente a rivales como OpenAI y Google, según TechCrunch.
Avances significativos en el procesamiento de voz
Nova Sonic ha sido descrita como una mejora importante en la capacidad de procesamiento de voz nativa.
En el pasado, los asistentes digitales como Alexa de Amazon o Siri de Apple han sido criticados por comportarse de una manera rígida o poco natural. Con innovaciones tecnológicas como Sonic, Amazon busca cambiar esta percepción, ofreciendo interacciones más fluidas y naturales para los usuarios.
Una característica destacada de Nova Sonic es su disponibilidad mediante Bedrock, la plataforma de Amazon diseñada para desarrolladores de IA empresarial, que ahora cuenta con una nueva API de transmisión bidireccional. Según el comunicado de prensa emitido por Amazon, este modelo es un 80% más económico que el modelo GPT-4o de OpenAI, lo que lo convierte en una opción atractiva para las empresas que buscan integrar soluciones de IA eficientes en costos.
Funcionalidades destacadas y precisión mejorada
Rohit Prasad, Vicepresidente Senior de Amazon y Jefe Científico de AGI, explicó que Nova Sonic se integra en el amplio ‘sistema de orquestación grande’ de Amazon, que también alimenta a Alexa. Este sistema permite a Nova Sonic enrutar eficientemente las solicitudes de los usuarios y acceder a herramientas específicas cuando sea necesario, mejorando la experiencia del usuario final.
Minotaurus
Amazon asegura que Nova Sonic está diseñado para interactuar de manera correcta en diálogos bidireccionales, considerando pausas e interrupciones del hablante. También se caracteriza por generar transcripciones precisas del discurso del usuario, con una tasa de error de palabras (WER) de solo 4.2% en pruebas multilingües.
Impacto en la estrategia de AI de Amazon
La presentación de Nova Sonic forma parte de una estrategia más amplia de Amazon para avanzar hacia la inteligencia general artificial (AGI). Esto incluye desarrollar sistemas de IA que puedan manejar tareas que los humanos realizan con computadoras, ampliando el alcance y la funcionalidad de los actuales asistentes digitales.
La compañía tiene previsto seguir evolucionando su línea de modelos de IA para abarcar otras modalidades como imagen, video, y datos sensoriales, integrándose más en el mundo físico. Esta visión a largo plazo refleja el compromiso de Amazon con la innovación continua en el ámbito de la inteligencia artificial.
Prasad sugirió que con el lanzamiento de modelos como Nova Sonic, Amazon busca proporcionar a los desarrolladores más herramientas internas para construir soluciones altamente eficientes y avanzadas.