Se trata del Hunyuan Turbo S, este es el nombre elegido, presentado como capaz de responder a consultas en un segundo, distinguiéndose "de DeepSeek R1, Hunyuan T1 y otros modelos lentos que necesitan pensar un rato antes de responder", dijo la empresa en una nota.
La medida de Tencent es la última señal de la creciente competencia nacional e internacional tras el auge de la empresa emergente DeepSeek, con sede en Hangzhou.
A diferencia de los modelos lentos tradicionales, como Deepseek R1 y Hunyuan T1, Hunyuan Turbo S ofrece "respuestas instantáneas", mejorando significativamente la velocidad de salida de las respuestas y reduciendo la latencia de la primera palabra en un 44%.
Es un rendimiento que pesa en múltiples áreas como el conocimiento, las matemáticas y la creación, proporcionando una nueva solución para la capacidad de respuesta de los grandes modelos.
La inspiración del diseño del Hunyuan Turbo S procede del modo de pensamiento rápido, en el que se basan los seres humanos para el 90%-95% de sus decisiones diarias basadas en la intuición.
Combinado con el modo de pensamiento lento del análisis racional, proporciona al modelo de gran tamaño una capacidad de resolución de problemas más inteligente y eficaz.
En términos de arquitectura innovadora, Hunyuan Turbo S adopta un modo de fusión Híbrido-Mamba-Transformador, reduciendo la complejidad computacional y la ocupación de KV-Cache del esquema Transformador tradicional.
Como base fundamental de la serie Hunyuan, con Hunyuan Turbo S Tencent pretende proporcionar en el futuro capacidades básicas para modelos derivados en inferencia, texto largo y código.
Actualmente, los desarrolladores y usuarios corporativos pueden acceder a Hunyuan Turbo S a través de la API en el sitio web de Tencent Cloud y disfrutar de una prueba gratuita de una semana.
El precio es de 0,8 yuanes/millón de tokens para la entrada y 2 yuanes/millón de tokens para la salida, una reducción significativa del precio del modelo Hunyuan Turbo de la generación anterior.
TODOS LOS DERECHOS RESERVADOS © Copyright ANSA