腾讯混元新一代快思考模型 Turbo S 发布，支持“秒回”

2 月 27 日消息，腾讯混元新一代快思考模型 Turbo S 今日正式发布。

腾讯官方表示，区别于 Deepseek R1、混元 T1 等需要“想一下再回答”的慢思考模型，混元 Turbo S 能够实现“秒回”，更快速输出答案，吐字速度提升一倍，首字时延降低 44%。

在业界通用的多个公开 Benchmark 上，混元 Turbo S 在知识、数学、推理等多个领域，展现出对标 DeepSeek V3、GPT 4o、Claude 等一系列业模型的效果表现。

架构方面，混元 Turbo S 采用 Hybrid-Mamba-Transformer 融合模式，降低了传统 Transformer 结构的计算复杂度，减少了 KV-Cache 缓存占用，实现训练和推理成本的下降。

腾讯还称，新的融合模式突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题。一方面，发挥了 Mamba 高效处理长序列的能力；另一方面，也保留 Transformer 擅于捕捉复杂上下文的优势，最终构建了显存与计算效率双优的混合架构。

这也是“工业界首次”成功将 Mamba 架构无损地应用在超大型 MoE 模型上。通过模型架构上的技术创新，混元 Turbo S 部署成本大幅下降。

作为旗舰模型，混元 Turbo S 未来将成为腾讯混元系列衍生模型的核心基座，为推理、长文、代码等衍生模型提供基础能力。

基于 Turbo S，通过引入长思维链、检索增强和强化学习等技术，混元也推出了具备深度思考的推理模型 T1。

从腾讯公告获悉，当前，开发者和企业用户已经可以在腾讯云上通过 API 调用腾讯混元 Turbo S ，即日起一周内免费试用。

定价上，Turbo S 输入价格为 0.8 元 / 百万 tokens，输出价格为 2 元 / 百万 tokens。

腾讯元宝即将逐步灰度上线混元 Turbo S，用户在元宝内选择“Hunyuan”模型并关闭深度思考即可体验使用。

Published by