腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
?
混元大模型目前已上线3个版本,以下为模型特性的简要介绍,可作为业务接入时版本选择的参考依据。
模型名称 | 能力和特征 | 分支版本 | 输入输出 |
hunyuan-pro | 当前混元模型中效果最优版本,万亿级参数规模MOE-32K长文模型。在各种 benchmark 上达到绝对领先的水平,复杂指令和推理,具备复杂数学能力,支持 functioncall,在多语言翻译、金融法律医疗等领域应用重点优化。 | / | 最大输入28k 最大输出4k。 |
hunyuan-standard | 采用更优的路由策略,同时缓解了负载均衡和专家趋同的问题。长文方面,大海捞针指标达到99.9%。 MOE-32K性价比相对更高,在平衡效果、价格的同时,可对实现对长文本输入的处理。 MOE-256K在长度和效果上进一步突破,极大的扩展了可输入长度。 | hunyuan-standard-32K (默认) | 最大输入30k 最大输出2k。 |
? | ? | hunyuan-standard-256K | 最大输入250k
最大输出6k |
hunyuan-lite | 效果、推理性能、成本控制相对平衡。在中文 NLP、英文 NLP、代码、数学等方向显著优于同等规模开源模型。 | / | 最大输入3k 最大输出1k。 |
?