腾讯近日揭晓了旗下全新的开源MoE大语言模型——Hunyuan-Large,该模型凭借业界领先的参数规模和卓越性能,一举成为行业焦点。
据悉,Hunyuan-large不仅在参数数量上达到了惊人的389B,同时其激活参数也高达52B,训练token数量更是攀升至7T。这一系列的数字背后,代表着该模型在处理长文本上下文时的强大能力,其最大上下文长度支持到256K,词表大小扩展至12.8w,为长文本任务的高效完成提供了坚实的技术支撑。
在技术创新层面,Hunyuan-large展现了其独特的魅力。通过巧妙地运用高质量的合成数据,该模型成功强化了训练过程,有效弥补了自然数据的不足之处。这一创新举措不仅提升了模型的训练效率,更进一步保证了其在处理复杂任务时的准确性和稳定性。
Hunyuan-large在多学科综合评测集上展现了卓越的性能。无论是在CMMLU、MMLU,还是在CEva1、MATH等评测集上,该模型均取得了令人瞩目的成绩。其在中英文自然语言处理、代码生成以及数学运算等九大能力维度上全面领先,甚至超越了Llama3.1和Mixtral等业内知名的一流开源模型。
为了进一步推动长文本处理技术的发展,腾讯还宣布将推出自研的长文评测集——“企鹅卷轴(PenguinScrolls)”。这一评测集的推出,旨在填补当前行业在真实长文评测方面的空白,为相关技术的研发和应用提供更为全面、客观的评估标准。
“企鹅卷轴”基于公开的金融、法律、学术论文等长文本构建而成,文本长度覆盖从1K到128K的广泛范围。这一设计使得该评测集能够全面覆盖深度阅读理解和长文推理等关键任务,为相关技术的深入研究和应用提供了宝贵的资源。