站内搜索 | 手机版

智快网 - 新科技与新能源行业网络媒体

当前位置：智快网 > 快讯 > 正文内容

腾讯推出业界最大规模MoE大语言模型Hunyuan-large：总参数389B领先行业

发布时间：2024-11-05 17:19 来源：ITBEAR 作者：顾雨柔

腾讯近日揭晓了旗下全新的开源MoE大语言模型——Hunyuan-Large，该模型凭借业界领先的参数规模和卓越性能，一举成为行业焦点。

据悉，Hunyuan-large不仅在参数数量上达到了惊人的389B，同时其激活参数也高达52B，训练token数量更是攀升至7T。这一系列的数字背后，代表着该模型在处理长文本上下文时的强大能力，其最大上下文长度支持到256K，词表大小扩展至12.8w，为长文本任务的高效完成提供了坚实的技术支撑。

在技术创新层面，Hunyuan-large展现了其独特的魅力。通过巧妙地运用高质量的合成数据，该模型成功强化了训练过程，有效弥补了自然数据的不足之处。这一创新举措不仅提升了模型的训练效率，更进一步保证了其在处理复杂任务时的准确性和稳定性。

Hunyuan-large在多学科综合评测集上展现了卓越的性能。无论是在CMMLU、MMLU，还是在CEva1、MATH等评测集上，该模型均取得了令人瞩目的成绩。其在中英文自然语言处理、代码生成以及数学运算等九大能力维度上全面领先，甚至超越了Llama3.1和Mixtral等业内知名的一流开源模型。

为了进一步推动长文本处理技术的发展，腾讯还宣布将推出自研的长文评测集——“企鹅卷轴（PenguinScrolls）”。这一评测集的推出，旨在填补当前行业在真实长文评测方面的空白，为相关技术的研发和应用提供更为全面、客观的评估标准。

“企鹅卷轴”基于公开的金融、法律、学术论文等长文本构建而成，文本长度覆盖从1K到128K的广泛范围。这一设计使得该评测集能够全面覆盖深度阅读理解和长文推理等关键任务，为相关技术的深入研究和应用提供了宝贵的资源。

更多>同类内容

苹果新品消息：2025款iPad Air或将升级至90Hz LCD面板

11-05

腾讯发布Hunyuan-Large大模型：389B总参数与52B激活参数，业界领先！

11-05

广州市出台新规：智能网联汽车基础地图审核制度迎创新！

11-05

惠普发布战系列激光打印机：专为中国市场打造，支持原生鸿蒙系统

11-05

真我GT7 Pro革新游戏体验：首发搭载RichTap®AI振动算法，热门手游绝区零率先适配

11-05

一加Ace 5系列配置曝光：骁龙8至尊版引领性价比新风暴！

11-05

Anthropic发布Claude 3.5 Haiku模型：定价每百万tokens输入1美元、输出5美元

11-05

重庆定下新目标：到2027年机器人全面融入经济社会各领域！

11-05

索尼PS5 Pro首发大作云集：《战神》等11款第一方游戏亮相，共支持55款游戏！

11-05

昆仑万维天工AI搜索大升级：全面提升多层次分析推理能力

11-05

科赋新品URBANE V RGB DDR5内存亮相：双束导光设计，速度高达8400MT/s！

11-05

微星联手金士顿，DDR5内存超频新纪录诞生：12196 MT/s！

11-05

苹果筹备低价版Vision Pro头显：两种彩色滤光片方案浮出水面

11-05

华为新动向：注册“鸿蒙智行猫头鹰”商标，问界M9或率先应用？

11-05

微软XGP本月游戏更新：6款离库，多款中文新游入库！

11-05

点击查看更多 +

全站最新

恩智浦2024年第三季度营收32.5亿美元，同比下滑5%，股价盘后下跌5.55%

恩智浦2024年第三季度营收32.5亿美元，同比下滑5%，股价盘后下跌5.55%

大疆新款FPV头显Goggles N3宣传图曝光，单独购买仅需约2079元！

大疆新款FPV头显Goggles N3宣传图曝光，单独购买仅需约2079元！

苹果新品消息：2025款iPad Air或将升级至90Hz LCD面板

苹果新品消息：2025款iPad Air或将升级至90Hz LCD面板

苹果官网新上架：适用于Vision Pro的贝尔金头带，仅需399元！

苹果官网新上架：适用于Vision Pro的贝尔金头带，仅需399元！

富士康母公司鸿海营收再创新高，10月达8048.48亿新台币，同比增长8.59%

富士康母公司鸿海营收再创新高，10月达8048.48亿新台币，同比增长8.59%

俄罗斯成功实现“一箭55星”发射，所有卫星顺利进入预定轨道

俄罗斯成功实现“一箭55星”发射，所有卫星顺利进入预定轨道

三星Galaxy S25+搭载Exynos 2500芯片，性能如何？Geekbench 6跑分揭晓

三星Galaxy S25+搭载Exynos 2500芯片，性能如何？Geekbench 6跑分揭晓

腾讯发布Hunyuan-Large大模型：389B总参数与52B激活参数，业界领先！

腾讯发布Hunyuan-Large大模型：389B总参数与52B激活参数，业界领先！

热门内容

本栏最新

腾讯推出业界最大规模MoE大语言模型Hunyuan-large：总参数389B领先行业

腾讯推出业界最大规模MoE大语言模型Hunyuan-large：总参数389B领先行业

苹果新品消息：2025款iPad Air或将升级至90Hz LCD面板

苹果新品消息：2025款iPad Air或将升级至90Hz LCD面板

腾讯发布Hunyuan-Large大模型：389B总参数与52B激活参数，业界领先！

腾讯发布Hunyuan-Large大模型：389B总参数与52B激活参数，业界领先！

广州市出台新规：智能网联汽车基础地图审核制度迎创新！

广州市出台新规：智能网联汽车基础地图审核制度迎创新！

惠普发布战系列激光打印机：专为中国市场打造，支持原生鸿蒙系统

惠普发布战系列激光打印机：专为中国市场打造，支持原生鸿蒙系统

真我GT7 Pro革新游戏体验：首发搭载RichTap®AI振动算法，热门手游绝区零率先适配

真我GT7 Pro革新游戏体验：首发搭载RichTap®AI振动算法，热门手游绝区零率先适配

一加Ace 5系列配置曝光：骁龙8至尊版引领性价比新风暴！

一加Ace 5系列配置曝光：骁龙8至尊版引领性价比新风暴！

Anthropic发布Claude 3.5 Haiku模型：定价每百万tokens输入1美元、输出5美元

Anthropic发布Claude 3.5 Haiku模型：定价每百万tokens输入1美元、输出5美元

智快实验室评测约稿合作邮箱：z@zhikuai.com 腾讯QQ:642361(注明:智快网) 简体繁体根据客户端智慧切换，如显示有问题，请点击页面右上角的简繁切换功能！
Copyright © 2016-2021 zhikuai.com All rights reserved. 鲁ICP备20033456号

ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群