DeepSeek V3和R1模型与海光DCU完成国产化适配,正式启用!

   发布时间:2025-02-05 02:12 作者:顾青青

近日,中科曙光国家先进计算产业创新中心有限公司传来喜讯,其海光信息技术团队宣布,已成功实现DeepSeek V3与R1模型与海光DCU(深度计算单元)的国产化适配,并正式上线供用户使用。这一消息标志着我国在AI模型与硬件适配领域取得了又一重要进展。

用户现在可以通过访问“光合开发者社区”中的“光源”板块,或登录光源官网搜索“DeepSeek”,轻松下载并部署相关模型。这些模型基于DCU平台,将为用户提供更高效的AI计算体验。

据悉,DeepSeek V3与R1模型均采用了先进的Transformer架构,并融入了Multi-Head Latent Attention(MLA)和DeepSeek MoE两大核心技术。MLA技术通过优化KV缓存,显著降低了内存占用,从而提升了模型的推理效率。而DeepSeek MoE技术则通过引入辅助损失,实现了专家负载的智能平衡,进一步提升了模型的性能表现。

海光信息推出的DCU,作为一款高性能GPGPU架构的AI加速卡,凭借其自主可控的全精度通用AI加速计算解决方案,已在多个领域实现了规模化应用。无论是科教、金融、医疗、政务还是智算中心,DCU都展现出了强大的计算能力和广泛的应用前景。

此次DeepSeek V3与R1模型与DCU的成功适配,不仅为用户提供了更多样化的AI计算选择,也进一步推动了我国在AI领域的技术创新和产业发展。随着AI技术的不断演进和应用场景的不断拓展,相信未来会有更多类似的技术成果涌现,为我国的数字化转型和智能化升级注入新的动力。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群