阿里云开源Qwen2.5-Omni-7B,小尺寸全模态大模型手机也能轻松运行!

   发布时间:2025-03-27 15:51 作者:沈如风

阿里云近日宣布了一项重大技术突破,正式向公众开源了其通义系列中的首款全模态大模型——Qwen2.5-Omni-7B。

这款模型的最大亮点在于其端到端的处理能力,能够同时应对文本、图像、音频和视频等多种形式的输入,并即时生成文本输出与自然语音合成。这意味着,无论是文字对话、图像识别,还是语音交互,Qwen2.5-Omni-7B都能轻松应对。

在业界权威的多模态融合任务OmniBench的测评中,Qwen2.5-Omni展现出了非凡的实力,刷新了多项纪录,全面超越了包括谷歌Gemini-1.5-Pro在内的同类模型。这一成就不仅彰显了阿里云在人工智能领域的深厚积累,更为全球AI技术的发展树立了新的标杆。

Qwen2.5-Omni-7B的开源,使得全模态大模型在产业中的广泛应用成为可能。相较于那些拥有数千亿参数的闭源大模型,Qwen2.5-Omni-7B以仅7B的参数规模,实现了高效能与低门槛的完美结合。这意味着,即便是在资源有限的设备上,如智能手机,也能轻松部署和应用这款模型。

阿里云表示,自2023年以来,通义团队已陆续开发出覆盖0.5B至110B等多种参数规模的全尺寸大模型,涵盖了文本生成、视觉理解与生成、语音理解与生成以及文生图与视频模型等全模态领域。Qwen2.5-Omni-7B的开源,正是这一系列成果的集中体现。

目前,Qwen2.5-Omni已在多个平台同步开源,包括魔搭社区、Hugging Face以及GitHub上的QwenLM仓库。用户可以通过这些平台轻松获取模型,并在Qwen Chat上直接体验其强大的功能。

此次开源行动,不仅为开发者提供了丰富的资源和工具,更将推动人工智能技术在更广泛的领域得到应用和发展。阿里云以其开放的态度和强大的技术实力,为全球AI技术的创新和发展注入了新的活力。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群