阿里通义千问站上全球开源模型榜首,杭州公司包揽前三 · 科技

Thomas 15 0

通义千问的Qwen2.5-Omni能同时处理文本、图像、音频和视频等多种输入,并能实时输出文本,进行自然语音合成。在多模态融合任务OmniBench等测评中,它的性能表现刷新业界纪录。

与那些参数动辄数千亿的闭源大模型不同,Qwen2.5-Omni参数规模仅为7B,尺寸小巧,这使得全模态大模型在端侧设备和产业场景中的广泛部署成为可能。

自发布以来,该模型迅速在全球开发者和企业中掀起下载和部署的热潮,加速了更多智能应用的落地。截至目前,阿里已向全球开源200多款模型,千问衍生模型数量突破10万,超越美国Llama系列,成为全球最大的开源模型族群。

位居第二的DeepSeek-V3-0324,同样有着不错的表现。它在理解复杂指令、逻辑推理以及知识运用等方面较为突出,还针对中文搜索、写作能力以及前端代码生成任务等进行了优化。在此次登上全球开源模型总榜前三之前,DeepSeek-V3已经在AI圈内名声大噪,吸引了众多开发者和研究人员的关注。

排名第三的SpatialLM-Llama-1B,是群核科技自主研发的空间理解模型。群核科技由黄晓煌、陈航和朱皓于2011年在杭州创办,三人具有浙大、清华等背景。

SpatialLM-Llama-1B克服了对物理世界几何与空间关系理解的局限。例如该模型通过一段视频,可生成符合物理规律的3D场景布局,有望为建筑设计、室内装修、虚拟场景搭建等领域带来改变。

事实上,2月Hugging Face发布的开源大模型榜单,排名前十的均为基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。在Hugging Face 2024年的开源模型下载中,Qwen模型系列中的Qwen2.5-1.5B-Instruct下载量占总下载量的26.6%,是全球下载量最高的开源模型之一。

Hugging Face作为全球最大的AI开源社区,成立于2016年,专注于NLP(自然语言处理)技术,总部位于美国纽约。其发布的榜单测试维度覆盖阅读理解、逻辑推理、数学计算、事实问答等多个方面,是衡量开源模型性能的重要参考。

对于开源模型的发展态势,零一万物创始人李开复近日在接受

在李开复看来,全世界每家大模型公司现在只会焦虑自己是否过度依赖闭源模型。相反,主动拥抱DeepSeek等开源模型,尽早做出差异化打法的公司,可以每天睡得很安稳。

此次杭州公司包揽全球开源模型榜单前三,在证明自身技术实力与创新能力之时,也有助于吸引更多人才与资源,从而推动中国AI产业竞争格局朝着更加多元化、创新化的方向发展。

  • 评论列表

留言评论