(网经社讯)12月25日消息,近日,国内首个官方“大模型标准符合性评测”结果公布,阿里云通义千问大模型成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。本次通过评测的首批大模型中,通义千问是唯一的开源模型。
据网经社云计算台(CC.100EC.CN)获悉,“大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的38项具体评测维度,是基于官方大模型测试基准的权威评测。
阿里云通义千问在全球拥有广泛的开发者用户和企业客户,其性能表现及安全性得到了大范围的公开检验。12月1日开源后,通义千问72B在10个权威基准评测中创下开源模型最优成绩,并力压Llama2登顶海外最具权威性的HuggingFace排行榜,此后又登上国内上海人工智能实验室OpenCompass榜首。
目前,通义千问APP可在苹果和安卓各大应用商店中下载,提供文本对话、语音对话、文学分析、外语及文言文翻译、PPT大纲助手、小红书文案等几十项实用功能。
阿里云是国内最早开源自研大模型的科技企业,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。本月初,阿里云还举办了通义千问发布会,开源通义千问720亿参数模型Qwen-72B。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
截至目前,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。