通义千问开源320亿参数模型 已实现7款大语言模型全开源
今早我梦醒了坎
发表于 2024-4-7 17:04:47
167
0
0
通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。
基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。
Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。
多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- AI周报|OpenAI公开反对AI大模型监管法案;AMD拟49亿美元收购服务器厂商
- 美韩监管机构要求英伟达披露关键业务细节,包括GPU供应与基础模型合作
- 小鹏“更名”后二家公司又同日发布端到端大模型 高阶智驾AI时代提前到来?
- 黄仁勋预言步入现实 谷歌展示实时游戏生成AI模型GameNGen
- 亚马逊新版Alexa据悉将主要由Anthropic的AI模型提供支持
- 开源证券:关注苹果、Meta9月新品发布 继续布局AI
- 百度推出新搜索文小言 免费开放文心4.0大模型能力
- 文心一言App更名文小言,9月文心4.0大模型免费用
- 百度推新搜索文小言 用户9月可免费体验文心大模型4.0
- OpenAI商用订阅用户数突破100万 新模型传出惊人涨价传言
-
过去一周的时间里,有关苹果微信“二选一”的话题持续霸占各个平台热搜,甚至有媒体还在微博发起了“如果苹果微信二选一,你选择iPhone还是微信?”的投票,当然结果是微信取得了压倒性的胜利。 从最新的 ...
- lub_pig
- 前天 17:05
- 支持
- 反对
- 回复
- 收藏
-
今日,特斯拉AI团队发布产品路线图,其中,预计2025年第一季度在中国和欧洲推出完全自动驾驶(FSD),但仍有待监管批准。 自2016年以来,马斯克一直在探索特斯拉的FSD自动驾驶方案。2024年,特斯拉FSD V12 ...
- seisei
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
【全球市场】1、道指跌0.54%,纳指涨0.25%,标普跌0.30%。2、特斯拉涨近5%,亚马逊涨超2%。3、纳斯达克中国金龙指数涨0.88%,蔚来涨超14%。
- wishii
- 前天 22:03
- 支持
- 反对
- 回复
- 收藏
-
【ASML CEO回应对华出口限制:会有更多应对措施】当地时间9月4日,荷兰计算机芯片设备供应商ASML首席执行官Christophe Fouquet在花旗银行的一场会议上表示,美国限制ASML对华出口是出于“经济动机”。他预计该公司应 ...
- mbgg2797
- 3 天前
- 支持
- 反对
- 回复
- 收藏