首页 报纸 正文

通義千問初の千億パラメータモデルが来た

jerry_Huang
4341 0 0

「アリ通義千問」ウィーチャット公式アカウント4月28日によると、通義千問は初めて千億級パラメータモデルQwen 1.5-110 Bを発売した。紹介によると、Qwen 1.5-110 Bの基礎能力はMeta-Lama-3-70 Bに匹敵し、Qwen 1.5シリーズの中で最大規模のモデルであり、同シリーズの中で初めて1000億を超えるパラメータを持つモデルでもある。
研究チームの評価によると、MMLU、GSM 8 K、MATH、HumanEvalなどのベンチマークテストでは、Qwen 1.5-110 Bモデルが3つの中で最も優れていることが分かった。TheoremQA、ARC-C、MBPPなどの評価では、Qwen 1.5-110 BモデルはLlama-3-70 Bより優れている。
「アリ通義千問」ウィーチャット公式アカウント

また、研究チームがChatモデルを評価したところ、MT-BenchとAlpacaEval 2.0におけるQwen 1.5-110 B-Chatモデルの表現を比較した。その結果、Qwen 1.5-110 B-Chatモデルは、先に発表されたQwem 1.5-72 B-Chatモデルよりも明らかに優れていることが明らかになった。
「アリ通義千問」ウィーチャット公式アカウント

今年に入ってから、通義千問チームは最新のオープンソースモデルシリーズQwen 1.5を発売し、その後3ヶ月足らずで8種類の大言語モデルを連続的に発売した。これまでのモデルパラメータ規模は5億、18億、40億、70億、140億、320億、720億だったが、今回のQwen 1.5-110 Bのパラメータ規模は1100億に達した。現在、通義千問のオープンソースモデルのダウンロード数は700万を超えているという。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
    caffycat
    昨天 11:18
    支持
    反对
    回复
    收藏
  •   每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
    star8699
    3 天前
    支持
    反对
    回复
    收藏
  •   上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
    goodfriendboy
    3 天前
    支持
    反对
    回复
    收藏
  •   人民网北京11月22日电 (记者栗翘楚、任妍)2024广州车展,在新能源汽车占据“半壁江山”的同时,正加速向智能网联新能源汽车全面过渡,随着“端到端”成为新宠,智能驾驶解决方案成为本届广州车展各大车企竞 ...
    3233340
    昨天 17:06
    支持
    反对
    回复
    收藏
jerry_Huang 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    0