엔비디아 오픈 소스 3400억 매개변수 모델 Nemotron-4 340B
宠着祖宗
发表于 2024-6-15 16:13:58
1467
0
0
6월 14일 (현지 시간) 엔비디아 오픈 소스 Nemotron-4 340B (3400억 매개변수) 시리즈 모델.엔비디아에 따르면 개발자는 의료, 금융, 제조, 소매 및 기타 산업의 상업 응용을 위해 대형 언어 모델 (LLM) 을 훈련하기 위해 이 시리즈 모델을 사용하여 합성 데이터를 생성 할 수 있습니다.
Nemotron-4 340B에는 기본 모델 Base, 명령 모델 Instruct 및 보상 모델 Reward가 포함됩니다.엔비디아는 9조 개의 토큰(텍스트 단위)을 사용해 훈련했다.Nemotron-4 340B-Base는 ARC-c, MMLU 및 BBH 벤치마크 테스트와 같은 상식적 추론 작업에서 Llama-3 70B, Mixtral 8x22B 및 Qwen-2 72B 모델에 필적할 수 있습니다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 엔비디아, 비나지!기관: AI 수요가 반도체 관련 장비 구매를 지속적으로 견인할 것
- 엔비디아, Q4에서 블랙웰 AI GPU 45만개 생산 예상
- 바이두 심떨림: 10만 카드 계산력 클러스터를 대상으로 계산 플랫폼 능력 문심 대모델 하루 조정량 7억 회 초과
- 메타, 메가톤급 신제품 발표: 299달러 Quest 3S 헤드, AR 안경 프로토타입, 다중모드 AI 모델
- 글로벌 시장: 미국 주식 3대 지수 집단 상승 납지 2% 이상 상승 엔비디아 주가 8% 이상 상승
- 가격 인상은 불가피하다!RTX 5090, 5080 규격 완전 노출: 엔비디아 억지로 격차 벌려
- "AI 요주"초마이크로컴퓨터 재무위험 주목,"심층바인딩"엔비디아
- 바이두 월드 2024는 11월 12일에 열릴 문심 대형 모델의 하루 평균 호출량이 이미 7억 건을 초과했다
- 포드 CEO는"지루한"모델 제조에 싫증이 났고, 개성화와 전동화 제품은"새로운 기쁨"이 되었다
- 한국 인터넷 거물 카카오: 다음 달 엔비디아와 AI 협력 관계 발표
-
耐克公司上季度销售额不及预期,撤回新财年全年业绩指引。 当地时间10月1日,耐克公司(NYSE:NIKE)发布截至2024年8月31日的2025财年第一财季财务业绩。该季度实现营收116亿美元,不及市场预期,同比下滑 ...
- 覃志辉
- 昨天 19:09
- 支持
- 反对
- 回复
- 收藏
-
10月1日,国内造车新势力纷纷公布2024年9月交付数据。 据蔚来汽车公告,2024年9月交付汽车21,181辆,同比增长35.4%。截至2024年9月的三个月,交付了汽车61,855辆,同比增长11.6%。截至2024年9月30日,全年 ...
- hzhik
- 前天 19:12
- 支持
- 反对
- 回复
- 收藏
-
纳斯达克中国金龙指数收涨4.94%,热门中概股大涨,哔哩哔哩涨超10%。
- 3215779
- 3 小时前
- 支持
- 反对
- 回复
- 收藏
-
据央视新闻,当地时间9月30日,美国国家运输安全委员会表示,超过40家外国航司正在使用的波音737飞机的方向陀控制系统可能有潜在安全风险。 美国家运输安全委员会透露,该部门已获悉有两家外国运营商在201 ...
- shenhancz
- 前天 10:22
- 支持
- 反对
- 回复
- 收藏