首页 신문 正文

황인훈 최신 강연, 엔비디아 칩 업그레이드 계획 GPU 1년 1경 발표

茉莉707
187 0 0

북경시간으로 6월 2일 저녁, 대북국제컴퓨터전 (Computex) 개막전야에 엔비디아 창시자 겸 CEO 황인훈은"새로운 산업혁명을 열어나가자"는 주제연설을 진행했다.그는 두 시간 동안'GPU 가속 AI 컴퓨팅 혁명'및'AI 공장'에 대한 자신의 이해를 상세히 설명했다.
그는 6500명의 관중을 상대로 무대 위에서 이 회사의 최강 성능 제품인 GB200 마더보드를 공개적으로 선보였다.이 마더보드는 Blackwell B200 GPU 칩 2개, Grauce CPU 칩 1개를 탑재하여 커넥티드 기술을 통해 하나로 조합됩니다.이 제품이 처음 선보인 것은 지난 3월 엔비디아 GTC 컨퍼런스에서다.황인훈에 따르면 블랙웰 제품은 전면 생산에 들어갔으며 내년에도 강화된 블랙웰 울트라 AI 칩을 계속 출시할 예정이다.
황인훈은 CPU 확장 속도가 둔화됨에 따라 결국 기본적으로 중단될 것이지만, 처리해야 할 데이터는 계속 기하급수적으로 증가하여 결국 컴퓨팅 팽창과 컴퓨팅 비용의 향상을 초래할 것이라고 주장했다.
GPU는 이 모든 것을 바꾸는 열쇠가 될 것이다.엔비디아가 2016년 발표한 Pascal GPU에 비해 Blackwell GPU의 컴퓨팅 능력 (인공지능 부동 소수점 연산 능력에 대응) 은 1000배 증가해 거의"최적의 시기에 무어의 법칙이 성장하는 것을 넘어섰다"고 말했다.
컴퓨팅 성능이 향상되는 반면 비용은 계속 감소하고 있습니다.원래 Pascal 제품을 사용하여 GPT-4 모델을 훈련하면 최대 1000 기가와트시 (1 기가와트시는 1 백만 킬로와트시) 의 에너지를 소비하고 Blackwell 제품을 이용하면 3 기가와트시밖에 걸리지 않습니다.
황인훈이 일관되게 견지하는"많이 살수록 더 많이 절약한다"는 말에 따르면 GPU와 CPU를 조합하여 100배에 달하는 가속계산을 실현함과 동시에 전력소비량은 3배밖에 증가되지 않았다. 환산하면 평균단위성능은 단독으로 CPU를 사용하는 것보다 25배 제고되여 에너지절약과 원가절감의 효과를 뚜렷이 거두었다.
강연 도중 황인훈은 몸집이 더 큰 DGX 서버를 직접 옮기기도 했다.이 서버에는 8개의 Blackwell GPU가 연결되어 있으며 공기 냉각 기술로 열을 방출합니다.현재 전 세계에서 사재기하고 있는 AI 서버는 모두 이 제품을 사용하고 있으며, 각 빅데이터센터의 핵심 설비이기도 하다.
황인훈의 구상에 따르면 인공지능 모델이 계속 확대되면서 GPU 성능에 대한 요구도 높아질 것으로 보인다. 기존 데이터센터는'AI 공장'으로 진화할 것이고, 공장의 초석은 슈퍼 GPU다.
"슈퍼 GPU"는 주로 상호 연결화, 클러스터화 노선을 걷고 있으며, 엔비디아의 NVLink 상호 연결 기술을 통해 점점 더 많은 GPU를 연결하여 단일하고 초대형 GPU를 구성한다.현장에 전시된 MGX 데이터센터 방안에는'슈퍼 GPU'하나가 총 72개의 GPU를 수용해 9배 성능 향상을 이루지만 출력은 10배 증가에 그쳐 수십조 원에 달하는 AI 대언어 모델을 수용할 수 있다.황인훈은 이런 슈퍼 GPU가"GPU의 진정한 형태"라고 생각한다.
이에 따르면 수많은 블랙웰 시스템 클러스터로 구성된'AI 공장'은 농구장 하나보다 더 넓은 3만2천개의 GPU를 포함하고 있다.
이번 강연에서 황인훈은 또 엔비디아칩제품의 년도승격로선도를 중점적으로 소개했는데 회사는 앞으로"1년에 한번씩 새로운 구조를 교체"하는 로선을 견지하여 무어의 법칙을 타파하게 되는데 이전에는 일반적으로 2년마다 세대를 갱신하였다.매년 반복되는 새로운 아키텍처는 전체 데이터 센터 GPU 제품군에도 적용됩니다.
차세대 GPU, CPU 아키텍처의 이름도 처음으로 외부에 공개했다.차세대 CPU는'베라', GPU는'루빈'으로 우주 암흑물질 연구의 선구자인 미국의 여성 천문학자 베라 루빈에서 영감을 받아 명명됐다.
이미 한 달 전 업계에서는 엔비디아의 차세대 R 시리즈 AI 칩이 TSMC 3나노 공정을 채택하고 CoWoS-L 패키징 기술을 사용해 차세대 HBM4 고대역폭 메모리 기술을 탑재해 2025년 4분기에 대규모 생산이 가능할 것이라는 폭로가 나왔다.
또한 황인훈은 이번 강연에서 기업이 AI 대형 모델을 배치할 수 있도록 돕는 NIM 클라우드 네이티브 마이크로서비스, AI를 위한 신형 이더넷 Spectrum-X, 엔비디아가 개발한 로봇 기술 플랫폼 Isaac 등 엔비디아의 일련의 신제품 서비스의 착지 상황을 소개했다.
이 CEO도 특히 인공지능과 로봇의 결합을 언급하며 로봇 기술의 응용이 인간형 로봇에 그치지 않을 것이라며"기계화가 일상화될 것이며 공장은 전면적으로 자동화될 것이며 로봇은 협동하여 일련의 기계화 제품을 만들 것"이라고 말했다."
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   2024世界人工智能大会,“首次亮相”、“新品发布”成为很多厂商的重要布局。   7月4日,网易多款AI新品首次亮相世界人工智能大会,并发布首个机器人品牌“灵动”。网易灵动是网易伏羲基于自研工业大模型和A ...
    cristianna
    昨天 15:04
    支持
    反对
    回复
    收藏
  •   百度董事长兼CEO李彦宏还记得自己第一次来参加世界人工智能大会(WAIC)是在2022年,那一次大会的主题和元宇宙相关,主办方传话给他,希望他讲一讲元宇宙。他回:“我说我还是讲AI吧,我讲不了元宇宙”。当时, ...
    niemiao
    前天 16:46
    支持
    反对
    回复
    收藏
  •   北京少有的一个阴雨绵绵的早晨,灰色天空给理想纯电车生产基地蒙上一层不同寻常的寂静。这座维持了两个多月喧嚣的新汽车工厂放缓了生产节奏;工人们开始每周只上一天班;正在产线上试制下一款纯电车的理想研发员 ...
    cvpanjun
    前天 15:46
    支持
    反对
    回复
    收藏
  •   据报道,英伟达首席执行官黄仁勋(Jensen Huang)6月份减持了价值近1.69亿美元的该公司股票,这也是他单月减持最多的一次。市场对用于驱动人工智能(AI)的芯片的巨大需求推动英伟达股价再创新高。   美国证 ...
    moshulong
    前天 10:52
    支持
    反对
    回复
    收藏
茉莉707 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    33