엔비디아 재보 전 정밀 저격?이 유니콘은 AI 추리에 강하게 진출하여 HBM을 사용하지 않고 세계에서 가장 빨리 할 수 있다
茉莉707
发表于 2024-8-28 15:16:12
199
0
0
현지시간으로 수요일 장세후 엔비디아는 곧 전반 2급시장의 마지막 중량2계보를 발표하게 되는데 이로 하여 글로벌투자자들은 고도로 긴장하고있다.그리고 바로 전날 (현지 시간 8월 27일), 미국의 인공지능 프로세서 칩인 유니콘 Cerebras Systems는 자사의 칩 컴퓨팅 시스템을 기반으로 세계에서 가장 빠른 속도로 알려진 AI 추리 서비스를 발표하여 엔비디아 H100 GPU를 사용하여 구축한 시스템보다 10~20배 빠르다고 주장했다.
현재 엔비디아 GPU는 AI 훈련과 추리 두 방면에서 모두 시장 주도적 지위를 차지하고 있다.Cerebras는 2019년 첫 AI 칩을 출시한 이래 AI 칩과 컴퓨팅 시스템 판매에 집중하며 AI 훈련 분야에서 엔비디아에 도전하는 데 주력해 왔다.
미국 과학기술매체 더 인포메이션에 따르면 OpenAI는 AI 추리 서비스 덕분에 올해 34억 달러의 수입을 올릴 것으로 예상된다.AI 추리의 케이크가 이렇게 큰 이상 Cerebras 공동창업자 겸 최고경영자 앤드루 펠드먼은 Cerebras도 AI 시장에서 한 자리를 차지해야 한다고 말했다.
Cerebras의 이번 AI 추리 서비스 출시는 AI 칩과 컴퓨팅 시스템 외에 사용량에 기반한 두 번째 수입 곡선을 열었을 뿐만 아니라 엔비디아에 대한 전면적인 공격을 개시했다."엔비디아로부터 그들을 화나게 하기에 충분한 시장 점유율을 빼앗았다."라고 펠드먼이 말했다.
빠르고 싸다
Cerebras의 AI 추론 서비스는 속도와 비용 모두에서 상당한 이점을 보여줍니다.펠드먼에 따르면 초당 출력할 수 있는 토큰의 수로 따지면 Cerebras의 AI 추리 속도는 마이크로소프트 애저, 아마존 AWS 등 클라우드 서비스 업체가 운영하는 AI 추리 서비스의 20배에 달한다.
펠드먼은 발표회 현장에서 Cerebras와 아마존 AWS의 AI 추리 서비스를 동시에 시작했다. Cerebras는 순식간에 추리 작업을 완료하고 출력할 수 있다. 처리 속도는 초당 1832개의 tokens에 달한다. AWS는 초당 93개의 tokens에 불과하다.
펠드먼에 따르면 더 빠른 추리 속도는 실시간 대화형 음성 응답을 실현하거나 여러 차례의 결과, 더 많은 외부 출처, 더 긴 문서를 호출함으로써 더 정확하고 더 관련된 대답을 얻을 수 있어 AI 추리에 질적인 비약을 가져올 수 있다는 것을 의미한다.
Cerebras는 속도 이점 외에도 상당한 비용 이점을 가지고 있습니다.페어드먼은 Cerebras의 AI 추론 서비스성 가격이 AWS 등의 100배에 이른다고 밝혔다.메타를 실행하는 Llama 3.1 70B 오픈 소스 대형 언어 모델의 경우 이 서비스의 가격은 토큰당 60센트에 불과하지만 일반 클라우드 서비스 업체가 제공하는 동일한 서비스는 토큰당 2.90달러이다.
현재 최대 GPU 면적의 56배
Cerebras의 AI 추론 서비스가 빠르고 저렴한 이유는 WSE-3 칩의 설계에 있습니다.이것은 Cerebras가 올해 3 월에 출시 한 3 세대 프로세서 칩으로, 12 인치 반도체 웨이퍼의 표면 전체에 거의 해당하거나 책 한 권보다 더 크며 단일 면적은 약 462.25 평방 센티미터에 달하는 거대한 크기입니다.현재 최대 GPU 면적의 56배입니다.
WSE-3 칩은 엔비디아처럼 인터페이스를 통해 연결해야 액세스할 수 있는 독립형 고대역폭 메모리(HBM)를 채택하지 않았다.대신, 메모리를 칩에 직접 내장합니다.
칩 크기 덕분에 WSE-3의 슬라이스 메모리 (On-chip memory) 는 44G로 엔비디아 H100의 거의 900배, 메모리 대역폭은 엔비디아 H100의 7000배에 이른다.
펠드먼은 메모리 대역폭이 언어 모델의 추론 성능을 제한하는 근본적인 요소라고 말했다.Cerebras는 논리와 메모리를 하나의 거대한 칩에 통합하여 거대한 슬라이스 메모리와 매우 높은 메모리 대역폭을 가지고 있어 데이터를 신속하게 처리하고 추리 결과를 낼 수 있다."이것은 GPU가 도달할 수 없는 속도입니다."
속도와 비용 우위 외에도 WSE-3 칩은 AI 훈련과 추리 양면수로 각종 AI 임무를 처리할 때 탁월한 성능을 자랑한다.
계획에 따르면 Cerebras는 여러 장소에 AI 추리 데이터 센터를 구축하고 요청 횟수에 따라 추리 능력을 유료로 부과할 예정이다.이와 함께 Cerebras는 WSE-3 기반 CS-3 컴퓨팅 시스템을 클라우드 서비스 업체에 판매하려고 시도할 예정이다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 엔비디아 수요가 너무 많다고요?SK하이닉스: 황인훈 HBM4 칩 6개월 조기 납품 요청!
- 엔비디아는 머스크의 xAI 평가액이 400억 달러에 달하는 투자를 고려하고 있다
- 미국 주식 거래액 상위 20: 트럼프 미디어 테크놀로지 그룹의 주가는 12% 급등했습니다.엔비디아는 장중 한때 세계에서 시가총액이 가장 높은 회사가 되었다
- 엔비디아, 애플 제치고 세계 시가총액 최대 회사
- 엔비디아, TSMC 3nm 및 CoWoS 가격 인상 동의
- AI 칩 거물인 엔비디아의 시가총액이 애플 TSMC를 앞질렀고, 이전에 AI 수요는"이제 막 시작되었다"고 말했다
- 엔비디아, TSMC 가격 인상 동의: 3nm 5%, CoWoS 20% 상승
- 어느 요괴가 그렇게 사나운가?세계 시가총액 1위에 복귀한 엔비디아는 상승폭 순위에서 추월당했다
- 엔비디아, 클라우드 게임 GeForce Now 서비스 요금 조정
- 엔비디아, 전 NASA 우주센터 소장을 이사회 멤버로 임명
-
随着“银十”结束,各家造车新势力都交出了一份亮眼的成绩单。 理想领跑10月新势力交付榜,鸿蒙智行重回4万辆,零跑、深蓝、极氪、小鹏等单月交付量均创新高,岚图、阿维塔、智己等实现破万,但哪吒却消失在 ...
- fanadam
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
为期超七周的大罢工终于落下帷幕。 当地时间11月4日,波音美国西海岸工厂工人们就改进后的合同提案投票。 随后,代表着波音超过33000名西雅图地区机械师的IAM工会经表决,以59%的同意票决定接纳波音提 ...
- cristianna
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
“新四化”的时代浪潮下,新能源汽车行业百家争鸣。伴随着自主品牌不断崛起,合资品牌当下的生存状况备受外界关注,如何打好电动化时代的突围战,成为合资品牌的新课题。 作为国内合资车企的代表之一,上汽 ...
- mbgg2797
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
证券时报网讯,热门中概股美股盘前普涨,小鹏汽车、哔哩哔哩涨近5%,蔚来涨超4%,阿里巴巴、拼多多涨超2%。
- p609520
- 3 天前
- 支持
- 反对
- 回复
- 收藏