"오픈 소스"가 아닌 Gemma를 개방하는 구글은 왜 큰 모델 경쟁 전략을 전환합니까?
明绍宗朱聿键鼻
发表于 2024-2-22 16:19:09
244
0
0
미국의 거대 기술 기업인 구글은 대언어 모델 분야에서 OpenAI와 Meta를 지속적으로 공격하고 있다.
2월 21일 저녁, 구글은 차세대 무료 상업용 대언어 모델인 젬마를 전 세계에서 개방하여 사용한다고 발표했다.이 모델은 구글이 자체'최첨단 개방형 모델'로 보고 있다.
이것은 이 회사가 AI 대형 모델을 개방하는 분야에서 한 큰 움직임이다.Tris Warkentin 구글 DeepMind 제품 관리 디렉터는"오픈 모델은 구글에 새로운 기회"라며"커뮤니티와 구글 이외의 사람들과 협력해 AI 개발에 새로운 기회를 만들 수 있다"고 말했다.
라틴어'보석'에서 이름을 얻은 젬마는 텍스트 정보만 처리하는 데 사용되며, 구글의 최강 AI 모델인 젬니와 일치하는 인프라 아키텍처를 가지고 있지만, 20억 매개변수와 70억 매개변수 두 가지 규모의 버전만 있는 작은 매개변수 규모이며, 두 가지 매개변수 규모의 젬마 모델은 모두 사전 훈련과 명령 미세 조정 버전이 있을 것이다.
작은 매개 변수 크기는 Gemma를 보다 광범위하게 배포하는 데 도움이 됩니다.젬마는 메인스트림 AI 프레임워크를 지원하며 노트북, 데스크탑, 사물인터넷, 모바일 기기, 클라우드 등에서도 작동한다고 구글은 설명했다.
이 회사가 발표 한 평가 결과에 따르면 Gemma는 수학, 코딩, 추론 정통성 및 지식 테스트 등 많은 외부 벤치마크 테스트에서 Llama 2 모델보다 우수합니다.Llama 2는 메타가 발표한 최신 오픈 소스 모델로, 70억, 130억, 700억 매개변수의 모델을 포함하고 있다.
특히 구글은 젬마를'오픈 소스'가 아니라 오픈 소스'라고 강조하는데, 이는 젬마의 소스 코드, 훈련 데이터 등 젬마의 다양한 기술 세부 사항을 공유하지 않는다는 것을 의미한다.앱에서 구글은 사용 약관이 모든 조직이 책임감 있게 상용화하고 배포할 수 있도록 허용한다고 밝혔다.
Gemma를 개방하거나 오픈 소스 대형 모델 분야에서 비판받는 부분에 대한 대응.앞서 구글과 오픈AI는 기술 폐쇄를 고수해 외부의 비난을 받았는데, 둘 다 최신, 최첨단 모델에서 모두 폐쇄원을 선택해 기술 진보에 불리한 것으로 여겨졌다.
이에 대해 시나웨이보 신기술 연구개발 책임자 장준림은 젬마는 구글의 대형 모델 전략의 전환을 대표한다-오픈 소스와 오픈 소스를 모두 고려하고, 오픈 소스는 성능이 가장 강력한 소규모 모델을 주력하며, 메타와 미스트랄 (유럽 AI 회사, 미스트랄 7B 오픈 소스 AI 모델 출시) 을 이기기를 희망한다;폐원은 규모가 큰 효과가 가장 좋은 큰 모델을 주력해 가능한 한 빨리 OpenAI를 따라잡으려 한다.
AI 커뮤니티에서 현재 메타의 Llama 2는 가장 강력한 오픈 소스 모델 중 하나였으며, 이 모델 정보와 소스 코드는 무료 상용화를 지원하기 때문에 많은 AI 개발자들의 지원을 받고 있다.
Google은 Gemma를 통해 더 많은 개발자를 Google 클라우드 생태계에 끌어들이기를 희망하는 것이 분명합니다.한편, 젬마는 구글이 자체 개발한 클라우드 AI 칩 TPU를 최적화해 더 나은 효능을 발휘할 수 있다고 주장했다.이와 동시에 구글 클라우드 신규 사용자는 또 300딸라의 클라우드 포인트를 획득하여 젬마를 연구하게 된다.
또한 젬마는 엔비디아 칩에서 실행될 수 있으며, 클라우드 데이터 센터, PC 측면에서 이 모델의 추론 성능을 가속화하기 위해 양측이 협력하여 최적화할 수 있을 것이다.예를 들어 젬마를 엔비디아 GPU를 탑재한 AI PC에 사용하여 로컬 챗봇 소프트웨어를 구동하고 엔비디아의 여러 AI 도구와 통합한다.
OpenAI, 구글, 메타 등 대형 기술 회사들의 대형 모델 전쟁은 갈수록 치열해지고 있다.
구글은 2023년 3월 AI 대화로봇 배드를 출시하고 지난해 5월 최신 폐원 대언어 모델인 PaLM2를 선보였다.지난주, 이 회사는"차세대 AI 대형 모델"인 Gemini 1.5를 관선하면서 여러 면에서 OpenAI의 GPT-4 터보를 추월했다고 밝혔다.메타는 모델 오픈 소스에 열중하며 Llama 2가 가장 유명하다.
최근 OpenAI가 발표한 문생 동영상 모델 Sora는 다시 AI 서클을 폭발시켜 다른 대형 모델 회사와의 거리를 더욱 벌렸다.구글이 최종적으로 OpenAI를 따라잡으려면 여전히 많은 불확실성으로 가득 찰 것이다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- DeepMind 오픈 소스 생체 분자 예측 모델 노상 성과는 AI 제약 물결을 일으킬 것인가?
- 바이두 리언굉: 지난 24개월간 AI 업종의 가장 큰 변화는 큰 모형이 기본적으로 환각을 제거한것이다
- "AI 신세대"대모형제조업체 일제히"권"지능체, 리언굉은"생각으로 돈을 벌수 있는 시대"를 맞이하게 된다고 말했다.
- 알리 통의 천문 코드 모델 Qwen2.5-Coder 전 시리즈 정식 오픈 소스
- 극크립톤, 전계차종과 함께 광주모터쇼 첫 광대한 지운전 2.0 종단간 Plus 구조 선보여
- 문심일언 사용자 수 4억 돌파, 바이두 오단: 큰 모형이 산업 스마트 엔진을 재창조하고 있다
- 올해 10월 테슬라 모델 Y가 일선, 신일선 도시 모델 판매 1위를 차지했다
- 알리바바 CEO 오영명: AI 발전은 부동한 규모, 부동한 령역의 개원대모형이 필요하다
- 바이두 Q3 핵심 순이익 17% 증가 예상 초과 문심대 모델 하루 조정량 15억
-
知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
- caffycat
- 11 小时前
- 支持
- 反对
- 回复
- 收藏
-
每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
- star8699
- 前天 19:48
- 支持
- 反对
- 回复
- 收藏
-
上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
- goodfriendboy
- 前天 20:09
- 支持
- 反对
- 回复
- 收藏
-
人民网北京11月22日电 (记者栗翘楚、任妍)2024广州车展,在新能源汽车占据“半壁江山”的同时,正加速向智能网联新能源汽车全面过渡,随着“端到端”成为新宠,智能驾驶解决方案成为本届广州车展各大车企竞 ...
- 3233340
- 5 小时前
- 支持
- 反对
- 回复
- 收藏