首页 신문 正文

마이크로소프트는 AI 대형 모델을 자체 연구하고 있는 것으로 드러났다: 5000억 개의 매개변수가 구글과 OpenAI와 경쟁하고 있다

度素告
215 0 0

거대 기술 기업인 마이크로소프트나 5천억 파라미터에 달하는 새로운 AI (인공지능) 대형 모델을 개발하고 있는 것은 구글과 오픈AI를 정면으로 부를 것이다.
5월 6일 (현지 시간) 외신 보도에 따르면 마이크로소프트는 MAI-1이라는 최신 AI 대형 모델을 개발하고 있다. 마이크로소프트가 이전에 출시한 일부 오픈 소스 모델을 훨씬 뛰어넘는 규모다. 성능상 구글의 Gemini 1.5, Anthropic의 Claude 3, OpenAI의 GPT-4 등 유명 대형 모델에 필적할 수 있다.마이크로소프트는 5월 21일부터 열리는 빌드 개발자 대회에서 이 새로운 모델을 시연할 수도 있다.
보도에 따르면 MAI-1 개발은 전 구글 AI 리더이자 AI 스타트업 인플렉션의 최고경영자를 지낸 무스타파 술레이만(Mustafa Suleyman)이 이끌었다.올해 3월, Microsoft는 Infection의 최신 자금 조달을 마치자마자 Infection에서 Suleman을 포함한 두 명의 공동 창업자와 일부 직원을 스카우트했습니다.소식통에 따르면 Microsoft는 이를 위해 Infection에 6 억 5 천만 달러 이상을 지불했습니다.
MAI-1은 Inflection 산하 모델의 일부 기술을 참고했을 수도 있지만, 어떤 마이크로소프트 직원은 MAI-1은 마이크로소프트가 이전에 훈련한 어떤 오픈 소스 모델보다 훨씬 많은 약 5000억 개의 매개변수를 가진 새로운 큰 언어 모델이라고 말했다.한 달도 안 돼 마이크로소프트는 Phi-3라는 소형 AI 모델을 선보였다. 이 중 Phi-3 mini는 휴대전화에 배치할 수 있도록 최적화돼 38억 파라미터를 보유하고 있으며 3조3000억 token의 훈련을 거쳐 GPT-3.5 등 모델과 성능이 비슷하다고 한다.
이에 비해 MAI-1의 규모는 훨씬 크고 계산력 투입과 훈련 데이터도 더 필요하다.이 모델을 훈련시키기 위해 Microsoft는 이미 엔비디아 GPU가 포함된 서버 클러스터를 많이 구성하고 OpenAI의 GPT-4에서 생성된 텍스트와 공공 인터넷 데이터를 포함한 다양한 소스에서 훈련 데이터를 수집했습니다.이는 MAI-1을 OpenAI의 GPT-4와 비슷한 수준으로 만들 수도 있으며, 후자는 1조 개 이상의 매개변수를 가지고 있다고 한다.
Phi 시리즈 모델과 MAI-1의 개발은 Microsoft가 모바일 장치를위한 작은 로컬 모델을 개발하면서 클라우드가 지원하는 더 큰 규모의 모델을 개발하는 AI 분야에서 이중 전략을 채택했음을 보여줍니다.그러나 마이크로소프트 내부에서도 MAI-1의 정확한 용도는 확인되지 않았다.
더 중요한 것은 MAI-1이 마이크로소프트가 AI 분야에서 파트너인 OpenAI에 완전히 종속되는 기술을 원하지 않는다는 것을 보여준다.OpenAI의 기술은 Windows에 통합된 챗봇을 포함한 Microsoft의 다양한 생성 AI 기능을 구동하고 있습니다.이에 앞서 마이크로소프트 AI 플랫폼팀 직원들은 회사의 AI 전략이 OpenAI와의 협력관계에 지나치게 관심을 기울여 마이크로소프트의 AI 오리지널 연구에 대한 예산이 줄었다고 불평했다.
6일 당일, 마이크로소프트 최고기술책임자 케빈 스콧 (Kevin Scott) 은 령영에 글을 올려 MAI-1에 관한 보도에 간접적으로 대답했다.그는 OpenAI는 Microsoft가 구축한 슈퍼컴퓨터를 사용하여 AI 모델을 훈련하고 있으며 Microsoft의 연구 부서와 제품 팀도 AI 모델을 구축하고 있다고 밝혔다."AI 모델은 거의 모든 제품, 서비스 및 운영 프로세스에 나타나며, 이를 제작하고 운영하는 팀은 처음부터 한 모델을 훈련하든 다른 사람이 구축한 모델을 미세 조정하든 때로는 사용자 정의 작업을 해야 한다.앞으로 일부 모델의 이름과 튜링 (MARing) 을 포함한 더 많은 상황이 있을 것"이라고 말했다.
마이크로소프트도 AI 방면의 돌파를 실현하기 위해 계산력 자원을 대대적으로 비축하고 있다.4월 초 마이크로소프트가 올해 말까지 180만 개의 AI 칩을 사재기할 계획이라는 보도는 회사가 2024년 안에 보유한 GPU 수를 두 배로 늘리기를 원한다는 것을 의미한다.소식통에 따르면 마이크로소프트는 2024 회계연도부터 2027 회계연도(2027년 6월 30일까지) GPU와 데이터센터에 약 1000억 달러를 쓸 것으로 예상된다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   每经AI快讯,据亿航智能官微消息,公司EH216-S无人驾驶电动垂直起降航空器(eVTOL)获得巴西国家民航局颁发的试验飞行许可证书,并计划在巴西进行测试和试飞。关于EH216-S无人驾驶eVTOL在巴西的认证,中国民航局 ...
    潇湘才子
    昨天 08:41
    支持
    反对
    回复
    收藏
  •   今年7月,美国三大海外“债主”所持美国国债齐刷刷缩水,其中日本美债持仓已降至去年10月以来最低。   根据美国财政部当地时间9月18日公布的国际资本流动报告(TIC),2024年7月,美国前三大海外“债主”日本 ...
    520hacker
    3 天前
    支持
    反对
    回复
    收藏
  •   上证报中国证券网讯(记者俞立严)9月19日,蔚来全新品牌乐道的首款车型——乐道L60正式上市。新车定位家庭智能电动SUV,在采用BaaS电池租用服务后,L60的售价可低至14.99万元,电池租用月费最低为599元。乐道L6 ...
    anhao007
    前天 11:03
    支持
    反对
    回复
    收藏
  •   每经记者袁园   日前,国务院印发的《关于加强监管防范风险推动保险业高质量发展的若干意见》提出,以新能源汽车商业保险为重点,深化车险综合改革。   “车险综改”从2015年就已经开始逐步推进了,经过 ...
    moshulong
    前天 21:50
    支持
    反对
    回复
    收藏
度素告 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    34