首页 신문 正文

리언굉 최신 내부연설: 개원대모형보다 폐원후자가 지속적으로 앞설것이다

勇敢的树袋熊1
242 0 0

4월 11일, 계면뉴스는 바이두의 창시자이며 리사장 겸 최고경영자인 리언굉이 한차례 내부연설에서 처음으로 문심대모형이 왜 개원하지 않는가 및 대모형의 개원과 폐원의 로선선택에 대한 견해를 언급했다고 밝혔다.
또 AI 창업자가 모델에 집중해야 하는지, 애플리케이션에 집중해야 하는지, 스타트업이 모델도 만들고 애플리케이션도 하는'이륜구동'이 좋은 모델인지 등에 대한 업계 이슈도 언급했다.
큰 모형의 오픈 소스는 의미가 크지 않다
대형 모델 분야에서는 현재 오픈 소스와 오픈 소스 두 가지 기술 노선이 있다.
예를 들어 머스크 산하 인공지능 스타트업'xAI'는 세계 최대 매개변수의 대언어 모델인 Grok-1을 공식 오픈소스 노선을 선택했다.메타의 대언어 모델인 엘라마 시리즈, 오픈 소스 커뮤니티에서 주목받는 미스트랄 AI 등 국내의 지원'오도'대 모델, 백천 스마트 대 모델, 알리의 통의 천문 모델도 모두 오픈 소스 대 모델이다.
대형 모델 붐을 일으킨 OpenAI가 개발한 GPT-3.5, GPT-4는 폐원을 선택했고, 바이두 문심 대형 모델도 마찬가지였다.
리언굉은 내부연설에서 문심이 개원이 필요한가에 대해 바이두내부에서 아주 치렬한 토론이 있었으며 최종적으로 개원을 하지 않기로 결정했다고 언급했다.당시 판단은 시장에 반드시 오픈 소스 모델이 있을 것이며, 한 곳 이상이 오픈 소스가 될 것이라는 것이었다.이런 상황에서 바이두 일가가 많으면 오픈 소스가 많지 않고, 바이두 일가가 적으면 오픈 소스도 적지 않다.
"이 시장에는 우리 같은 오픈 소스 모델이 부족하지 않다.우리가 오픈 소스를 만들려면 스스로 오픈 소스 버전을 유지해야 하는데, 이것은 수지가 맞지 않는다."그는 모델 오픈 소스의 의미는 사실 그리 크지 않으며, 이러한 오픈 소스 모델은 밖에서 영세하고 소규모로 각종 검증 응용을 하지만 큰 계산력의 검증을 거치지 않았다고 생각한다.
그의 견해에 의하면 전통적인 소프트웨어의 오픈소스와 달리 큰 모형의 오픈소스는 많은 사람들이 땔감을 줍고 불꽃이 높은 것이 아니다.오히려 폐원 모델은 일시적인 선두가 아니라 능력에서 계속 앞선다.
어떤 업계 인사도 마찬가지로 인터페이스 뉴스에 이전에 오픈 소스 소프트웨어의 장점은 모두가 코드를 공유하고, 여러 사람이 공동으로 버그를 복구할 수 있으며, 소프트웨어를 끊임없이 업데이트할 수 있다는 것이라고 말했다.그러나 큰 모델 자체는 블랙박스로, 누군가가 수정을 제출한 후 다시 훈련할 가능성이 있으며, 매번 훈련할 때마다 대량의 계산력과 자금을 소모하며, 이전의 오픈 소스 소프트웨어처럼 여러 사람이 공동으로 개발하는 방면에서 이렇게 큰 혜택을 받는 것은 아니다.
상술한 인사는 장기적으로 볼 때 페원은 지력, 계산력 등 자원을 집중하여 큰 모형을 교체할수 있으며 개원보다 효률이 더 높다고 판단했다.
리언굉도 다음과 같이 강조했다. 페원의 우세는 아직 진정한 상업모식이 있어 돈을 벌어 계산력을 모으고 인재를 모을수 있다.비용, 동등한 능력에서 폐원 모델의 추리 비용은 더 낮고 응답 속도는 더 빠르다.동일한 매개변수의 경우 소스 모델을 닫을 수도 있습니다.
"오늘날 중국에서나 미국에서나 가장 강한 기초모델은 모두 페원적이고 각양각색의 소형모델, 가장 좋은 소형모델은 모두 대형모델을 통해 증류되였다.큰 모델을 통해 차원을 낮추어 만든 모델이 더 좋은 것이다. 이렇게 하면 폐원도 원가에서, 효율에서 우위를 점할 수 있다"고 말했다.
큰 모델의 오픈 소스 폐원 논쟁에 대해 바이촨 스마트 최고경영자 왕샤오촨은 앞서 계면뉴스와의 인터뷰에서도 언급했다.그의 관점은 큰 모델 자체가 소비단을 대표하지 않는다. 안드로이드, IOS처럼 양자택일이 필요한 것은 아니다. 오늘날 기업단의 관점에서 오픈 소스와 오픈 소스가 모두 필요하다는 것이다.
왕샤오촨은 오픈소스가 가져오는 가치를 매우 중시한다. 그는 앞으로 80% 의 기업이 오픈 소스 모델을 사용할 것이라고 생각한다. 오픈 소스 모델이 작기 때문에 폐원은 많은 장면에 잘 어울릴 수 없다.
AI 창업자의 핵심 경쟁력은 모델 자체가 아니다
리옌훙은 개·폐원 노선에 대한 입장 표명 외에도 AI 창업자와 스타트업에 대한 자신의 견해를 밝혔다.
그는 일부 모형을 만드는 창업회사의 이른바"이륜구동"은 좋은 모식이 아니며 모형을 만들면서도 응용을 하면 필연코 정력을 분산시킬것이라고 인정했다.창업회사의 정력과 자원은 모두 제한되여있으므로 자원이 제한되여있을 때 더욱 집중해야지 이른바"이륜구동"을 하는것이 아니다.
AI 창업자에게 핵심 경쟁력은 모델 자체가 아니라 자원을 많이 소모하고 뛰쳐나오기까지 오랜 시간이 걸린다.창업자의 진정한 장점은 어느 한 분야의 지식, 데이터여야 한다.
"만약 당신이 오늘'노란 주머니 없는 남성 수영복바지'를 찾고 싶다면, 당신은 어떤 전자상거래 플랫폼에서도 찾을 수 없다. 이런 수요는 현재의 기술로는 해결할 수 없다.큰 모델은 분야 지식이 있으면 해결할 수 있다. 이것이 바로 분야 지식으로 독특한 가치를 제공할 수 있는 예이다."라고 그가 말했다.
그의 견해에 의하면 시중에는 대량의 모형이 있는데 크고, 작고, 오픈 소스, 폐쇄 소스, 특정 응용에서 어떻게 이런 모형의 조합을 사용하는가 하는것은 기교가 있다. 이는 창업자가 할수 있는 일이고 가치증익을 제공할수 있다.
리옌훙은 문심이나 폐원 모델을 사용하면 잘하면 표절되고 밥그릇을 빼앗길 수 있다는 외부의 우려에 대해"모바일 시대에 위챗은 핀둬둬를 먹지 않았고, 디디도 텐센트의 일부가 되지 않았다"고 말했다.그들은 모두 각자 자신의 독특한 가치를 제공하고 자신의 매우 다른 경쟁력을 가지고 있다.그들의 발흥은 모두 모바일 생태의 폐쇄된 플랫폼인 위챗에 의존하지만, 그들은 위챗이 그의 밥그릇을 빼앗는 것을 두려워하지 않기 때문에 기초 모델이 AI의 응용을 통식할 염려가 없다.
중신건투연보는 현재 국내 대형 모델 능력이 점차 향상되고 있으며, 중국어 분야 처리와 일부 특성, 예를 들면 긴 텍스트 처리 등은 정렬과 선두 우세가 있다고 지적했다.Kimi의 열기가 높아짐에 따라 국내 여러 대형 모델 제조업체가 긴 텍스트 능력 경쟁에 합류하여 산업 소비의 착지가 가속화되었다.국내 대형 모델 응용 원년이 이미 되었다.
모델이 점차 성숙된후 앞으로 큰 모델은 제품과 응용층에서 새로운 한차례 대결과 쟁탈을 전개하게 된다.리언굉의 이번 연설도 더욱 많은 응용층 개발자들이 문심대모형을 선택하도록 흡인하고있다.
앞서 바이두의 2023년 4분기 및 연간 재무보고 전화회의에서 리옌훙은 바이두 스마트 클라우드의 4분기 총 매출은 84억 위안이며, 그 중 큰 모델은 클라우드 업무에 약 6억 6천만 위안의 증가분 수입을 가져왔다고 밝혔다.
현재 문심대 모델의 하루 조정량은 5000만 건을 넘어 분기 대비 190% 증가했다.작년 12월, 약 2만 6천 개의 기업이 문심 대형 모델을 호출하여 분기 대비 150% 증가했다.삼성, 영광, 오토하우스 등 기업은 모두 바이두와 합작을 달성했다.
발표 이후 바이두는 문심대 모델의 추리 비용을 계속 낮춰 지난해 3월 버전의 1% 로 낮췄다.
리언굉은 또 앞으로 다모태 또는 다모태의 융합, 례를 들면 문자에서 동영상에 이르기까지 아주 중요한 기초모형개발의 방향이며 AGI (통용인공지능) 의 필요한 방향이기도 하다고 표시했다.바이두는 이미 이런 분야에 투자했으며 앞으로 계속 투자할 것이다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

勇敢的树袋熊1 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    38