2022년 말 인간과 자유자재로 깊은 대화를 나눌 수 있는 챗봇 챗GPT가 발표되자 전 세계에 뜨거운 생성식 AI 물결이 일고 있다.이미 2013년에 바이두는 딥러닝 실험실을 설립하여 국내 최초로 AI 분야에 진입한 기업으로 다른 동업자들을 따라잡았다.
11월 12일, 바이두 세계 2024 대회에서 연설을 할 때, 바이두 창시자 리옌훙은 현실적인 질문을 던졌다:"객관적으로 말하자면, 모두가 기대하는 슈퍼 응용은 아직 나타나지 않았다. 심지어 어떤 사람들은 지난 24개월 동안 이런 세계적인 대형 모델 열광이 도대체 새로운 기술 혁명인가, 아니면 새로운 거품인가?"
중국 인공지능의 깃발을 든 사람으로서 바이두는 AI는 진실한 수요라고 대답했다.리옌훙은 지난 5월 바이두의 임원들이 함께 AI 대형 모델이 어떻게'됐다'고 할 수 있는지 토론한 적이 있다고 언급했다.그가 제시한 핵심 지표는 대형 모델 API 호출량이 1년 동안 2억에서 20억으로 10배 상승할 수 있다는 것이다.불과 반년 뒤 바이두 문심대 모델의 하루 평균 호출량은 15억을 넘어 7.5배 증가했다.1년 전 처음 공개된 5000만 건에 비해 약 30배 크게 늘었다.
리언굉의 견해에 의하면 이 가파른 성장곡선도 지난 2년간 중국의 대형모형응용폭발의 축소판이다."오늘날 기초 모델 능력이 준비되어 우리는 곧 AI 응용의 별들이 빛나는 순간을 맞이할 것이다.모든 응용은 하나의 별이며, 모든 응용은 세계를 변화시키는 힘이 될 것"이라고 그는 말했다.
리언굉의"비주류"AI관: 환각을 우선적으로 해결하고 지능체를 중점적으로 발전시켜야
AI 업계의 다른 게이머들에 비해 리옌훙과 바이두는 많은'비주류'로 보인다.많은 회사들이'백모대전'의 싸움에 빠져 큰 모델의 성능과 매개변수에 초점을 맞추고 있을 때, 리옌훙은 여러 공개석상에서"볼륨을 적용하려면 큰 모델을 롤업하지 말아야 한다","AI 모델을 응용하지 않으면 한 푼의 가치도 없다"고 거듭 강조했다.개폐원 논쟁에 직면하여 리옌훙은 또 기치선명하게 폐원 모델 진영에 서서 폐원이야말로 진정한 비즈니스 모델이 있다고 말했다.
올해 2월, OpenAI는 문생영상모형 Sora를 꺼내 재차 글로벌인터넷을 폭발시켰고 많은 중국기업들도 분분히 이 코스를 따라가기 시작했다.그러나 리옌훙은 내부 연설에서"아무리 폭발적이더라도 바이두는 소라류의 동영상 생성 모델을 만들지 않을 것"이라며"투입 주기가 너무 길기 때문에 10년, 20년 동안 업무 수익을 얻지 못할 수도 있다"고 말했다.
바이두 세계 2024 대회에서 리옌훙은 이에 대해 한층 더 설명했다.그는 Sora보다 Baidu가 이미지 생성의 환각 문제, 즉 큰 모델의 생성 내용이 사실과 다르거나 근거가 없다고 말했다.리옌훙은"이 문제는 더 간단하고 심지어 더 무미건조해 보이지만 해결하지 않으면 응용될 수 없다"고 말했다. 그는 지난 24개월 동안 업계에 가장 큰 변화는 큰 모델이 환각을 거의 없애고 질문에 대답하는 정확성이 크게 향상돼 AI가'정색하는 헛소리'에서 사용할 수 있고 신뢰받을 수 있게 된 것이라고 주장했다.
대형 모델의 환각 문제를 해결하는 관건은 RAG (검색 강화) 기술로 대형 모델이 검색된 정보를 이용하여 텍스트나 답안의 생성을 지도하도록 하는 데 있다.이날 실리콘스타 창시자 락일항, 갑자광년 창시자 장일갑과의"AI 원탁대담"에서 리언굉은 다음과 같이 언급했다. 지난 2년간 RAG는 대언어모형에 실용가치를 구비하게 했으며 환각생성을 효과적으로 통제할수 있기에 각 장면 특히 To B 면에서 사용해야 한다.그는 바이두가 소라를 하지 않는 것은 바이두가 다중모드를 하지 않는 것과 같지 않다며"다중모드가 진정한 실용단계에 진입하려면 정확성, 통제성이 있어야 응용공간이 열릴 수 있다"고 강조했다."
이에 따라 바이두는 이미지 등 다중모드 콘텐츠와 RAG의 결합을 겨냥해 검색이 강화된 문생도 기술인 iRAG(image based RAG)를 이벤트에 발표했다.iRAG는 바이두가 검색하는 억대 사진 자원과 강력한 기초 모델 능력을 결합하여 각종 초진실 사진을 생성할 수 있다.
리언굉은 현장에서 문심대모형으로 생성된 대중이 자동차를 휩쓸고 만리장성을 비약하는 사진을 전시했다.문심 iRAG 기술을 통해 이 특정 모델 자동차의 차종 차표나 배경인 만리장성은 오류나 변형의 환각 문제가 발생하지 않았다.이 기술을 이용하여 이전에 수십만 원을 들여야 완성할 수 있었던 포스터 촬영은 현재 창작 원가가 0에 가깝다.그 상업가치는 환각이 없고 초진실하며 원가가 없고 립등취할수 있다는것을 구현한다.
전 세계 과학기술거두들이 AI 착지응용장면을 찾는데 눈길을 돌리면서 지능체라는 자주적으로 환경을 감지하고 행동을 집행하며 설정목표를 완수할수 있는 시스템도 더욱 많은 주목을 받고있다.그러나 리옌훙은 바이두처럼 지능체를 가장 중요한 전략 방향으로 삼는 것은 많지 않다고 강조했다.바이두는 AI 응용의 가장 주류 형태로서 지능체가 곧 폭발점을 맞이할 것이라고 생각한다.현재 바이두 산하 문심지능체 플랫폼은 15만 개 기업과 80만 명의 개발자를 유치해 광범위한 응용 장면을 커버하고 있다.
바이두는 지능체를 주로 회사류 지능체, 역할류 지능체, 도구류 지능체와 업종류 지능체로 나눈다.구체적으로 말하면 회사류 지능체는 전통적인 회사사이트의 기초에서 주동적인 추천 등 서비스를 제공할수 있으며 앞으로 직접 소비자를 대상으로 하는 제1인터페이스로 될수 있다.역할류 지능체는 고도로 의인화된 디지털인이고 업종류 지능체는 법률 등 수직분야에 전념한다.바이두문고와 바이두넷디스크는 또 공동으로 도구류 지능체"자유캔버스"를 발표하여 공역과 사역자료의 제한을 전면적으로 뚫어 입력, 편집, 창작, 공유의 자유를 실현했다.
프리 캔버스 생성 다중 모드 조사 보고서
업계 지능체 - 법행보
코드 생성은 큰 모델의 큰 핵심 능력이다. 리옌훙도 생성식 AI가 모든 사람에게 프로그래머의 능력을 갖추게 할 것이라고 여러 차례 밝힌 바 있다.바이두 세계 2024 대회에서 리옌훙은 무코드 도구인'초다'를 공식 출시한다고 발표했다.보조코드생성도구와 달리"초다"라는 이 큰 모형과 지능체로 구성된 새로운 소프트웨어를 빌어 사용자는 심지어 코드를 알아보지 않고도 각종 응용을 구축할수 있다."전례없이 생각만으로 돈을 벌수 있는 시대를 맞이하게 될것이다."
초
강연의 마지막에 리언굉은 자신을 소프트웨어공정사출신이라고 하면서 국외에는"소프트웨어가 세계를 삼킨다"는 말이 있다.그러나 그의 견해에 의하면 세계는 삼켜져서는 안되며 창조되여야 한다."AI 시대, 응용은 세계를 창조한다."라고 이 과학기술 지도자가 말했다.
한 AI 장기주의자의 배치와 선견지명
바이두를 창립한 지 20여 년 동안 리옌훙을 따라다니는 꼬리표는 매우 많은데, 그 중에는'AI의 장기주의자'가 포함된다.이는 리언굉의 인공지능면에서의 조기배치를 의미할뿐만아니라 미래에 대한 지속적인 투입에 대한 그의 튼튼한 결심을 대표한다.
리옌훙은 2023년 주간지 타임의 제1회 세계 100대 AI 인물 리스트에 오른 바 있으며, 함께 글로벌 AI 리더로 선정된 인물은 테슬라 CEO 일론 머스크, 엔비디아 창업자 겸 CEO 황인훈, 오픈AI CEO 샘 오트먼 등이다."시대" 는 리언굉의 AI에 대한 장기적인 투입과 바이두가 AI면에서 이룩한 여러가지 성과를 긍정하고"중국에서 가장 걸출한 미래주의자로서 장기간 AI발전의 물결에 뛰여들었다"고 평가했다.
AI 대부이자 튜링상 수상자인 양리쿤도 자신의'과학의 길'중국어판 자서에서 바이두는 상업화 딥러닝 시스템을 최초로 배치한 대형 회사 중 하나로 구글과 마이크로소프트를 앞섰다고 언급한 바 있다.일찍 2012년, 리언굉은 심층학습기술이 검색에 대한 개진을 본후 전 바이두제품경리가 AI기술의 최신추세를 료해하도록 격려했다.1년 뒤 바이두는 딥러닝 실험실을 설립해 리옌훙이 원장을 맡아 AI에 대한 탐색을 본격적으로 시작했다.
사실 바이두와 현재 여러 AI 리더들 사이에는 천만갈래의 관계가 있다.2024년 노벨물리학상을 수상한'신경망의 아버지'게오프리 힌튼은 바이두의 4400만 달러 최고 가격 경쟁을 거부하고 결국 팀을 이끌고 구글에 합류하기로 했다.당시 Geoffrey Hinton 팀은 새로운 신경망 알고리즘인 AlexNet으로 2012년 ImageNet 챌린지 우승을 일거에 차지하며 이름을 날렸다.그 팀원에는 이후 OpenAI 공동 창업자인 Ilya Sutskever가 포함되었다.
이 외에도 구글의 AI 프로젝트인 구글 브레인의 공동 창업자이자 책임자인 우엔다는 2014년 바이두에 입사해 수석 과학자직을 맡은 바 있다.바이두에서 근무한 3년동안 오은달은 바이두인공지능팀을 이끌고 1300명으로 늘어났는데 그중 바이두연구원 성원은 300명으로 바이두가 대량의 AI인재를 양성하도록 도와주었다.현재 OpenAI의 최대 경쟁사인 AI 스타트업 Anthropic의 공동 창업자 겸 CEO Dario Amodei는 스탠퍼드대 박사후 졸업 후 첫 직장으로 바이두의 실리콘밸리 AI 실험실에서 연구원으로 일하고 있다.
10년 동안 AI 탐색의 길을 걸으면서 바이두의 인공지능 분야에서의 성과와 영향력은 이미 깊은 인정을 받았다.컨설팅회사 설리번이 최근 발표한'2024년 글로벌 AI 생태 파노라마 개관'보고서에 따르면 자생성식 AI 물결이 폭발한 후 엔비디아를 대표로 하는 칩 제조업체와 마이크로소프트 등 클라우드 제조업체가 배당금을 먹기 시작했으며, 오픈 소스 모델, 창업 기업, 소프트웨어 응용 제조업체도 시장 점유율 선점을 가속화하고 있다.전 세계 AI 생태 파노라마에서 눈에 띄는 것은 단연 AI 원생 거물이다. OpenAI, 구글 외에 바이두도 같은 사분면으로 분류된다.
2021년, 리언굉은"주주에게 보내는 편지"에서 다음과 같이 언급했다. 지난 10년간 바이두는 기초를 다지고 생태를 건설하는데 진력했으며 AI에 대한 연구개발에 대거 투입하기 시작했으며 기술로 복잡한 세계를 더욱 간단하게 하기를 기대했다.이에 따라 인공지능의 대세가 밀려오는 현재 바이두는 선도적인 AI 생태형 회사가 돼 강력한 인터넷 사용자 기반을 갖게 됐다."바이두는 정력이 있고 인내심이 있다.최전방의 기술 물결은 기다릴 수 없다는 것을 잘 알고 있기 때문에 10년, 20년 앞당겨 배치해야 한다"고 말했다.
AI에 대한 확고한 신앙도 바이두의 미래에 대한 전망에 깊은 영향을 미치고 있다.90년대 말부터 2000년 초까지의 인터넷 거품을 목격하고 직접 경험한 리옌훙은 대형 모델 열풍에 대해 뚜렷한 인식을 가지고 있다.10월에 하버드 비즈니스 리뷰 편집장을 대담할 때, 그는 생성식 AI는 역사상 많은 기술 물결처럼 최초의 흥분 단계를 보낸 후에도 불가피하게 거품의 과정을 겪게 될 것이며, 시장의 수요를 만족시킬 수 없는 가짜 혁신은 씻겨질 것이라고 제기했다.
그러나 큰 모델의 장기적인 전망에 대해 이 인터넷 선구자는 여전히 전복적인 기술 혁명이라고 낙관하고 있다."새로운 기술 주기에 직면하여 장기주의를 견지하는 창업자는 반드시 두각을 나타낼 것이다."라고 리옌훙은 말한 바 있다.
"AI 원탁대담"에서 리언굉은 지난 한해동안 업종에 존재하는 초조감을 다시 제기했다. 례를 들면 슈퍼응용이 도대체 어디에 있는가, 창업자의 기회가 무엇인가 하는 등 문제가 비일비재하다.이에 대해 그는 바이두의 노력을 통해 개발된 도구나 탐색의 각종 장면을 공유하여 어떤 경로, 어떤 응용이 큰 모델에 기초하여 실제가치를 산생할수 있는가를 외부에 과시할수 있기를 희망했다.
대형 모델 기술은 폭주 이후 점차 이성적이고 실무적이며, 바이두의 태도도 날로 분명해지고 있다:"슈퍼 응용"을 출시하려는 것이 아니라, 끊임없이 더 많은 사람, 더 많은 기업이 수백만의"슈퍼 유용"응용을 만들 수 있도록 도와야 한다.현재, 그 큰 모형 응용은 이미 에너지, 전력, 제조 등 수십 개 업종, 수백 개 장면에 정착했다.세계 2024 대회에서 바이두는 또한 문심 대형 모델이 여전히 지속적으로 훈련 중이며 더 강력한 새로운 버전이 기대된다고 분명히 밝혔다.