대언어 모델은 AI의'끝'이 아니다?메타 수석 과학자: 여전히 인간의 지혜를 따라갈 수 없다
君子一严
发表于 2024-5-23 18:00:57
1424
0
0
메타의 수석 인공지능(AI) 과학자 얀 리쿤 (Yann LeCun) 은 기존의 대형 언어 모델 (LLM) 이 인간과 같은 추리와 계획 능력을 결코 실현할 수 없다고 주장했다.
양립곤은 다음과 같이 표시했다. 대형언어모델은"론리에 대한 리해가 아주 제한되여있다. 그것은 물질세계를 료해하지 못하고 지속적인 기억이 없으며 그 어떤 합리적인 용어정의로도 추리할수 없으며 층별계획도 진행할수 없다."
최근 인터뷰에서 그는 기존의 첨단 대형 언어 모델에 의존하여 인간의 지혜에 필적하는 범용 인공지능 (AGI) 을 만들 수 없다고 생각했다. 이 모델들은 정확한 훈련 데이터를 얻은 경우에만 제시에 정확하게 대답할 수 있기 때문에"본질적으로 안전하지 않다"고 말했다.
구체적으로 말하자면, 양리쿤은 현재의 대형 언어 모델은 비록 자연 언어 처리, 대화 이해, 대화 인터렉션, 텍스트 창작에서 뛰어난 성과를 가지고 있지만, 그것은 여전히"통계 모델링"기술일 뿐이며, 데이터 중의 통계 법칙을 학습하여 관련 임무를 완수하는 것은 본질적으로 진정으로 이해와 추리 능력을 가진 것이 아니라고 생각한다.
양리쿤 자신은 차세대 인공지능 시스템을 개발하기 위해 노력하고 있다. 그는 이 시스템이 인간의 지능 수준을 갖춘 기계에 동력을 제공하여 기계에서'슈퍼 지능'을 창조할 수 있기를 희망한다.그러나 그는 이 비전이 실현되기까지 10년이 걸릴 수 있다고 지적했다.
"세계 모델링" 방법
양리쿤은 메타의 기초 인공지능 연구(Fair) 실험실에서 약 500명의 팀을 관리하고 있다.그들은'상식'을 형성할 수 있는 인공지능을 만들고 인간과 비슷한 방식으로 세계의 작동 방식을 관찰하고 체험하며 학습해 궁극적으로'세계 모델링'이라고 불리는 범용 인공지능(AGI)을 실현하기 위해 노력하고 있다.
2022년, 양립곤은 처음으로"세계모델링"비전에 관한 론문을 발표했는데 그후 메타는 이 방법을 바탕으로 두가지 연구모형을 발표했다.
양립곤은 최근 다음과 같이 지적했다.Fair 실험실은 인공 지능이 궁극적으로 인간의 지적 수준에 도달 할 수있도록하기 위해 다양한 아이디어를 테스트하고 있지만,"이 중에는 많은 불확실성과 탐구가 있으며, 우리는 또한 어느 것이 성공할 것인지, 어느 것이 최종적으로 선택 될 것인지를 판단할 수 없다"고 말했다.
또 "우리는 차세대 인공지능 시스템의 풍랑에 처해 있다"고 굳게 주장했다.
내부 갈등
그러나 이 과학자의 실험적 비전은 현재 투자자들이 인공지능 투자의 빠른 수익을 더 원하기 때문에 메타사에 값비싼 도박이다.
그래서메타 사내에서도'단기 수입'과'장기 가치'사이에 대한 견해차가 나타나고 있다.이 같은 이견은 지난해 GenAI 팀 출범을 보면 알 수 있다.
메타는 2013년 인공지능 연구 분야를 개척하기 위해 페어 랩을 설립했으며 이 분야 최고 학자들을 영입했다.하지만 2023년에는Meta는 Fair 실험실에서 많은 인공 지능 연구자와 엔지니어를 영입하고 Llama 3 모델의 작업을 이끌었으며 새로운 인공 지능 어시스턴트와 이미지 생성 도구와 같은 제품에 통합한 Chris Cox 최고 제품 책임자가 이끄는 새로운 GenAI 팀을 따로 그었습니다.
일부 내부 인사들은GenAI 팀의 설립은 아마도 양리쿤과 메타 최고 행정관 저커버그 두 사람이 이념적으로 어떤 모순이 있기 때문일 것이다.저커버그는 투자자들의 압력과 수익 압력 속에서 인공지능의 더 많은 상업화 응용을 추진해 왔다;반면 페어랩 내부의 학원파 문화는 메타를 생성식 인공지능 열풍에서 약간'약세'를 보이고 있다.
양립곤이 이 관점을 발표할 때메타와 경쟁사들은 지난주 OpenAI가 발표한 더 빠른 GPT-4o 모델을 포함한 더 많은 향상된 버전의 대형 언어 모델을 추진하고 있다;구글은 새로운'다중 모드'AI 어시스턴트 Project Astra를 출시했습니다.메타는 지난달 최신 Llama 3 모델도 선보였다.
이러한 최신 대형 언어 모델에 대해 양리쿤은 거들떠보지도 않는다. 그는"대형 언어 모델의 이러한 진화는 천박하고 제한되어 있다. 인간 엔지니어가 개입하여 이러한 정보에 근거하여 훈련할 때만 모델이 학습할 수 있다. 인간처럼 자연스럽게 결론을 내리는 것이 아니다."이는 자신의 Llama 모델의 얼굴을 때리는 것과 같다.
비록 관념적으로 모순이 존재하지만 한 소식통에 따르면 양립곤은 여전히 저커버그의 핵심고문중의 하나이다. 왜냐하면 그는 인공지능분야에서 극히 큰 명성을 갖고있기때문이다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 유럽 프라이버시 규제 기관, 구글이 인공지능 모델에 데이터 활용 실태 조사
- 바이두 심떨림: 10만 카드 계산력 클러스터를 대상으로 계산 플랫폼 능력 문심 대모델 하루 조정량 7억 회 초과
- 메타, 메가톤급 신제품 발표: 299달러 Quest 3S 헤드, AR 안경 프로토타입, 다중모드 AI 모델
- 바이두 월드 2024는 11월 12일에 열릴 문심 대형 모델의 하루 평균 호출량이 이미 7억 건을 초과했다
- 포드 CEO는"지루한"모델 제조에 싫증이 났고, 개성화와 전동화 제품은"새로운 기쁨"이 되었다
- 2024년 노벨물리학상 발표, 두 과학자 수상
- 홍콩 주식 애플 산업 사슬 상승!iPhone 16 Pro 모델의 수요는 여전히 견조하며 향후 판매량은 어떻습니까?
- 머스크 Cybercab 출시 임박!국내의 많은 거두들이 앞다투어 Robotaxi 중국 모델을 탐색하다
- 패러데이는 내년 말까지 2차 브랜드 첫 모델을 하차할 계획이다
- 머스크 또'뭇매'?100명이 넘는 과학자들이"상서"하여 성련쇄발사를 중지할것을 건의했다
-
10月30日,小鹏汽车生态企业小鹏汇天宣布,旗下分体式飞行汽车“陆地航母”即将亮相2024中国航展,11月12日将在中国航展第二展区(斗门莲洲)进行全球首次公开飞行,同时“陆地航母”也将在珠海国际航展中心8号 ...
- yxtianyouyou
- 昨天 11:43
- 支持
- 反对
- 回复
- 收藏
-
【美股成交额前20:特朗普媒体科技集团大涨逾20% 较近期低点涨逾300%】第8名特朗普媒体科技集团收高21.59%,成交47.92亿美元。对比9月份的最低点11.75美元,该股迄今已经上涨310%。随着“总统大选日”倒计时,周一特 ...
- poketmonster
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
10月30日消息,星巴克正加大力度执行重返办公室的规定,并发出警告:员工若不遵守该政策就可能被解雇。据一则内部讯息,星巴克将于明年1月启动“问责程序”,以确保公司层面员工遵守每周在办公室工作三天的要求 ...
- 燕语莺声
- 前天 17:22
- 支持
- 反对
- 回复
- 收藏
-
代表美国华盛顿州约3.3万名波音工人的国际机械师和航空航天工会第751分区(IAM District 751)当地时间10月29日表示,在美国代理劳工部长朱莉·苏(Julie Su)的持续协助下,工会谈判委员会与波音进行了富有成效 ...
- 397393583
- 前天 14:35
- 支持
- 反对
- 回复
- 收藏