首页 신문 正文

AI와 아이폰의 결합?애플의 최신 논문은 획기적인 방안을 제시했다

平和东准
1421 0 0

애플 GPT가 주머니에 있어요?이것이 더 빨리 현실이 될 수도 있다.
애플 인공지능 (AI) 연구진은 최근 사전인쇄본 사이트 arXiv에 발표한 논문에서 아이폰과 메모리가 제한된 다른 애플 기기에 대형 언어모델 (LLM) 을 배치할 수 있는 혁신적인'플래시 활용'기술을 언급했는데, 이는 거의 중대한 돌파구이다.
메모리 제약 조건
LLM 기반 챗봇 (예: ChatGPT, Claude 등) 은 데이터와 메모리에 매우 의존하며, 동시에 처리해야 할 데이터의 양이 매우 커서 종종 실행할 수 있도록 많은 메모리가 필요합니다.
따라서 LLM을 실행하는 것은 D램(일반적으로 메모리를 말함) 용량이 제한된 아이폰과 같은 장치에 도전이다.
일반적으로 데이터 표준을 연산하는 방법은 플래시 메모리의 데이터를 D램에 로드한 다음 D램에서 데이터 추론을 하는 것이다.
성능 수준이 높은 D램은 데이터 처리 속도를 수백만 배 향상시킬 수 있지만, 용량의 단점은 있다.DRAM에서 실행할 수 있는 최대 모델 크기가 크게 제한됩니다.
이 문제를 해결하기 위해 애플 연구진은 인공지능 모델의 데이터를 저장하기 위해 용량이 큰 플래시 메모리(flash memory)를 사용하고 필요할 때 D램 메모리에 데이터를 불러와 처리하는 신기술을 개발했다.
플래시에 AI 저장
"flash에서의 LLM: 제한된 메모리에서의 고효율 대형 언어 모델 추론"이라는 새로운 연구 논문에서 저자는 모바일 장치의 플래시 메모리가 전통적으로 LLM을 실행하는 데 사용된 메모리보다 더 풍부하다고 지적한다.
이런 방법은 용량 제한을 교묘하게 우회했다.개요 논문은 두 가지 핵심 기술을 제시하여 데이터 전송을 최소화하고 플래시 처리 능력을 최대화합니다.
하나는'윈도우화'기술로 일종의 회수 방법에 해당한다.AI 모델은 매번 새로운 데이터를 로드할 필요가 없고, 이미 처리된 일부 데이터를 다시 사용한다.따라서 메모리를 지속적으로 확보해야 하는 필요성이 줄어들어 프로세스가 더욱 빠르고 원활해집니다.
두 번째는 행-열 번들(Row-Column Bundling) 기술입니다.이 기술은 플래시 메모리의 데이터 특성에 맞게 블록에 액세스하는 순서를 정하는 데이터를 보다 효과적으로 그룹화함으로써 플래시 메모리에서 데이터를 더 빨리 읽고 인공지능이 언어를 이해하고 생성하는 능력을 가속화할 수 있다.
이 논문에 따르면 이러한 방법의 결합으로 인공 지능 모델의 작동 용량은 iPhone 사용 가능한 메모리의 두 배에 달합니다.이는 이 방법에서 CPU의 추리 속도가 기존 로딩 방식에 비해 4~5배, GPU의 추리 속도가 20-25배 높아졌다는 것을 의미한다.
이 논문의 저자는"이 돌파구는 자원이 제한된 환경에 첨단 LLM을 배치하는 데 특히 중요하기 때문에 그들의 적용성과 접근성을 확대시켰다"고 썼다."
애플의 AI 전략
인공지능 효율의 돌파는 미래의 아이폰에 새로운 가능성을 열어주었다. 예를 들면 더욱 선진적인 시리 기능, 실시간 언어 번역, 복잡한 인공지능 구동의 촬영과 증강현실 기능이다.
논문의 신기술은 아이폰이 기기에서 복잡한 인공지능 어시스턴트와 챗봇을 실행할 수 있는 기반도 마련했으며, 애플은 이미 이 분야의 기술을 개발하고 있다고 한다.
애플의 생성식 인공지능 작업은 결국 음성 비서 시리에 통합될 수 있다.애플은 지난 2월 인공지능 정상회의에서 직원들에게 자사의 대형 언어 모델 작업을 소개했다.앞서 언론에 따르면 애플은 인공지능과 깊이 통합된 스마트 버전 시리를 출시하는 것을 목표로 하고 있다.
애플이 가능한 한 많은 애플 앱에 인공지능을 추가할 계획이라는 소문도 돌고 있다.
이 외에도 애플은 OpenAI의 GPT-4 모델에 맞서기 위해 2천억 개의 매개변수에서 작동하는 자체 생성식 인공지능 모델인'아약스'를 개발하고 있는 것으로 알려졌다.
내부적으로'Apple GPT'라고 불리는 Ajax는 애플 전체의 머신러닝 개발을 통일하기 위한 것으로, 인공지능을 애플 생태계에 더 깊이 융합하려는 애플의 더 광범위한 전략이 돋보인다.
최근 보고서에 따르면 Ajax는 이전 ChatGPT 3.5보다 더 강력한 것으로 평가됩니다.그러나 2023 년 9 월 OpenAI가 출시 한 새로운 모델 GPT-4는 Ajax의 능력을 뛰어 넘을 수 있습니다.
애플체인 애널리스트 제프 푸는 애플이 2024년 말쯤 아이폰과 아이패드에 일종의 생성식 인공지능 기능을 출시할 것이며, 그 때 iOS 18에 이 기능이 포함될 것이라고 지적한 바 있다.Pu는 또 애플이 2023년에 수백 대의 인공지능 서버를 구축할 것이며 2024년에는 더 많아질 것이라고 밝혔다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   每经AI快讯,据亿航智能官微消息,公司EH216-S无人驾驶电动垂直起降航空器(eVTOL)获得巴西国家民航局颁发的试验飞行许可证书,并计划在巴西进行测试和试飞。关于EH216-S无人驾驶eVTOL在巴西的认证,中国民航局 ...
    潇湘才子
    昨天 08:41
    支持
    反对
    回复
    收藏
  •   今年7月,美国三大海外“债主”所持美国国债齐刷刷缩水,其中日本美债持仓已降至去年10月以来最低。   根据美国财政部当地时间9月18日公布的国际资本流动报告(TIC),2024年7月,美国前三大海外“债主”日本 ...
    520hacker
    3 天前
    支持
    反对
    回复
    收藏
  •   上证报中国证券网讯(记者俞立严)9月19日,蔚来全新品牌乐道的首款车型——乐道L60正式上市。新车定位家庭智能电动SUV,在采用BaaS电池租用服务后,L60的售价可低至14.99万元,电池租用月费最低为599元。乐道L6 ...
    anhao007
    前天 11:03
    支持
    反对
    回复
    收藏
  •   每经记者袁园   日前,国务院印发的《关于加强监管防范风险推动保险业高质量发展的若干意见》提出,以新能源汽车商业保险为重点,深化车险综合改革。   “车险综改”从2015年就已经开始逐步推进了,经过 ...
    moshulong
    前天 21:50
    支持
    反对
    回复
    收藏
平和东准 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    2