2026년 6월 1일, 타이베이에서 열린 GTC 타이베이 2026(컴퓨텍스 2026 연계 행사) 무대에 선 젠슨 황은 얇은 노트북 한 대를 들어 올리며 말했다.
For 40 years, we clicked. Now we just ask.
(40년 동안 우리는 클릭했다. 이제는 묻기만 하면 된다.)
NVIDIA가 발표한 RTX Spark 슈퍼칩은 마이크로소프트가 공개한 Surface Laptop Ultra처럼 두께 14mm, 무게 1.4kg 미만급 노트북에서도 1,200억 파라미터 모델을 로컬에서 돌릴 수 있다는 ‘새 폼팩터’를 내세운다.
Blackwell GPU 6,144 CUDA 코어, Grace 20코어 Arm CPU, 최대 128GB LPDDR5X 통합 메모리, 1페타플롭 AI 추론 성능의 스펙.

하지만 이 글은 사양표 이야기가 아니다. 그러니 6,144 CUDA 코어, 20코어 Arm CPU, 최대 128GB 통합 메모리, 1페타플롭 AI 추론 성능 같은 숫자는 여기서 잠깐 접어두자. AI 네이티브가 늘어나면서 AI를 생각의 연장선으로 쓰는 사람, 예컨대 로컬 모델로 긴 컨텍스트를 처리하고, 에이전트에게 조사를 맡기고, 그 결과를 자기 사고에 녹여 쓰는 사람들에게 이 기계가 실제로 어떤 영향을 미칠 것인가?
병목은 성능이 아니라 메모리였다
지금까지 로컬 AI를 쓸 때 가장 큰 걸림돌은 처리 속도가 아니라 메모리였다. 일반 노트북 GPU의 VRAM은 8~16GB, RTX 5090 같은 하이엔드 GPU도 24GB다. 70억(7B) 모델은 ‘용량을 줄여 저장하는 방식’(4비트 양자화)을 쓰면 대략 4GB 정도로도 돌아가지만, 1,200억(120B) 모델은 크기 자체가 달라서 노트북 VRAM에 올리기 어렵다. 여기에 컨텍스트가 길어지면 필요한 메모리는 더 늘어난다.
RTX Spark는 이걸 바꾼다. CPU와 GPU가 128GB 메모리 풀을 함께 쓰는 설계 덕에 얇은 노트북에서 1,200억 파라미터 에이전트를 100만 토큰 컨텍스트로 돌리는 게 가능해진다. 애플 실리콘이 맥에서 CPU와 GPU가 같은 메모리를 쓰는 특성을 윈도우에 Blackwell GPU와 CUDA 풀스택을 얹어 적용한 것이다.
이게 이 기계의 첫 번째 진짜 의미다. 더 빠른 게 아니라 워크스테이션이나 클라우드에서나 되던 작업이 가방 안으로 들어온다.
클라우드가 못 주는 것
앤디 클라크와 데이비드 챌머스는 1998년 철학 학술지 Analysis에 발표한 논문 “The Extended Mind“에서 이런 사고 실험을 냈다. 알츠하이머를 앓는 오토(Otto)가 박물관 주소를 늘 수첩에 적어두고 필요할 때마다 꺼낸다면, 그 수첩은 오토의 기억인가 아닌가.
클라크와 챌머스의 답은 “그렇다”였다. 외부 도구가 인지의 일부가 되려면 네 가지 조건을 갖춰야 한다. 언제든 꺼낼 수 있고(availability), 바로 쓸 수 있으며(accessibility), 머릿속 기억과 같은 역할을 하고(functional equivalence), 그걸 잃으면 실제로 인지에 구멍이 생겨야 한다(endorsement upon reflection). 이 네 조건을 갖춘 외부 도구는 인지를 돕는 게 아니라 인지 자체의 일부가 된다.
이 논리로 클라우드와 로컬을 비교하면 달리 보인다. 클라우드 AI는 이 네 조건을 온전히 갖추기 어렵다. 인터넷이 끊기면 사라지고 응답이 느리면 생각 흐름이 깨지고 내가 넣은 데이터가 어느 서버에서 처리되는지 알 수 없다. 생각을 연장하는 도구가 되려면 언제 어디서든, 막힘 없이 꺼낼 수 있어야 한다.
기업 현장에서 이 문제는 이미 눈에 띄게 드러나고 있다. 에이전트 워크플로우 하나를 끝내는 데 API를 10~30번 호출하다 보니 파일럿 때와 비교할 수 없는 클라우드 비용 청구서가 나오고 기업들이 로컬 인프라로 옮기는 속도가 빨라지고 있다. EU AI법 시행으로 “모델이 GPT-4o API”라는 답변은 고위험 AI 시스템 기술문서 요건을 채우지 못한다. 일부 시장조사에 따르면 2026년까지 기업 AI 추론 작업의 절반 이상이 사내 또는 엣지에서 돌아갈 것으로 본다. AI를 진지하게 쓸수록 클라우드에 기댈 때의 비용과 위험이 선명해지는 구도다.
RTX Spark는 이 문제를 하드웨어로 막는다. 모델이 기기 안에서 네트워크 연결 없이 독립적으로 동작한다. 배터리로 써도 성능이 같다고 엔비디아는 말하지만, 독립 벤치마크 검증은 아직 없다. 이게 실제로 맞다면, RTX Spark는 클라크-챌머스가 설명한 인지 확장의 네 조건에 클라우드보다 훨씬 가깝게 다가선다.
그럼 갈아탈 이유가 있나
솔직히 말하면 지금 당장은 아니오에 가깝다. 다만 조건이 하나씩 해소될수록 답이 달라진다.
RTX Spark는 Arm 기반 칩이고, Windows on Arm에는 아직 실재하는 제약이 있다. 커널 드라이버에 기대는 앱들, 예를 들어 일부 안티치트, 특수 보안 솔루션, 전문 장비 드라이버 등은 2026년 지금도 호환이 안 되는 것들이 있다. Prism 에뮬레이션으로 돌리는 앱은 네이티브보다 배터리를 15~20% 더 먹는다.

다만 Arm이라서 쓸 게 없다는 얘기는 아니다. 워드, 브라우저 같은 생산성 앱이나 포토샵, 다빈치 리졸브 같은 크리에이티브 툴, 개발 환경은 이미 Arm64 네이티브로 옮겨간 것들이 많다. 이용자가 실제로 자주 쓰는 앱만 놓고 보면 대부분이 네이티브나 에뮬레이션으로 돌아간다는 분석도 있는데, 이 수치는 집계 방식에 따라 달라질 수 있으니 그대로 믿기보다는 참고 정도로 보면 된다. 결국 관건은 한 가지다. 내가 매일 쓰는 몇 개의 핵심 앱이 Arm에서 문제없이 도는가.
가격은 아직 발표가 없다. NVIDIA가 직접 “프리미엄급”이라고 밝혔으니 MacBook Pro 16인치 이상의 가격대를 각오해야 한다. 그 가격이 납득되려면, 이 기계가 이용자가 매일 쓰는 코드 에디터, 메모 앱, 영상 편집 툴, 로컬 모델 실행 환경까지 Arm 환경에서 막힘 없이 돌릴 수 있어야 한다.
AI 네이티브에게 이 기계는 뭔가
RTX Spark가 진짜로 겨냥하는 사람은 AI를 가끔 쓰는 사람이 아니다. AI를 ‘생각 도구’로 쓰는 사람, 자료를 잔뜩 붙여 놓고 오래 대화하고, 조사 같은 일을 에이전트에게 맡긴 뒤 결과를 글과 판단에 바로 섞어 쓰는 사람들이다. 그런데 지금까지 노트북에서 로컬 AI를 쓰려면 늘 하나를 포기해야 했다. 작은 모델로 만족하든가, 화질을 낮추듯 성능을 줄여서(양자화) 겨우 돌리든가, 결국 클라우드로 보내서 편하되 데이터는 밖으로 내보내든가. 선택지는 달라도 결론은 같다. 원하는 조건을 전부 챙기기는 어려웠다.
RTX Spark의 128GB 통합 메모리는 이런 타협을 할 필요가 없다. 이용자가 VRAM 때문에 모델 크기와 컨텍스트 길이 중 하나를 포기하던 선택이 사라진다. 1,200억 파라미터 모델이 100만 토큰 컨텍스트와 함께 노트북 안에 뜬다. 더 큰 모델이 아니라 더 긴 생각이다. 더 긴 대화, 더 복잡한 에이전트 체인, 더 많은 문서를 한꺼번에 다루는 게 된다. 수첩 대신 도서관을 들고 다니는 셈이다.
클라크와 챌머스의 오토가 수첩을 믿었던 것처럼, AI 네이티브들이 RTX Spark를 믿을 수 있는 날이 온다면 그때 이 기계는 그냥 노트북이 아니라 생각의 인프라가 된다. 그 날이 2026년 가을 출시와 함께 오는지, 아니면 한 세대 더 기다려야 하는지는, 실측 리뷰가 쌓인 뒤에야 알 수 있을 것 같다. 에이릿이 그 기기를 처음으로 리뷰하는 매체가 되었으면 좋겠다.
FAQ
출시는 2026년 가을이다. ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI 여섯 곳이 첫 출시 파트너로 확정됐고, Acer와 Gigabyte도 이후 합류 예정이다. 노트북 30종 이상, 데스크톱 10종이 나올 예정이다. 가격은 아직 공개되지 않았다. NVIDIA가 직접 “프리미엄급”이라고 밝혔으니 MacBook Pro 16인치 M4 Pro(329만 원~) 이상의 가격대를 각오해야 한다. 정확한 가격은 가을 출시 직전에 공개될 것이다.
AI를 자주, 깊이 쓰는 사람이라면 따져볼 이유가 있다. 핵심은 메모리다. 지금 노트북으로는 70억~130억 파라미터 수준의 작은 모델만 로컬에서 돌릴 수 있다. RTX Spark는 128GB 통합 메모리로 1,200억 파라미터 모델을 100만 토큰 컨텍스트와 함께 노트북 안에서 직접 돌린다. 클라우드 API 없이, 데이터가 밖으로 나가지 않는 환경에서다. AI를 가끔 쓰는 사람에게는 과잉 사양이고 가격 부담이 크다. 매일 모델을 돌리고, 긴 컨텍스트가 필요하고, 데이터 보안이 중요한 사람에게는 처음으로 진지하게 고민할 만한 노트북이 나온 것이다.
대부분 돌아간다. 단, 조건이 있다. RTX Spark는 Arm 기반 칩이라 기존 인텔·AMD용으로 만든 앱은 Prism 에뮬레이션 레이어를 거쳐 실행된다. 2026년 현재 Adobe, Blackmagic, 주요 개발 환경, 생산성 앱 대부분은 이미 네이티브 Arm64로 전환됐다. 일부 분석에 따르면 이용자가 실제로 자주 쓰는 앱 기준 93% 이상이 호환된다고 보고되지만, 방법론 공식 검증은 아직 없다. 아직 안 되는 것들도 있다. 커널 드라이버에 깊이 기대는 앱들 — 일부 게임 안티치트, 특수 보안 솔루션, 전문 장비 드라이버 — 은 호환이 안 될 수 있다. 에뮬레이션으로 돌리는 앱은 배터리 소모가 15~20% 늘어난다는 점도 알아둬야 한다. 구매 전 자신이 꼭 써야 하는 앱 몇 가지를 먼저 확인하는 게 좋다.
구조는 비슷하고 방향은 다르다. 둘 다 CPU와 GPU가 같은 메모리를 쓰는 통합 메모리 설계다. Apple Silicon이 맥에서 만들어낸 그 이점을 Windows 환경에 가져온 것이 RTX Spark다. 차이는 GPU와 소프트웨어 생태계에 있다. RTX Spark는 Blackwell RTX GPU와 CUDA 풀스택을 그대로 쓴다. NVIDIA CUDA 기반으로 돌아가는 AI 개발 툴, 모델 학습 프레임워크, 로컬 추론 엔진들이 추가 설정 없이 돌아간다는 뜻이다. Apple Silicon은 CoreML, MLX 같은 자체 프레임워크로 AI를 지원하는데, CUDA 의존 워크플로우와 기존 NVIDIA GPU 기반 개발 환경을 그대로 쓰는 사람에게는 RTX Spark 쪽이 훨씬 친숙하다. GPU 성능 기준으로는 RTX 5070 노트북 GPU와 roughly equivalent 수준으로, 데스크톱 RTX 5070과는 다르다. 반대로 맥 생태계에 깊이 들어와 있는 사람에게는 전환 이유가 약하다.
기다리는 게 맞다. 이유는 세 가지다. 첫째, 아직 가격이 없다. 가을 출시 전까지 실제 가격과 구성을 확인할 수 없다. 둘째, 독립 벤치마크가 없다. NVIDIA의 “배터리 상태에서도 성능 동일” 같은 주요 주장들이 실제로 맞는지는 출시 후 Tom’s Hardware, Notebookcheck 같은 곳의 실측 리뷰가 나와야 알 수 있다. 셋째, 첫 세대 제품이다. Windows on Arm 환경의 앱 호환성, 드라이버 지원, 발열 관리는 실사용 리포트가 한 달쯤 쌓인 뒤에 윤곽이 잡힌다. 올 가을 출시 후 리뷰를 보고 결정해도 늦지 않다.
AiLit에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

