챗GPT보다 안전한 슈퍼 비서…엔비디아와 구글이 내놓은 뜻밖의 '해답'

2026-04-06 14:29

add remove print link

보안 걱정 없는 개인용 AI, 클라우드 독주에 도전장

오픈AI의 챗GPT가 주도하는 클라우드 AI 열풍 이면의 개인정보 유출 우려와 연결 제약 한계를 극복하기 위해 엔비디아와 구글이 손잡고 강력한 로컬 AI 생태계를 구축하며 독주 체제에 도전장을 내밀었다.

NVIDIA와 구글의 젬마 4 / 엔비디아
NVIDIA와 구글의 젬마 4 / 엔비디아

클라우드 기반 인공지능이 가진 보안 취약점과 인터넷 의존성을 해결하려는 움직임이 가속화되는 가운데 구글의 최신 오픈 모델인 젬마 4(Gemma 4) 제품군이 그 대안으로 떠올랐다. 온디바이스(On-device, 기기 자체 탑재) AI 시대를 겨냥한 이번 모델은 데이터센터뿐만 아니라 일반 가정의 PC와 워크스테이션에서도 실시간 로컬 컨텍스트(사용자 주변 정보 및 데이터 상황)를 처리할 수 있도록 설계되었다. 엔비디아는 자사의 그래픽 처리 장치인 RTX 시리즈부터 엣지 컴퓨팅용 젯슨 오린 나노에 이르기까지 젬마 4를 최적화하며 하드웨어 가속 성능을 극대화했다.

젬마 4 모델군은 사용자의 하드웨어 환경과 목적에 따라 네 가지 세부 모델로 나뉜다. 저전력 엣지 디바이스에 최적화된 E2B와 E4B 모델은 초저지연 성능을 바탕으로 완전한 오프라인 상태에서도 지능형 작업을 수행한다. 반면 고성능 연산을 요하는 26B와 31B 모델은 에이전틱 AI(스스로 판단하고 도구를 조작하는 인공지능) 구현에 특화되어 개발자들의 코딩 지원이나 복잡한 워크플로우 자동화에 활용된다. 특히 35개 이상의 언어를 기본 지원하고 이미지와 텍스트가 결합된 인터리브드(Interleaved, 교차 배치된) 멀티모달 입력을 지원해 사용자 경험의 폭을 넓혔다.

기술적인 성능 지표에서도 진일보한 수치가 확인되었다. 엔비디아 지포스 RTX 5090과 맥 M3 울트라 환경에서 측정된 데이터에 따르면 젬마 4는 높은 토큰 생성 처리량을 기록하며 실질적인 업무 적용 가능성을 입증했다. 시각 처리 능력인 비전 기능은 물론 비디오와 오디오 분석 기능까지 통합되어 객체 인식과 자동 음성 인식 등 고차원적인 멀티모달 상호작용이 가능해졌다. 이러한 성능은 엔비디아의 텐서 코어(Tensor Core, AI 연산 전용 가속기)와 CUDA 소프트웨어 스택이 모델의 연산 구조를 하드웨어 단위에서 뒷받침했기에 가능했던 결과다.

단순 자료 사진. 기사 이해를 돕기 위해 AI로 제작한 이미지.
단순 자료 사진. 기사 이해를 돕기 위해 AI로 제작한 이미지.

로컬 환경에서 작동하는 인공지능 비서의 확산은 보안을 중시하는 기업 시장에 새로운 변화를 예고한다. 오픈클로(OpenClaw) 같은 애플리케이션은 사용자의 개인 파일과 워크플로우를 학습하면서도 데이터 외부 유출을 원천 차단한다. 엔비디아는 보안성을 더욱 강화하기 위해 니모클로(NemoClaw)라는 오픈소스 스택을 공개하며 독자적인 로컬 AI 생태계 구축을 지원하고 나섰다. 사용자는 별도의 API(응용 프로그램 인터페이스) 키를 발급받지 않고도 자신의 컴퓨터 자원만으로 빠르고 안전하게 인공지능을 활용할 수 있다.

개발자와 일반 사용자를 위한 배포 도구의 편의성도 크게 개선되었다. 올라마(Ollama)나 라마.cpp(llama.cpp)를 이용하면 복잡한 코딩 작업 없이도 젬마 4 모델을 즉시 개인 PC에 설치할 수 있다. 언슬로스(Unsloth)는 모델의 데이터 크기를 줄이는 양자화 기술을 적용해 일반적인 사양의 컴퓨터에서도 효율적인 파인튜닝(미세 조정)과 배포가 가능하도록 돕는다. 어컴플리시(Accomplish.ai)가 선보인 무료 버전 에이전트는 로컬 하드웨어와 클라우드 간의 업무 비중을 지능적으로 분산해 최적의 속도를 보장하는 하이브리드 방식을 채택했다.

결국 엔비디아와 구글의 이번 협력은 인공지능 기술의 중심축을 거대 클라우드 서버에서 개별 사용자의 디바이스로 이동시키는 중대한 분기점이 될 것으로 보인다. 개인화된 데이터의 외부 유출 걱정 없이 고성능 인공지능을 누릴 수 있는 환경이 조성되면서 폐쇄적인 클라우드 AI 서비스와의 경쟁은 더욱 치열해질 전망이다. 이는 단순히 하드웨어 판매량을 늘리는 차원을 넘어 사용자 한 명 한 명이 자신만의 독립된 AI 슈퍼컴퓨터를 소유하는 시대로의 진입을 의미한다.

home 조희준 기자 chojoon@wikitree.co.kr

NewsChat