CHOI on threads

구글이 결국 판을 바꿨습니다.
오픈 모델 "Gemma 4"가 Apache 2.0으로 공개되면서,
이제 기업들도 데이터 외부 유출 걱정 없이 자체 AI를 직접 구축할 수 있게 됐습니다.
로컬 실행, 에이전트 기능까지 가능한 핵심 사례를 모았습니다🧵

1/ 이번 발표에서 개발자 커뮤니티가 가장 환호한 부분은 바로 라이선스입니다.

구글은 오픈소스 라이선스가 필요하다는 피드백을 수용하여, Gemma 4를 상업적으로 완전히 자유롭게 사용할 수 있는 'Apache 2.0' 라이선스로 배포했습니다.

이는 외부 API에 의존할 필요 없이 기업이 자신의 인프라와 데이터에 대한 완벽한 통제권(디지털 주권)을 쥐고, 사내망에서 보안 걱정 없이 강력한 AI 도구를 마음껏 개발하고 배포할 수 있습니다.

2/ Gemma 4는 하드웨어 환경에 맞춰 E2B(Effective 2B), E4B, 26B MoE(전문가 혼합), 31B Dense라는 4가지 다재다능한 크기로 출시되었습니다.

가장 큰 31B 모델은 파라미터 크기가 20배나 큰 거대 모델들을 압도하며 현재 Arena AI 텍스트 리더보드에서 전 세계 오픈 모델 3위를 기록 중이고, 26B MoE 모델은 추론 시 단 38억 개의 파라미터만 활성화하여 엄청나게 빠른 속도를 자랑합니다.

이 두 모델은 단일 80GB H100 GPU에 들어가며, 양자화(Quantized) 시 일반 소비자용 GPU에서도 로컬 코딩 어시스턴트로 훌륭하게 작동합니다.

1 / 2

3/ Gemma 4는 오픈 모델임에도 불구하고 최상위 상용 모델(예: Claude 3.5 Sonnet)과 맞먹는 엄청난 길이의 문맥을 한 번에 처리할 수 있습니다.

모바일과 엣지 기기용 모델은 128K, 더 큰 모델들은 최대 256K의 컨텍스트 윈도우를 제공합니다.

이제 개발자들은 거대한 코드 저장소(Repository) 전체나 수백 페이지의 문서를 잘게 쪼갤 필요 없이 한 번의 프롬프트에 통째로 집어넣고 분석을 지시할 수 있게 되었습니다.

4/ Gemma 4는 스스로 논리적으로 사고하고 행동하는 자율 에이전트(Autonomous Agent) 구축에 특화되어 있습니다.

구조화된 JSON 출력, 네이티브 시스템 명령어, 그리고 '네이티브 함수 호출(Native function-calling)'을 지원합니다.

이는 LangChain 같은 무거운 외부 프레임워크를 거치지 않고도 모델이 직접 외부 API와 도구를 호출하고 결과를 받아 실행할 수 있다는 뜻으로, 에이전트 개발과 RAG(검색 증강 생성) 시스템 구축의 효율성이 획기적으로 상승하게 됩니다.

5/ Gemma 4 제품군은 오프라인 상태에서도 고품질의 코드 생성을 지원하여 개인 PC를 완벽한 로컬 AI 코딩 비서로 만들어 줍니다.

여기에 더해 모든 모델이 다양한 해상도의 비디오와 이미지를 기본적으로 처리할 수 있어 OCR이나 차트 이해 같은 시각적 작업에 탁월합니다.

특히 배터리와 메모리 소모를 극도로 줄인 E2B, E4B 모델은 안드로이드 스마트폰이나 라즈베리 파이 같은 엣지 기기에서 완전히 오프라인으로 지연 없이 작동하며, 네이티브 오디오 입력까지 지원해 음성 인식과 시각 처리가 결합된 진정한 모바일 AI 환경을 제공합니다.

papayaya74 와 기대된다 Apr 3 1 like

양준모 M5 16gb에는 무리겠지요..? Apr 4