.NET 데스크톱 앱에 Gemma 4 음성 인식 추가하기: llama-server 사이드카가 살아남은 방법
(dev.to)
.NET 기반 데스크톱 앱에 Google의 멀티모달 모델 Gemma 4를 온디바이스로 통합하기 위해, ONNX와 Python 방식의 한계를 극복하고 llama-server를 사이드카 프로세스로 채택한 기술적 여정과 최적의 런타임 선택 전략을 분석합니다.
이 글의 핵심 포인트
- 1Gemma 4의 멀티모달 오디오 기능을 .NET 10 데스크톱 앱에 온디바이스로 통합 시도
- 2ONNX Runtime GenAI의 구조적 미지원(Per-layer embeddings 등)으로 인한 첫 번째 실패 사례 분석
- 3