인덱스를 아티팩트로 취급하는 설계
인덱스를 산출물로 고정한다. 빌드는 영속 인덱스 파일과 메타데이터를 만들고, 쿼리는 로드·실행만 수행해 환경 간 재현·회귀가 쉬워진다.
zvec는 벡터 검색을 ‘인덱스 빌드’와 ‘쿼리 실행’의 2단 구조로 엔지니어링한다. 오프라인에서 embedding을 영속 가능한 ANN 인덱스로 만들고, 온라인에서 recall/지연 예산을 명시해 근사 최근접 탐색을 수행하며, 배치·병렬·SIMD 최적화를 핫패스에 둔다. 풀스택 벡터 DB 없이도 검색·추천 리콜·멀티모달 파이프라인에 임베드하기 좋은 인프라 컴포넌트다.
| ✕기존 문제점 | ✓혁신적 솔루션 |
|---|---|
| 벡터 검색을 앱 코드에 붙여 넣으면 인덱스 포맷·파라미터·튜닝이 흩어져 재현이 어렵고 회귀 원인도 찾기 힘들다. | zvec는 인덱스를 아티팩트로 승격해 빌드와 쿼리를 분리한다. 인덱스는 영속·버전 관리되고 온라인은 로드·실행에 집중해 회귀를 통제한다. |
| 풀 벡터 DB는 운영면과 데이터 경로 변경이 커서 경량 리콜에는 과하다. | ANN 실행층에 최적화를 모아 지연/처리량을 끌어올리고, 설정으로 recall–성능 절충을 제어해 임베디드 배치에 적합하다. |
1git clone https://github.com/alibaba/zvec.git && cd zvec1# 저장소 빌드 명령을 따른다(예: cargo build --release 또는 cmake --build)1# 예: zvec build-index --input embeddings.bin --output index.zv --config config.yaml1# 예: zvec query --index index.zv --vector query.bin --topk 101# 고정 쿼리 셋과 기대 topK를 저장해 버전 간 비교가 가능하게 한다| 핵심 시나리오 | 대상 고객 | 솔루션 | 최종 결과 |
|---|---|---|---|
| 시맨틱 검색용 임베디드 ANN 리콜 레이어 | 검색/지식베이스 팀 | embedding 근접 리콜을 기존 검색 체인에 임베드 | 지연 예산 내 리콜 개선과 회귀 가능한 튜닝 |
| 추천 시스템 벡터 리콜과 AB 반복 | 추천/그로스 팀 | 오프라인 인덱스, 온라인 저지연 후보 리콜 | 리콜을 버전 컴포넌트로 운영해 AB·롤백 안정화 |
| 온프레미스/엣지 멀티모달 벡터 검색 컴포넌트 | 멀티모달 팀 | 로컬 환경에서 벡터 검색 운영 | 데이터 경계·비용을 통제하고 하드웨어에 맞춰 처리량 확장 |