BACK
🏆 2025 오픈소스 개발자대회 수상

RAGIT

Retrieval-Augmented Generation with Intelligent Tracking

마이크로서비스 아키텍처 기반의 Self-hosted RAG 시스템.
벡터 임베딩과 LLM을 결합하여 대규모 코드베이스에 대한
AI 기반 의미론적 검색과 대화형 인터페이스를 제공합니다.

RAGIT 2025 오픈소스 개발자대회 수상

RAG WORKER PIPELINE

RAGIT의 핵심 엔진인 RAG Worker는 코드베이스를 지능적으로 분석하고
벡터화하여 의미론적 검색과 AI 응답을 가능하게 합니다.

RAG Worker Pipeline Architecture
01

Code Parsing & Chunking

GitHub URL 입력 → Git Clone → Python AST 분석으로 코드를 type별(module, function, class)로 청킹. 각 청크는 파일 경로, 라인 넘버, 코드 본문 등 메타데이터를 포함합니다.

02

Vector Embedding

코드 전용 임베딩 모델(SFR-Embedding-Code-400M_R)로 벡터화하여 Milvus Vector DB에 저장. 메타데이터는 필터링용으로 함께 인덱싱됩니다.

03

Intelligent Search

MetaData Agent (예정)가 질문을 분석하여 검색 범위를 축소 → 벡터 유사도 측정으로 Top-k 관련 코드 블록을 추출합니다.

04

Context-Aware Response

원본 질문 + 검색된 코드 컨텍스트로 프롬프트 생성 → GPT API로 정확한 답변을 도출하여 Redis에 캐싱합니다.

Incremental Update

Git diff 기반 증분 업데이트로 변경된 부분만 재임베딩. 불필요한 연산 비용을 대폭 절감합니다.

🎯

하이브리드 검색

AI Agent가 질문을 분석하여 적절한 필터 조건을 생성. 전체 벡터가 아닌 축소된 범위에서 정밀 검색합니다.

📊

Validated Performance

CodeSearchNet 데이터셋으로 검증. 자연어-코드 매칭 성능을 정량적으로 측정하여 최적화했습니다.

VECTOR DB OPTIMIZATION

RAG 시스템의 성능은 Vector DB 선택과 설정에 크게 좌우됩니다.
RAGIT은 다양한 벤치마크를 통해 최적의 구성을 도출했습니다.

Milvus Selected Vector DB
IVF_FLAT Index Type
L2 Distance Metric

Collection의 인덱스 규칙, 거리 측정 방식, 파티션 전략을 조절하여
대규모 코드베이스에서도 밀리초 단위 검색 성능을 달성했습니다.

KEY FEATURES

🔍

Semantic Code Search

Milvus 벡터 데이터베이스를 활용한 의미론적 코드 검색. 자연어로 코드를 검색하고 관련 컨텍스트를 즉시 찾아냅니다.

💬

AI-Powered Chat

LLM 통합으로 코드베이스에 대한 자연어 질의응답. 코드 구조, 로직, 의존성에 대해 대화하듯 물어보세요.

Async Processing

Celery 기반 백그라운드 워커로 무거운 임베딩 작업을 비동기 처리. 대규모 레포지토리도 문제없이 인덱싱합니다.

📦

Fully Dockerized

9개의 컨테이너화된 서비스로 어디서든 동일한 환경 보장. docker-compose up 한 번으로 전체 스택 실행.

QUICK START

01

Clone & Configure

Terminal
# Clone the repository
git clone https://github.com/Gyu-Chul/RAGIT.git
cd RAGIT

# Set your OpenAI API key in docker-compose.yml
# rag-worker → environment → OPENAI_API_KEY
02

Run with Docker

Terminal
# Start all services (GPU)
docker-compose up -d

# Or without GPU
docker-compose -f docker-compose.cpu.yml up -d

# Wait 60-90 seconds for healthy status
docker-compose ps
03

Access & Start

Frontend UI localhost:8000
API Docs localhost:8001/docs
Gateway localhost:8080

START EXPLORING YOUR CODEBASE

RAGIT으로 코드베이스를 지능적으로 탐색하세요.