콘텐츠 추출
문서에서 텍스트를 추출하는 엔진을 선택합니다.| 엔진 | 특징 | 적합한 경우 |
|---|---|---|
| 기본 (Default) | 내장 텍스트 추출기 | 간단한 텍스트 문서 |
| Tika | Apache Tika 서버 기반 | 다양한 파일 포맷 지원 필요 |
| Docling | 고급 문서 처리 엔진 | 복잡한 레이아웃의 문서 |
| Document Intelligence | Azure AI Document Intelligence | Azure 환경, 정확한 OCR 필요 |
| Document AI | Google Cloud Document AI (Layout Parser) | 표, 양식, 다단 레이아웃 |
| Mistral OCR | Mistral 기반 OCR | 이미지 기반 문서 |
임베딩 설정
문서를 벡터로 변환하는 임베딩 엔진과 모델을 설정합니다.| 설정 항목 | 설명 | 기본값 |
|---|---|---|
| 임베딩 엔진 | 벡터 변환에 사용할 서비스 | SentenceTransformers |
| 임베딩 모델 | 사용할 모델 이름 | - |
| 배치 크기 | 한 번에 처리할 문서 수 | 1 |
| 임베딩 차원 | 벡터 차원 수 (0 = 자동) | 0 |
- SentenceTransformers
- OpenAI
- Azure OpenAI
- Ollama
- Vertex AI
로컬 환경에서 실행되는 오픈소스 임베딩 엔진입니다.
| 설정 항목 | 설명 |
|---|---|
| 모델 | HuggingFace 모델명 (예: sentence-transformers/all-MiniLM-L6-v2) |
검색 설정
RAG 검색 시 결과 품질을 제어하는 파라미터입니다.| 설정 항목 | 설명 | 기본값 |
|---|---|---|
| Top K | 검색 결과로 반환할 문서 개수 | 5 |
| 관련도 임계값 | 최소 유사도 점수 (0.0 = 필터링 없음) | 0.0 |
| 하이브리드 검색 | 키워드 검색 + 의미 검색 병합 | 활성화 권장 |
| 리랭킹 | 검색 결과를 LLM으로 재정렬 | 활성화 권장 |
| 쿼리 템플릿 | RAG 검색 쿼리 커스텀 템플릿 | - |
파일 업로드 제한
| 설정 항목 | 설명 |
|---|---|
| 최대 파일 크기 | 단일 파일 업로드 최대 크기 |
| 최대 파일 수 | 한 번에 업로드할 수 있는 파일 수 |
클라우드 스토리지 연동
외부 클라우드 스토리지에서 문서를 가져올 수 있습니다.| 스토리지 | 설명 |
|---|---|
| Google Drive | Google Drive 파일 가져오기 |
| OneDrive | Microsoft OneDrive 연동 |
| SharePoint | SharePoint 문서 라이브러리 연동 |
