문서 설정

관리자 > 설정 > 문서 탭에서 지식기반 및 RAG(Retrieval-Augmented Generation) 시스템의 핵심 설정을 관리합니다.

콘텐츠 추출

문서에서 텍스트를 추출하는 엔진을 선택합니다.

엔진	특징	적합한 경우
기본 (Default)	내장 텍스트 추출기	간단한 텍스트 문서
Tika	Apache Tika 서버 기반	다양한 파일 포맷 지원 필요
Docling	고급 문서 처리 엔진	복잡한 레이아웃의 문서
Document Intelligence	Azure AI Document Intelligence	Azure 환경, 정확한 OCR 필요
Document AI	Google Cloud Document AI (Layout Parser)	표, 양식, 다단 레이아웃
Mistral OCR	Mistral 기반 OCR	이미지 기반 문서

문서를 벡터로 변환하는 임베딩 엔진과 모델을 설정합니다.

지원 엔진:

로컬 환경에서 실행되는 오픈소스 임베딩 엔진입니다.

설정 항목	설명
모델	HuggingFace 모델명 (예: `sentence-transformers/all-MiniLM-L6-v2`)

설정 항목	설명
API URL	Ollama 서버 주소
모델	예: `nomic-embed-text`

RAG 검색 시 결과 품질을 제어하는 파라미터입니다.

설정 항목	설명
최대 파일 크기	단일 파일 업로드 최대 크기
최대 파일 수	한 번에 업로드할 수 있는 파일 수

외부 클라우드 스토리지에서 문서를 가져올 수 있습니다.