가드레일 로그란?
사용자가 AI와 대화할 때, 가드레일은 입력과 출력을 검증합니다. 민감 정보가 탐지되면 설정된 전략(차단, 삭제, 마스킹 등)에 따라 처리하고, 그 결과를 로그로 기록합니다.로그 항목 구조
각 가드레일 로그 항목은 다음 정보를 포함합니다.| 필드 | 설명 |
|---|---|
| 타임스탬프 | 탐지 이벤트 발생 시간 |
| 사용자 | 입력한 사용자 (이름, 이메일) |
| 채팅 ID | 해당 대화 세션 |
| 메시지 ID | 해당 메시지 식별자 |
| 가드레일 이름 | 적용된 가드레일 |
| 액션 | 처리 전략 (차단, 삭제, 마스킹 등) |
| 감지 소스 | 탐지 방식 |
| 감지 상세 | 탐지된 구체적 내용 |
| 원본 내용 | 원본 입력 텍스트 |
| 처리 후 내용 | 전략 적용 후 텍스트 |
액션 유형
| 액션 | 설명 |
|---|---|
| block | 메시지 전체 차단 |
| redact | 민감 정보를 라벨로 대체 (예: [REDACTED_EMAIL]) |
| mask | 일부 문자만 표시 (예: j***@***.com) |
| hash | 해시값으로 변환 |
| log | 차단 없이 로그만 기록 |
감지 소스
| 소스 | 설명 |
|---|---|
| pii | 이메일, 신용카드, IP 주소 등 개인정보 패턴 탐지 |
| custom_pattern | 사용자 정의 정규식 패턴 탐지 |
| blocked_word | 금지 단어/문구 감지 |
| llm_judge | LLM 기반 콘텐츠 위험도 판정 |
필터 옵션
| 필터 | 설명 |
|---|---|
| 기간 | 시작/종료 날짜 범위 |
| 액션 | block, redact, mask, hash, log (복수 선택 가능) |
| 감지 소스 | pii, custom_pattern, blocked_word, llm_judge (복수 선택 가능) |
| 사용자 검색 | 사용자 ID, 이메일 또는 이름으로 검색 |
| 채팅 ID | 특정 채팅 세션의 로그만 조회 |
| 소스 | 요청 출처 필터 (예: code_gateway) |
로그 상세 보기
로그 항목을 클릭하면 상세 정보를 확인할 수 있습니다.- 탐지 상세
- 컨텍스트
| 항목 | 설명 |
|---|---|
| 가드레일 | 적용된 가드레일 이름 및 ID |
| 감지 소스 | PII, 커스텀 패턴, 금지 단어, LLM Judge |
| 감지 상세 | 탐지된 구체적 패턴 또는 항목 |
| 원본 내용 | 사용자가 입력한 원문 |
| 처리 후 내용 | 전략 적용 후 결과 |
트레이싱 연동
가드레일 로그 상세에서 트레이싱 보기 기능을 통해 해당 메시지의 전체 처리 과정을 확인할 수 있습니다.활용 사례
가드레일 정책 튜닝
가드레일 정책 튜닝
- 기간을 설정하고 감지 소스 별로 로그를 조회합니다
log액션의 이벤트를 검토하여 오탐(false positive) 비율을 파악합니다- 오탐이 많은 패턴은 정규식을 조정하거나 제외합니다
- 미탐지 사례를 발견하면 새로운 패턴이나 금지 단어를 추가합니다
보안 인시던트 대응
보안 인시던트 대응
- 특정 사용자의 가드레일 이벤트를 사용자 검색으로 조회합니다
block액션이 반복되는 패턴을 확인합니다- 원본 내용을 검토하여 의도적 민감 정보 유출 시도 여부를 판단합니다
- 관련 감사 로그와 교차 분석하여 전체 맥락을 파악합니다
LLM Judge 효과 분석
LLM Judge 효과 분석
- 감지 소스를
llm_judge로 필터링합니다 - 차단된 메시지의 원본 내용을 검토합니다
- 과도한 차단이 있다면 Judge 프롬프트의 허용 예시를 보강합니다
- 누락된 차단이 있다면 차단 예시를 추가합니다
가드레일 설정 연동
가드레일 로그에서 발견한 패턴을 바탕으로 가드레일 설정을 개선할 수 있습니다.| 로그 분석 결과 | 권장 조치 |
|---|---|
| 특정 PII 유형 탐지가 빈번 | 해당 유형의 처리 전략을 log → redact로 강화 |
| 오탐(false positive) 빈발 | 커스텀 패턴 정규식 범위 축소 |
| LLM Judge 차단율 과다 | Judge 프롬프트에 허용 예시 추가 |
| 새로운 민감 정보 패턴 발견 | 커스텀 패턴으로 정규식 추가 |
가드레일 설정 방법은 가드레일 문서를 참고하세요.
