메뉴얼
9 · Evaluation

벤치마크 / 평가

LLM-as-judge 와 도메인 벤치마크로 어댑터의 응답 품질을 점수화합니다. before/after 비교까지 자동으로 누적됩니다.

코어 옵션 · 팩토리 동선

사이드바는 8코어 중심으로 두고, 세부 단계·프로브는 이 스트립에서 연결합니다.

전체 비교 엔진
비교

카드의「비교 (팝업)」은 RAG 바를 숨긴 빠른 모드입니다. LeafPlan 문맥까지 쓰려면 전체 비교로 이동하세요.

데이터

파싱·RAG·등록 파이프라인은 데이터셋 빌더에서 프로젝트·폴더를 지정한 뒤 학습 포맷으로 넘깁니다.

산출물

어댑터·런타임·RAG 슬롯은 Pack / Manifest빌드 시 동결됩니다.

정책

Provider 키·조직 시크릿은 API 키·설정을 SoT 로 두는 것을 권장합니다.

새 평가 실행

어댑터가 없습니다.

평가 기록 (0)

평가 결과가 없습니다.

A/B 어댑터 비교

이전 /finetuning/ab 경로는 여기로 통합되었습니다.

A/B 대상 선택

두 어댑터를 직접 비교합니다 (통합 영역)

A
B

A 어댑터를 선택하세요.

B 어댑터를 선택하세요.