9 · Evaluation
벤치마크 / 평가
LLM-as-judge 와 도메인 벤치마크로 어댑터의 응답 품질을 점수화합니다. before/after 비교까지 자동으로 누적됩니다.
코어 옵션 · 팩토리 동선
사이드바는 8코어 중심으로 두고, 세부 단계·프로브는 이 스트립에서 연결합니다.
비교
카드의「비교 (팝업)」은 RAG 바를 숨긴 빠른 모드입니다. LeafPlan 문맥까지 쓰려면 전체 비교로 이동하세요.
데이터
파싱·RAG·등록 파이프라인은 데이터셋 빌더에서 프로젝트·폴더를 지정한 뒤 학습 포맷으로 넘깁니다.
산출물
어댑터·런타임·RAG 슬롯은 Pack / Manifest빌드 시 동결됩니다.
새 평가 실행
어댑터가 없습니다.
평가 기록 (0)
평가 결과가 없습니다.
A/B 어댑터 비교
이전 /aiworks/ab 경로는 여기로 통합되었습니다.
A/B 대상 선택
두 어댑터를 직접 비교합니다 (통합 영역)
A
B
A 어댑터를 선택하세요.
B 어댑터를 선택하세요.