11 · Central Relearning
중앙 재학습 오케스트레이션
기획서 §13 의 우선순위(Router > Tool > Planner > Adapter > RAG) 대로 5종을 동시에 학습합니다. 완성된 어댑터·정책은 즉시 다음 Intelligence Pack 의 후보가 됩니다.
1. router
0
대기 샘플
2. tool_use
0
대기 샘플
3. planner
0
대기 샘플
4. sft
0
대기 샘플
5. dpo
0
대기 샘플
우선순위 그대로 동시 학습 큐
기획서 §13 — 같은 라운드에서 5종을 병렬로 학습 후 함께 평가
현재 상태
C안의 LlamaFactory adapter 가 그대로 활성화돼 있습니다. A안 자체 큐는 다음 단계에서 통합 예정.