배경 / 문제
F-007 챗봇 백엔드는 검진 결과 해석 보조 범위에서 구현과 검증이 진행되었으나, 일부 문서에는 아직 챗봇 미구현, UI 미연동, 오래된 평가 건수 같은 표현이 남아 있습니다. 발표와 리뷰 과정에서 현재 완성 범위와 남은 평가 과제를 명확히 구분할 필요가 있습니다.
제안 내용
README, F-007 설계 문서, RAG 평가 문서, evaluation README의 F-007 관련 설명을 현재 상태에 맞게 정리합니다. 기능 코드는 변경하지 않고, 장기 대화 memory와 UI 작업은 범위에서 제외합니다.
고민 (기술 선택 이유)
| 후보 |
장점 |
단점 |
| 문서 정합성만 우선 정리 |
현재 구현 상태와 발표 근거를 빠르게 맞출 수 있음 |
평가 데이터 확장은 별도 이슈가 필요함 |
| 평가셋 확장까지 한 번에 처리 |
검증 범위가 넓어짐 |
문서 정리와 데이터 확장이 섞여 리뷰 범위가 커짐 |
이번 이슈에서는 기능 완성 범위를 증명하는 문서 정합성에 집중하고, 실제 업로드 결과와 사용자군 확장 평가는 별도 후속 이슈로 분리합니다.
평가 지표
| 지표 |
목표값 |
측정 방법 |
| F-007 문서 상태 표현 정합성 |
오래된 미구현 표현 0건 |
문서 검색 |
| 기존 테스트 회귀 |
전체 통과 |
pytest |
| 챗봇 라우팅 평가 |
100% 유지 |
evaluation/chat_eval.py --no-log |
| 챗봇 통합 정책 평가 |
100% 유지 |
evaluation/chat_answer_service_eval.py --no-log |
완료 조건
배경 / 문제
F-007 챗봇 백엔드는 검진 결과 해석 보조 범위에서 구현과 검증이 진행되었으나, 일부 문서에는 아직 챗봇 미구현, UI 미연동, 오래된 평가 건수 같은 표현이 남아 있습니다. 발표와 리뷰 과정에서 현재 완성 범위와 남은 평가 과제를 명확히 구분할 필요가 있습니다.
제안 내용
README, F-007 설계 문서, RAG 평가 문서, evaluation README의 F-007 관련 설명을 현재 상태에 맞게 정리합니다. 기능 코드는 변경하지 않고, 장기 대화 memory와 UI 작업은 범위에서 제외합니다.
고민 (기술 선택 이유)
이번 이슈에서는 기능 완성 범위를 증명하는 문서 정합성에 집중하고, 실제 업로드 결과와 사용자군 확장 평가는 별도 후속 이슈로 분리합니다.
평가 지표
완료 조건