Skip to content

[Feature] F-007 챗봇 문서 정합성 및 평가 근거 정리 #89

@SJvaca30

Description

@SJvaca30

배경 / 문제

F-007 챗봇 백엔드는 검진 결과 해석 보조 범위에서 구현과 검증이 진행되었으나, 일부 문서에는 아직 챗봇 미구현, UI 미연동, 오래된 평가 건수 같은 표현이 남아 있습니다. 발표와 리뷰 과정에서 현재 완성 범위와 남은 평가 과제를 명확히 구분할 필요가 있습니다.

제안 내용

README, F-007 설계 문서, RAG 평가 문서, evaluation README의 F-007 관련 설명을 현재 상태에 맞게 정리합니다. 기능 코드는 변경하지 않고, 장기 대화 memory와 UI 작업은 범위에서 제외합니다.

고민 (기술 선택 이유)

후보 장점 단점
문서 정합성만 우선 정리 현재 구현 상태와 발표 근거를 빠르게 맞출 수 있음 평가 데이터 확장은 별도 이슈가 필요함
평가셋 확장까지 한 번에 처리 검증 범위가 넓어짐 문서 정리와 데이터 확장이 섞여 리뷰 범위가 커짐

이번 이슈에서는 기능 완성 범위를 증명하는 문서 정합성에 집중하고, 실제 업로드 결과와 사용자군 확장 평가는 별도 후속 이슈로 분리합니다.

평가 지표

지표 목표값 측정 방법
F-007 문서 상태 표현 정합성 오래된 미구현 표현 0건 문서 검색
기존 테스트 회귀 전체 통과 pytest
챗봇 라우팅 평가 100% 유지 evaluation/chat_eval.py --no-log
챗봇 통합 정책 평가 100% 유지 evaluation/chat_answer_service_eval.py --no-log

완료 조건

  • F-007 현재 범위가 검진 결과 해석 보조임을 문서에 명확히 반영
  • 미구현 또는 UI 미연동 등 오래된 표현 정리
  • F-007 평가 명령과 현재 검증 범위 문서화
  • 기존 테스트와 F-007 평가 통과

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions