Skip to content

[Feature] 검진지 변형 항목명 동의어 확장 (Hb 오적중·known_gap 해소) #32

@heejeongJ

Description

@heejeongJ

배경 / 문제

검진지에 흔한 표기가 정규화에서 빠지거나 오적중합니다. 특히 'Hb'가 rapidfuzz로 '당화혈색소'(HbA1c)에 오매칭되어, Hb=11(경도빈혈)이 중증당뇨로 해석되는 안전 버그가 있습니다.

제안 내용

혈색소·hb·γ-GTP·TG·SBP·사구체여과율 등 변형 표기를 동의어로 등록합니다. exact 매칭이 fuzzy보다 우선이라 오적중이 제거됩니다.

고민 (기술 선택 이유)

후보 장점 단점
동의어 등록 (채택) 결정적·exact 우선으로 오적중 제거 표기 수집 필요
fuzzy 임계값 상향 간단 정상 변형도 놓침

평가 지표

지표 목표값 측정 방법
오적중 0건 eval_rag.py
known_gap 해소 4건 회귀 승격 eval_rag.py

완료 조건

  • 동의어 대거 등록
  • 골든 known_gap 승격 + 혈색소 케이스
  • 정규화 회귀 테스트

Metadata

Metadata

Assignees

Labels

enhancementNew feature or request

Type

No type
No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions