배경 / 문제
검진지에 흔한 표기가 정규화에서 빠지거나 오적중합니다. 특히 'Hb'가 rapidfuzz로 '당화혈색소'(HbA1c)에 오매칭되어, Hb=11(경도빈혈)이 중증당뇨로 해석되는 안전 버그가 있습니다.
제안 내용
혈색소·hb·γ-GTP·TG·SBP·사구체여과율 등 변형 표기를 동의어로 등록합니다. exact 매칭이 fuzzy보다 우선이라 오적중이 제거됩니다.
고민 (기술 선택 이유)
| 후보 |
장점 |
단점 |
| 동의어 등록 (채택) |
결정적·exact 우선으로 오적중 제거 |
표기 수집 필요 |
| fuzzy 임계값 상향 |
간단 |
정상 변형도 놓침 |
평가 지표
| 지표 |
목표값 |
측정 방법 |
| 오적중 |
0건 |
eval_rag.py |
| known_gap 해소 |
4건 회귀 승격 |
eval_rag.py |
완료 조건
배경 / 문제
검진지에 흔한 표기가 정규화에서 빠지거나 오적중합니다. 특히 'Hb'가 rapidfuzz로 '당화혈색소'(HbA1c)에 오매칭되어, Hb=11(경도빈혈)이 중증당뇨로 해석되는 안전 버그가 있습니다.
제안 내용
혈색소·hb·γ-GTP·TG·SBP·사구체여과율 등 변형 표기를 동의어로 등록합니다. exact 매칭이 fuzzy보다 우선이라 오적중이 제거됩니다.
고민 (기술 선택 이유)
평가 지표
완료 조건