Spaces:

BinKhoaLe1812
/

Medical-Chatbot

Sleeping

App Files Files Community

BinKhoaLe1812 commited on Oct 8

Commit

c82ba47

verified ·

1 Parent(s): 0c0f651

Upd reranker

Browse files

Files changed (1) hide show

api/retrieval.py +125 -2

api/retrieval.py CHANGED Viewed

@@ -1,15 +1,61 @@
 # api/retrieval.py
 import numpy as np
 import logging
 from .database import db_manager
-logger = logging.getLogger("medical-chatbot")
 class RetrievalEngine:
     def __init__(self):
         self.db_manager = db_manager
-    def retrieve_medical_info(self, query: str, k: int = 5, min_sim: float = 0.9) -> list:
         """
         Retrieve medical information from FAISS index
         Min similarity between query and kb is to be 80%
@@ -66,6 +112,30 @@ class RetrievalEngine:
                 kept.append(answer)
                 kept_vecs.append(new_vec)
         return kept if kept else [""]
     def retrieve_diagnosis_from_symptoms(self, symptom_text: str, top_k: int = 5, min_sim: float = 0.5) -> list:
@@ -98,3 +168,56 @@ class RetrievalEngine:
 # Global retrieval engine instance
 retrieval_engine = RetrievalEngine()

 # api/retrieval.py
+import os
+import re
+import time
+import requests
 import numpy as np
 import logging
+from typing import List, Dict
 from .database import db_manager
+from models import summarizer
+logger = logging.getLogger("retrieval-bot")
 class RetrievalEngine:
     def __init__(self):
         self.db_manager = db_manager
+        self._reranker = _NvidiaReranker()
+    @staticmethod
+    def _is_cpg_text(text: str) -> bool:
+        """Heuristic to detect Clinical Practice Guideline (CPG) content."""
+        if not text:
+            return False
+        keywords = [
+            # common CPG indicators
+            r"\bguideline(s)?\b", r"\bclinical practice\b", r"\brecommend(ation|ed|s)?\b",
+            r"\bshould\b", r"\bmust\b", r"\bstrongly (recommend|suggest)\b",
+            r"\bNICE\b", r"\bAHA\b", r"\bACC\b", r"\bWHO\b", r"\bUSPSTF\b", r"\bIDSA\b",
+            r"\bclass (I|IIa|IIb|III)\b", r"\blevel (A|B|C)\b"
+        ]
+        text_lc = text.lower()
+        return any(re.search(p, text_lc, flags=re.IGNORECASE) for p in keywords)
+    @staticmethod
+    def _extract_guideline_sentences(text: str) -> str:
+        """Extract likely guideline sentences to reduce conversational/noisy content before summarization."""
+        if not text:
+            return ""
+        sentences = re.split(r"(?<=[.!?])\s+", text)
+        keep_patterns = [
+            r"\b(recommend|should|must|indicated|contraindicated|preferred|first-line|consider)\b",
+            r"\b(class\s*(I|IIa|IIb|III)|level\s*(A|B|C))\b",
+            r"\b(dose|mg|route|frequency)\b",
+            r"\b(screen|treat|manage|evaluate|monitor)\b"
+        ]
+        kept = []
+        for s in sentences:
+            s_norm = s.strip()
+            if not s_norm:
+                continue
+            if any(re.search(p, s_norm, flags=re.IGNORECASE) for p in keep_patterns):
+                kept.append(s_norm)
+        # Fallback: if filtering too aggressive, keep truncated original
+        if not kept:
+            return text[:1200]
+        return " ".join(kept)[:2000]
+    def retrieve_medical_info(self, query: str, k: int = 5, min_sim: float = 0.8) -> list:
         """
         Retrieve medical information from FAISS index
         Min similarity between query and kb is to be 80%
                 kept.append(answer)
                 kept_vecs.append(new_vec)
+        # If any CPG-like content is present, rerank with NVIDIA NIM reranker and summarize to key guidelines
+        try:
+            cpg_candidates = [t for t in kept if self._is_cpg_text(t)]
+            if cpg_candidates:
+                logger.info("[Retrieval] CPG content detected; invoking NVIDIA reranker")
+                reranked = self._reranker.rerank(query, cpg_candidates)
+                # Keep only valid high-scoring items
+                filtered: List[Dict] = [r for r in reranked if r.get("score", 0) >= 0.3 and r.get("text")]
+                # Limit to top 3 for prompt efficiency
+                top_items = filtered[:3]
+                if top_items:
+                    summarized: List[str] = []
+                    for item in top_items:
+                        guideline_text = self._extract_guideline_sentences(item["text"])
+                        # Summarize to key clinical guidelines only (no conversational content)
+                        concise = summarizer.summarize_text(guideline_text, max_length=300)
+                        if concise:
+                            summarized.append(concise)
+                    # If summarization produced results, replace kept with these
+                    if summarized:
+                        kept = summarized
+        except Exception as e:
+            logger.warning(f"[Retrieval] CPG rerank/summarize step skipped due to error: {e}")
         return kept if kept else [""]
     def retrieve_diagnosis_from_symptoms(self, symptom_text: str, top_k: int = 5, min_sim: float = 0.5) -> list:
 # Global retrieval engine instance
 retrieval_engine = RetrievalEngine()
+class _NvidiaReranker:
+    """Simple client for NVIDIA NIM reranking: nvidia/rerank-qa-mistral-4b"""
+    def __init__(self):
+        self.api_key = os.getenv("NVIDIA_URI")
+        self.model = "nvidia/rerank-qa-mistral-4b"
+        # NIM rerank endpoint (subject to environment); keep configurable
+        self.base_url = os.getenv("NVIDIA_RERANK_ENDPOINT", "https://ai.api.nvidia.com/v1/retrieval/nvidia/reranking")
+        self.timeout_s = 30
+    def rerank(self, query: str, documents: List[str]) -> List[Dict]:
+        if not self.api_key:
+            raise ValueError("NVIDIA_URI not set for reranker")
+        if not documents:
+            return []
+        headers = {
+            "Authorization": f"Bearer {self.api_key}",
+            "Content-Type": "application/json",
+        }
+        payload = {
+            "model": self.model,
+            "query": query,
+            "documents": [{"text": d} for d in documents],
+        }
+        try:
+            resp = requests.post(self.base_url, headers=headers, json=payload, timeout=self.timeout_s)
+            resp.raise_for_status()
+            data = resp.json()
+            # Expecting a list with scores and indices or texts
+            results = []
+            entries = data.get("results") or data.get("data") or []
+            if isinstance(entries, list) and entries:
+                for entry in entries:
+                    # Common patterns: {index, score} or {text, score}
+                    idx = entry.get("index")
+                    text = entry.get("text") if entry.get("text") else (documents[idx] if idx is not None and idx < len(documents) else None)
+                    score = entry.get("score", 0)
+                    if text:
+                        results.append({"text": text, "score": float(score)})
+            else:
+                # Fallback: if API returns scores aligned to input order
+                scores = data.get("scores")
+                if isinstance(scores, list) and len(scores) == len(documents):
+                    for t, s in zip(documents, scores):
+                        results.append({"text": t, "score": float(s)})
+            # Sort by score desc
+            results.sort(key=lambda x: x.get("score", 0), reverse=True)
+            return results
+        except Exception as e:
+            logger.warning(f"[Reranker] Failed calling NVIDIA reranker: {e}")
+            # On failure, return original order with neutral scores
+            return [{"text": d, "score": 0.0} for d in documents]