Chatbot RAG – Tư vấn Quy chế Sinh viên ĐHQT

✓ Hoàn thành 2026-04-13

Mô tả dự án

Hệ thống chatbot hỏi đáp thông minh chuyên biệt cho Trường Đại học Quốc tế – ĐHQG-HCM, giúp sinh viên tra cứu quy chế học vụ, kỷ luật, học bổng và các chính sách của nhà trường một cách chính xác và nhanh chóng.

Kiến trúc nổi bật:
- Hybrid Search: Kết hợp Dense Retrieval (Qdrant vector DB, 768 chiều) và Sparse Retrieval (BM25) để tối đa độ bao phủ tài liệu
- Reciprocal Rank Fusion (RRF, k=60): Hợp nhất hai danh sách ranking mà không cần học tham số
- Cross-Encoder Reranking: Mô hình AITeamVN/Vietnamese_Reranker chấm điểm lại từng cặp (query, chunk), kết hợp source diversity tối đa 3 chunk/tài liệu
- Vietnamese-Aware Chunking: Phân đoạn văn bản theo cấu trúc pháp lý (Điều, Chương, Mục) trước khi fallback về sentence-level
- OCR Fallback: Tích hợp Tesseract (vie+eng) để xử lý PDF scan không có embedded text
- LLM-as-Judge Evaluation: GPT-4o tự động đánh giá Faithfulness và Answer Relevance trên 134 câu hỏi test