Dự án của tôi

Khám phá các dự án và sản phẩm mà tôi đã phát triển

Speech Emotion Recognition — Multi-Pipeline ML Framework

Tổng quan Hệ thống nhận diện cảm xúc giọng nói (Speech Emotion Recognition) toàn diện — một framework thực nghiệm ML đa pipeline cho phép so sánh có hệ thống từ phương pháp học máy cổ điển đến deep learning hiện đại. Dự án được xây dựng với kiến trúc module hóa cao, hỗ trợ 8 mô hình phân loại, 7 phương pháp trích xuất đặc trưng, và pipeline tự động hóa hoàn chỉnh từ dữ liệu thô đến kết quả đánh giá. Tính năng nổi bật 12+ pipeline cấu hình sẵn (classical ML + deep learning) với alias ngắn gọn 7 phương pháp trích xuất đặc trưng: MFCC, Log-Mel, Mel-Spectrogram, HuBERT, WavLM, Chroma, Spectral Contrast 8 mô hình phân loại: Random Forest, SVM, Logistic Regression, MLP, CNN (ResNet18), LSTM, BiLSTM Data Augmentation đa tầng: SpecAugment (freq/time masking), Gaussian Noise, Time Shift, Speed Perturbation, Pitch Shift Feature Caching thông minh: disk cache (.npy) cho spectral features, in-memory cache (float16) cho SSL models Hydra config system: cấu hình phân cấp, dễ override, reproducible experiments Hyperparameter tuning tích hợp qua Optuna Experiment tracking: Weights & Biases, CSV logging, automatic comparison & ranking Kiến trúc hệ thống Pipeline xử lý theo 5 giai đoạn: Data Loading — Auto-download dataset, AudioPreprocessor (resample, padding/truncation, RMS normalization) Feature Extraction — torchaudio-based (GPU-accelerated) hoặc HuggingFace transformers (HuBERT/WavLM) Augmentation — Spectrogram-level (fast) hoặc Waveform-level (richer diversity) Model Training — PyTorch Lightning (DL) hoặc scikit-learn Pipeline (classical) Evaluation & Logging — Accuracy, F1-macro, confusion matrix, CSV aggregation Kết quả thực nghiệm Thực nghiệm trên tập dữ liệu tiếng Việt (7 nhãn cảm xúc): Random Forest + MFCC: 63.6% accuracy, F1 = 0.621 SVM + MFCC: 63.3% accuracy, F1 = 0.622 BiLSTM + Log-Mel (ước tính): ~75.8% (best performing) Data augmentation cải thiện ~2–5% F1 trên hầu hết pipeline Tech stack chi tiết Deep Learning: PyTorch 2.6+, PyTorch Lightning, torchaudio, timm (ResNet18, EfficientNet) Classical ML: scikit-learn (RF, SVM, LR, StandardScaler) Audio Processing: librosa, soundfile, torchaudio.transforms Config Management: Hydra 1.3+, OmegaConf Experiment Tracking: Weights & Biases, Optuna Platform: Windows/Linux/macOS compatible, CUDA + CPU

Python PyTorch PyTorch Lightning torchaudio +15
Hoàn thành
2026-04-14

Chatbot RAG – Tư vấn Quy chế Sinh viên ĐHQT

Hệ thống chatbot hỏi đáp thông minh chuyên biệt cho Trường Đại học Quốc tế – ĐHQG-HCM, giúp sinh viên tra cứu quy chế học vụ, kỷ luật, học bổng và các chính sách của nhà trường một cách chính xác và nhanh chóng. Kiến trúc nổi bật: - Hybrid Search: Kết hợp Dense Retrieval (Qdrant vector DB, 768 chiều) và Sparse Retrieval (BM25) để tối đa độ bao phủ tài liệu - Reciprocal Rank Fusion (RRF, k=60): Hợp nhất hai danh sách ranking mà không cần học tham số - Cross-Encoder Reranking: Mô hình AITeamVN/Vietnamese_Reranker chấm điểm lại từng cặp (query, chunk), kết hợp source diversity tối đa 3 chunk/tài liệu - Vietnamese-Aware Chunking: Phân đoạn văn bản theo cấu trúc pháp lý (Điều, Chương, Mục) trước khi fallback về sentence-level - OCR Fallback: Tích hợp Tesseract (vie+eng) để xử lý PDF scan không có embedded text - LLM-as-Judge Evaluation: GPT-4o tự động đánh giá Faithfulness và Answer Relevance trên 134 câu hỏi test Kết quả đánh giá thực tế (134 queries, 13/04/2026): - Hit Rate@5: 51.5% | Hit Rate@3: 48.5% - MRR@5: 0.390 | NDCG@5: 0.411 | MAP@5: 0.376 - Recall@5: 50.0% | Precision@1: 29.1% - Faithfulness: 80.1% | Answer Relevance: 80.7% | Context Precision: 49.6%

Python FastAPI Streamlit OpenAI GPT-4o +8
Hoàn thành
2026-04-13

CryptoDoc – Hệ thống Quản lý Tài liệu Ký số

Giới thiệu CryptoDoc là ứng dụng web quản lý tài liệu bảo mật, cho phép người dùng tải lên, ký số và xác minh tài liệu bằng thuật toán RSA. Xây dựng theo quy trình Agile với đầy đủ tài liệu SRS, SDD, SAD. Tính năng chính Đăng ký / đăng nhập với JWT (TTL 24h) Upload tài liệu lưu trên MinIO (S3-compatible) Sinh cặp khóa RSA, ký số tài liệu Xác minh chữ ký & toàn vẹn file (SHA hash) Luồng trạng thái tài liệu: UNSIGNED → SIGNED → VERIFIED Bảng quản trị: quản lý người dùng, audit log Kiến trúc Triển khai hoàn toàn bằng Docker Compose gồm 4 service: Nginx (reverse proxy) · Spring Boot (API) · PostgreSQL (DB) · MinIO (lưu trữ file). Tài liệu dự án Bộ tài liệu đầy đủ: SRS · SDD · SAD · IDD · STP · DPR

Java 17 Spring Boot 3.2 Spring Security JWT +8
Hoàn thành
2026-04-11

Hệ Thống Phát Hiện Ngã Thời Gian Thực

Hệ thống phát hiện ngã thời gian thực được xây dựng nhằm giám sát an toàn cho người cao tuổi và bệnh nhân trong môi trường gia đình hoặc cơ sở y tế. Hệ thống sử dụng camera kết hợp AI để theo dõi liên tục, tự động phát hiện ngã và gửi cảnh báo ngay khi xảy ra sự cố. Té ngã là nguyên nhân phổ biến gây chấn thương nghiêm trọng, đặc biệt khi không được phát hiện kịp thời. Giám sát thủ công thường không liên tục và phụ thuộc vào người chăm sóc. Nguy cơ chấn thương cao Phát hiện chậm → tăng rủi ro Thiếu giám sát liên tục Hệ thống được thiết kế theo pipeline 3 bước: Thu nhận dữ liệu Trích xuất đặc trưng Phân loại và phát hiện ngã Mỗi cửa sổ thời gian được biểu diễn bằng 32 đặc trưng, tổng hợp từ các thống kê cơ bản và đặc trưng đỉnh. Để giảm cảnh báo nhầm, hệ thống áp dụng xác nhận kép: Kiểm tra qua nhiều bước liên tiếp Chỉ cảnh báo khi điều kiện ổn định Hệ thống được đánh giá bằng LOSO-CV nhằm đảm bảo khả năng tổng quát hóa trên nhiều đối tượng. Dữ liệu sử dụng là GMDCSA-24 v2.1, bao gồm các hoạt động thường ngày và tình huống ngã có gắn nhãn thời gian. Tổng thể, hệ thống hướng tới phát hiện thời gian thực, giảm cảnh báo sai và dễ triển khai trong thực tế.

Python MediaPipe OpenCV scikit-learn +6
Hoàn thành
2026-04-11

Phát Triển Hệ Thống Tuyển Dụng Thông Minh Tích Hợp AI Agent cho Phân Tích Hồ Sơ, Sinh Bài Kiểm Tra và Sàng Lọc Ứng Viên

TalentOS là dự án tự động đánh giá mức độ phù hợp giữa hồ sơ ứng viên (CV) và mô tả công việc (JD). Version 1 (v1): Hệ thống dựa trên multi-agent LangGraph với trọng số cứng (Hard Skills 40%, Experience 25%, Soft Skills 15%, Education 12%, Language 8%), không có ground truth, kết quả không reproducible, không kiểm soát hallucination và thiếu metrics chuẩn để so sánh. Version 2 (v2): Chuyển sang pipeline chuẩn Information Retrieval + Learning-to-Rank: Retrieval: BM25 + Dense Embeddings + Hybrid-RRF Re-ranking: LambdaMART (LightGBM) + CrossEncoder Generation: GPT-4o-mini với faithfulness constraint Evaluation: IR metrics (NDCG, MAP, MRR) và RAGAS (faithfulness, context quality) Kết quả reproducible, measurable, kiểm soát hallucination tốt (faithfulness 0.977), BM25 vượt Dense-BGE trên CV corpus, Hybrid-RRF tối ưu cho production. TalentOS v2 biến bài toán CV/JD từ hệ thống heuristic thành pipeline học thuật chuẩn, deploy-ready, có thể đo lường, tái lập được. Version 3 (v3): Tích hợp toàn bộ thuật toán v2 vào sản phẩm hiện tại (v1) với nhiều nâng cấp trọng yếu: Giao diện: Thiết kế lại 2 pha + 3 cột dashboard, hiển thị trực quan hero bar, phân tích tín hiệu thuật toán, kỹ năng, category scores, verdict AI, điểm mạnh, câu hỏi phỏng vấn gợi ý, và các nút quyết định tuyển dụng. Ưu điểm: Kết hợp học thuật v2

Python Langchain flask ...
Đang thực hiện
2026-03-09

Hệ thống trợ lý ảo AI đa tác tử hỗ trợ học tập và quản lý trong trường đại học

Đề tài này tập trung giải quyết bài toán cân bằng giữa độ chính xác và hiệu năng trong hệ chatbot. Vấn đề xuất phát từ việc RAG tuy nhanh nhưng kém hiệu quả với truy vấn phức tạp, trong khi Agentic-RAG lại chính xác nhưng chậm và tốn chi phí. Để khắc phục, nghiên cứu đề xuất một kiến trúc chatbot đa tác tử có khả năng phân tích truy vấn và tự động chọn cách xử lý phù hợp. Cụ thể, hệ thống sẽ đánh giá độ phức tạp của câu hỏi, sau đó định tuyến: truy vấn đơn giản dùng RAG để tối ưu tốc độ, truy vấn phức tạp dùng Agentic-RAG để đảm bảo độ chính xác. Nhờ cơ chế này, hệ thống vừa giảm sai lệch thông tin, vừa tối ưu thời gian và chi phí xử lý, đạt được hiệu quả tổng thể tốt hơn so với các phương pháp đơn lẻ.

Python langchain langgraph ...
Đang thực hiện
2026-03-08

Hệ thống theo dõi và phân tích bóng đá thời gian thực

Hệ thống bao gồm phân tích phát hiện theo dõi cầu thủ, phân đội màu áo kèm xây dựng bản đồ ánh xạ minimap 2d

Python Yolo opencv kmeans
Hoàn thành
2026-03-07

Phân tích cảm xúc văn bản sử dụng các thuật toán học máy trên Hadoop và Spark

Phân tích cảm xúc văn bản sử dụng các thuật toán học máy trên Apache Hadoop và Apache Spark.Một phương pháp tiến hành thực nghiệm dữ liệu lớn big data

Apache Hadoop Apache Spark Jupyter notebook
Hoàn thành
2026-01-09

Phát hiện bất thường turbine gió cho tập dữ liệu Aventa AV-7 ETH Zurich Research Wind Turbine SCADA and SHM sử dụng VAE,LSTM,AE, Isolate Forest

Bài toán phát hiện bất thường trong dữ liệu cảm biến từ turbine bao gồm dữ liệu SCADA và SHM vs dải tần số cao.Cách giải quyết sử dụng các cách tiền xử lý khác nhau và áp dụng những thuật toán khác nhau để giải quyết bài toán này. Từ đó đưa ra mức dự đoán khả năng thời điểm fault của turbine base data Dữ liệu: https://zenodo.org/records/8223010. Có 3 loại lỗi bất thường được sử dụng trong bài toán này

Python Colab VastAI (Training mô hình)
Hoàn thành
2026-01-09

Hệ thống phát hiện biển báo giao thông sử dụng yolo

Mô hình phát hiện biển báo giao thông sử dụng YOLOv8 và YOLOv11

Python Tkinter
Hoàn thành
2026-01-09

Website quản lý và thuê phòng khách sạn với chức năng cơ bản quản lý và chatbot, thanh toán paypal

Website quản lý và thuê phòng khách sạn với chức năng thuê phòng và quản lý của chủ khách sạn và admin

Python Flask Html Js
Hoàn thành
2026-01-09

Hệ thống xử lý vi phạm giao thông đa mục tiêu thời gian thực

Hệ thống xử lý vi phạm thời gian thực gồm các lỗi 1.Vượt đèn đỏ 2.Sai làn giao thông 3. Không đội mũ bảo hiểm Hệ thống xử phat và lưu trữ hình ảnh vi phạm

Python YOLO OpenCV Websockets
Hoàn thành
2026-01-09