ĐA1-2025
Duyệt ĐA1-2025 theo Năm xuất bản
- Ấn phẩmPhân tích cảm xúc theo khía cạnh(Đại học Bách khoa Hà Nội, 2025) Trần Trọng Khang; Nguyễn Thị Kim AnhGiới thiệu tổng quan về xử lý ngôn ngữ tự nhiên. Trình bày cụ thể hơn về ngữ cảnh của bài toán và các nghiên cứu liên quan, các đặc điểm của công cụ phân tích cú pháp phụ thuộc và từ loại spacy, cơ chế chú ý đa đầu và mô hình ngôn ngữ BERT. Đưa ra phương pháp đề xuất. các kịch bản thử nghiệm, cấu hình siêu tham số, kết quả thực nghiệm và sau đó đưa ra đánh giá về hiệu quả của phương pháp đề xuất. đưa ra đánh giá về điểm mạnh, điểm yếu của phương pháp đề xuất, phân tích làm rõ các vấn đề chưa làm được hoặc còn hạn chế và cần cải thiện trong tương lai.
- Ấn phẩmExploring and Building a Data Warehouse system for Reddit social data(Đại học Bách khoa Hà Nội, 2025) Phuc Nguyen Hoang; Phuong Nguyen HongTrình bày thiết kế và triển khai một đường ống dữ liệu phân tán để xử lý và phân tích dữ liệu bài đăng trên Reddit bằng các công cụ kỹ thuật dữ liệu hiện đại. Sử dụng Apache Kafka cho hàng đợi tin nhắn thời gian thực, xử lý các luồng riêng biệt cho bình luận và bài đăng thông qua một cụm môi giới ba nút trong kiến trúc hệ thống. Kiến trúc thể hiện một phương pháp tiếp cận toàn diện để xử lý dữ liệu mạng xã hội khối lượng lớn như Reddit, từ thu thập đến phân tích, đồng thời duy trì khả năng mở rộng, khả năng chịu lỗi và khả năng xử lý thời gian thực.
- Ấn phẩmBuilding a Cash Deposit Machine (CDM) Transaction Processing System(Đại học Bách khoa Hà Nội, 2025) Nguyen Van Tien; Nguyen Dinh ThuanĐề xuất phát triển một hệ thống xử lý giao dịch gửi tiền mặt sử dụng Máy gửi tiền mặt (CDM). Đưa ra giải pháp một phần mềm được tích hợp vào CDM, có tính năng đếm tự động, xác minh tính xác thực của tiền mặt, lưu trữ an toàn và ghi lại giao dịch trong một hệ thống quản lý tập trung. Cung cấp một hệ thống công nghệ hiện đại, khắc phục những hạn chế của các phương pháp truyền thống, nâng cao hiệu quả quản lý tiền mặt, cải thiện tính minh bạch và tốc độ xử lý.
- Ấn phẩmCải thiện truy xuất thông tin cho hỏi đáp văn bản pháp luật(Đại học Bách khoa Hà Nội, 2025) Nguyễn Hà Phú Thịnh; Ngô Văn LinhTập trung vào tinh chỉnh mô hình BGE-M3, một mô hình nhúng đa ngôn ngữ nổi bật với khả năng xử lý các tác vụ truy xuất văn bản. Huấn luyện các mô hình này trên tập dữ liệu văn bản pháp luật tiếng Việt được tùy chỉnh, đồ án kỳ vọng khắc phục các hạn chế của các mô hình tiền huấn luyện phổ biến và nâng cao độ chính xác, mức độ phù hợp trong kết quả truy xuất. Phân tích hiệu quả của các mô hình nhúng đặc thù cho tiếng Việt trong bài toán truy xuất văn bản pháp luật, áp dụng khung Retrieval-Augmented Generation (RAG) vào lĩnh vực pháp luật, và đánh giá toàn diện hiệu suất truy xuất.
- Ấn phẩmThiết kế xây dựng web nghe nhạc trực tuyến(Đại học Bách khoa Hà Nội, 2025) Ngô Huy Thắng; Phạm Thị Phương GiangĐặt vấn đề lý do chọn đề tài, mục tiêu và phạm vi cũng như định hướng giải pháp của đề tài. Khảo sát và phân tích yêu cầu của hệ thống. Giới thiệu về công nghệ đã được sử dụng để xây dựng lên hệ thống từ bản thiết kế đã trình bày. Trình bày phần thiết kế, cài đặt và triển khai hệ thống. Tổng quan kết quả đạt được và hướng phát triển trong tương lai của đồ án.
- Ấn phẩmHệ thống quản lý và cho thuê Homestay(Đại học Bách khoa Hà Nội, 2025) Đỗ Hữu Đức Mạnh; Cao Tuấn DũngKhảo sát và phân tích yêu cầu về dịch vụ lưu trú Homestay hiện nay. Trình bày chi tiết các công nghệ được lựa chọn, đánh giá ưu điểm, hạn chế của từng giải pháp, đồng thời minh họa cách các công nghệ này được áp dụng để phát triển hệ thống. Giới thiệu về kiến trúc phần mềm để sử dụng xây dựng hệ thống, mô tả các thành phần trong hệ thống và mối quan hệ giữa các thành phần đó với nhau, đưa ra kết quả đạt được với một số hình ảnh minh họa và kiểm thử cho một số chức năng quan trọng. Đưa ra một vài hướng phát triển để cải thiện, nâng cao chất lượng của hệ thống.
- Ấn phẩmHệ thống tìm việc kết nối giữa ứng viên và nhà tuyển dụng(Đại học Bách khoa Hà Nội, 2025) Đàm Quân Sơn; Nguyễn Tiến ThànhKhảo sát hiện trạng của các nền tảng tìm việc hiện có, phân tích những ưu và nhược điểm của chúng. Trình bày về các công nghệ và thư viện chính đã sử dụng trong đồ án. Giới thiệu kiến trúc tổng thể, thiết kế chi tiết, quá trình xây dựng và triển khai hệ thống. Đưa ra các đóng góp nổi bật của đồ án, chỉ ra vấn đề mà hệ thống cần giải quyết, hướng giải quyết đã thực hiện và kết quả đạt được.
- Ấn phẩmMulti-Domain Information Fusion for Plasmodium Life Cycle Development Classification(Đại học Bách khoa Hà Nội, 2025) Tran Quoc Khanh; Nguyen Thi OanhGiới thiệu và đặt vấn đề về hiện trạng bệnh sốt rét. Trình bày khái niệm Học đa miền (Multi-Domain Learning) vào phân loại sự phát triển vòng đời của ký sinh trùng sốt rét để giải quyết vấn đề mất cân bằng dữ liệu. Sử dụng một số tập dữ liệu như một phương pháp để làm giàu dữ liệu huấn luyện cho các lớp nhỏ nhằm thu hẹp khoảng cách phân phối miền, hợp nhất thông tin đa miền được đề xuất để hợp nhất thông tin hiệu quả giữa các miền. Đánh giá định lượng và định tính đã được thực hiện để chứng minh tính hiệu quả của mô-đun được đề xuất.
- Ấn phẩmTìm hiểu các công nghệ xây dựng kiến trúc hồ - kho dữ liệu và ứng dụng xây dựng hệ thống thu thập, lưu trữ và xử lí dữ liệu hành vi người dùng(Đại học Bách khoa Hà Nội, 2025) Phạm Hồng Thắm; Trần Việt TrungĐặt vấn đề lý do chọn đề tài, mục tiêu và phạm vi cũng như định hướng giải pháp của đề tài. Giới thiệu các khái niệm và nền tảng lý thuyết làm cơ sở cho việc xây dựng và vận hành hệ thống dữ liệu. Mô tả quy trình thiết kế chi tiết và triển khai hệ thống thực tế. Trình bày các kết quả đạt được, phân tích hiệu suất, độ tin cậy, khả năng mở rộng và chất lượng dữ liệu lưu trữ cũng như truy vấn. Tóm lược những đóng góp của đồ án, đồng thời đề xuất các hướng phát triển tương lai.
- Ấn phẩmEvent Extraction for Biomedical Texts(Đại học Bách khoa Hà Nội, 2025) Phan Thái Việt; Nguyen Kiem HieuSử dụng mô hình BioBERT-mô hình ngôn ngữ được đào tạo và tinh chỉnh chuyên biệt trên các tập dữ liệu y sinh để cải thiện khả năng phát hiện và phân loại sự kiện. Ứng dụng phương pháp nhúng các câu đầu vào với BioBERT, xác định các yếu tố kích hoạt sự kiện và phân loại các sự kiện thành các danh mục quan tâm. Đề xuất giải pháp tích hợp nhúng BioBERT với một mô hình phân loại để xác định và phân loại các tác nhân kích hoạt sự kiện trong văn bản y sinh. Sử dụng bộ dữ liệu GENIA, một kho dữ liệu chuẩn để trích xuất sự kiện y sinh. Đóng góp một phương pháp cải tiến để phát hiện và phân loại đa sự kiện, cũng như chứng minh hiệu quả của phương pháp này thông qua các kết quả thực nghiệm toàn diện.
- Ấn phẩmHỏi đáp tự động sử dụng kỹ thuật sinh câu trả lời dựa trên tìm kiếm(Đại học Bách khoa Hà Nội, 2025) Nguyễn Đăng Huy; Nguyễn Thị Kim AnhĐề cập đến các nội dung lý thuyết về mô hình ngôn ngữ lớn nhằm phục vụ việc nghiên cứu, xây dựng thử nghiệm và đánh giá giải pháp đề xuất. Trình bày chi tiết về giải pháp đề xuất, các kịch bản thử nghiệm, thông số cấu hình thử nghiệm, kết quả thực nghiệm và các đánh giá, nhận xét về các phương pháp thử nghiệm. Đưa ra kết luận về phương pháp đề xuất, những ưu điểm cũng như những hạn chế còn tồn tại cũng như đề ra các hướng phát triển trong tương lai.
- Ấn phẩmỨng dụng quản lý biển số xe(Đại học Bách khoa Hà Nội, 2025) Nguyễn Trọng nghĩa; Đặng Tuấn LinhĐặt vấn đề lý do chọn đề tài, giải pháp hiện tại và hạn chế cũng như mục tiêu và định hướng giải pháp của đề tài. Khảo sát về tình hình thực trạng của các giải pháp cho bài toán nhận dạng biển số xe. Đề cập tới các giai đoạn nghiên cứu bài toán và triển khai nó lên một web server. Trình bày về việc tiến hành huấn luyện, kiểm thử các mô hình nhận diện biển số xe và tính chính xác của mô hình. Nhận định tổng quan về kết quả sẽ được trinh bày, rút ra các khuyết điểm, dẫn đến những định hướng xây dựng và phát triển bài toán trong tương lai.
- Ấn phẩmNhận diện khuôn mặt 3D bằng dữ liệu khôi phục từ phương pháp Photometric stereo(Đại học Bách khoa Hà Nội, 2025) Võ Nguyễn Hoàng; Ngô Thành Trunggiới thiệu tổng quan về ngữ cảnh bài toán FR, kiến trúc của một hệ Ghống FR tiêu chuẩn, các các công nghệ được sử dụng trong mỗi thành phần. Đề xuất xây dựng mô hình FR dựa trên dataset. Trình bày kết quả thực nghiệm thu được dựa trên metric AUC - area under curve được tính bởi 2 công thức đo khoảng cách là cosine similarity và euclidean. Đưa ra kết luận cũng như những vấn đề còn tồn đọng và hướng phát triển tương lai của đồ án.
- Ấn phẩmGiải pháp tự động hóa luồng công việc phi lập trình(Đại học Bách khoa Hà Nội, 2025) Nguyễn Vũ Long; Vũ Thị Hương Giang; Nguyễn Mạnh TuấnTập trung thiết kế và triển khai giải pháp tự động hóa dựa trên mô hình BPMN (Business Process Model and Notation), cho phép thiết kế và điều chỉnh các quy trình công việc một cách trực quan và linh hoạt thông qua giao diện kéo thả . Tích hợp cơ chế xác thực OAuth2 để thu thập và quản lý thông tin xác thực đảm bảo mã hóa và bảo mật những thông tin nhạy cảm mà người dùng cung cấp Đưa ra kết quả là một hệ thống tự động hóa luồng công việc được triển khai tại https://tetask.id.vn/, bao gồm các tính năng chính như: Quản lý các tích hợp; Quản lý luồng công việc; Quản lý thông báo thực hiện với các nghiệp vụ tương ứng trong từng module của ứng dụng. Công cụ này với kiến trúc microservice được xây dựng mới với các service đảm nhận từng nghiệp vụ riêng biệt, cho phép tính linh hoạt, khả năng mở rộng và bảo trì dễ dàng trong tương lai.
- Ấn phẩmỨng dụng học liên kết trong hỗ trợ chẩn đoán bệnh viêm phổi thông qua ảnh chụp X-Quang(Đại học Bách khoa Hà Nội, 2025) Vũ Quang Nam; Đỗ Tiến DũngĐặt vấn đề lý do chọn đề tài, mục tiêu và phạm vi cũng như định hướng giải pháp của đề tài. Giới thiệu cơ sở lý thuyết về ảnh X-Quang của bệnh viêm phổi, các thuật toán học sâu được sử dụng trong nhận diện viêm phổi trên ảnh X-Quang và học liên kết với dữ liệu Non-IID, sau đó là hiện trạng của ứng dụng học liên kết trong lĩnh vực y tế. Trình bày thực nghiệm trên các trường hợp dữ liệu Non-IID khác nhau cùng 4 phương pháp học liên kết, 2 thuật toán học sâu. Mô tả các giải pháp lựa chọn cho phần thực nghiệm. Đưa ra kết quả, các vấn đề còn tồn đọng và hướng phát triển của đề tài.
- Ấn phẩmBuilding an E-Commerce website(Đại học Bách khoa Hà Nội, 2025) Phan văn Đông; Bành Thị Quỳnh MaiGiới thiệu, khảo sát và phân tích yêu cầu hiện nay về thương mại điện tử. Trình bày công nghệ, bản thiết kế cũng như vẫn đề triển khai và đánh giá hiệu quả khi đã thực hiện. Đưea ra các giải pháp và đóng góp cùng các kết luận và kế hoạch hướng tới trong tương lai.
- Ấn phẩmBuilding dynamic booking website for businesses(Đại học Bách khoa Hà Nội, 2025) Lê Minh Tiến; Lê Xuân ThànhGiới thiệu, khảo sát và phân tích vấn đề công cụ lập lịch trình cho các doanh nghiệp hiên nay. Trình bày phương pháp, mô hình thiết kế cũng như việc đánh giá hiểu quả khi đã triển khai thực hiện. Đưa ra giải pháp và các đóng góp cùng kết luận và các công việc sẽ thực hiện trong tương lai.
- Ấn phẩmA Comprehensive ETL Pipeline for Cryptocurrency Data: Batch Processing, Analytical Dashboard and Machine Learning Models(Đại học Bách khoa Hà Nội, 2025) Trương Quang Binh; Tran Viet TrungGiới thiệu tổng quan, khảo sát và phân tích yêu cầu về sữ liệu tiền điện tử. Trình công nghệ sử dụng cũng như phương pháp, thiết kế, triển khai và đánh giá kết quả đạt được. Đưa ra kết luận và công việc hướng tới trong tương lai.
- Ấn phẩmResearch on applying knowledge distillation techniques to improve the quality of low-resource machine translation(Đại học Bách khoa Hà Nội, 2025) Nguyen Trong Huy; Le Thanh HuongGiới thiệu vấn đề nghiên cứu, mục tiêu và ý nghĩa của nghiên cứu, đặc biệt trong bối cảnh dịch máy có ít tài nguyên. Thảo luận về các phương pháp và thách thức hiện có trong dịch máy. Trình bày chi tiết lộ trình đào tạo được đề xuất, bao gồm sự kết hợp giữa đào tạo trước liên tục, điều chỉnh tự giám sát, đào tạo DPO và tích hợp các kỹ thuật chắt lọc kiến thức. Mô tả thiết lập thử nghiệm, số liệu và kết quả, tập trung vào những cải tiến về hiệu suất đạt được khi sử dụng các phương pháp đề xuất. Tổng hợp những đóng góp nghiên cứu và phác thảo hướng nghiên cứu trong tương lai.
- Ấn phẩmThiết kế và xây dựng website chia sẻ công thức nấu ăn(Đại học Bách khoa Hà Nội, 2025) Lê Quốc Mạnh; Đỗ Tuấn Anh"Đặt vấn đề lý do chọn đề tài, mục tiêu và phạm vi cũng như định hướng giải pháp của đề tài. Trình bày quá trình khảo sát và phân tích yêu cầu của hệ thống. Giới thiệu về các công nghệ sử dụng trong quá trình phát triển hệ thống. Mô tả chi tiết về quá trình thiết kế, triển khai và đánh giá hệ thống. Đưa ra thành quả đạt được sau khi thực hiện cũng như các hướng phát triển và cải thiện trong tương lai cho hệ thống."
- Ấn phẩmMultilingual International Certification Preparation Platform (French, German, English) with Personalized Learning Path(Đại học Bách khoa Hà Nội, 2025) Nguyễn Minh Ngọc; Lễ Xuân ThànhCung cấp cái nhìn tổng quan toàn diện về sự phát triển và tác động của Goosingo. Phân tích và đi sâu vào các yêu cầu của vấn đề. Thảo luận về phương pháp luận được áp dụng để phát triển Goosingo. Trình bày các phương pháp nghiên cứu, chiến lược thu thập dữ liệu và phương pháp phân tích. Tập trung vào việc thiết kế và triển khai nền tảng. Trình bày phương pháp tiếp cận có cấu trúc đảm bảo sự hiểu biết sâu sắc về vấn đề, giải pháp và những đóng góp sáng tạo của Goosingo trong lĩnh vực giáo dục ngôn ngữ và chuẩn bị chứng chỉ.
- Ấn phẩmDeveloping an online clothing store website(Đại học Bách khoa Hà Nội, 2025) Lương Việt Anh; Bành Thị Quỳnh MaiGiới thiệu về hiện trạng kinh doanh trực tuyến cũng như khảo sát, phân tích nhu cầu hiện nay. Trình bày công nghệ, thiết kế ứng dụng và đánh giá hiểu quả khi đã được triển khai. Đưa ra giải pháp và các đóng góp và kết luận hướng tới trong thời gian tới.
- Ấn phẩmHệ thống hỏi đáp trong lĩnh vực y tế(Đại học Bách khoa Hà Nội, 2025) Nguyễn Quốc Khánh; Ngô Văn LinhNghiên cứu và phát triển một hệ thống hỗ trợ tìm kiếm và trả lời câu hỏi trong lĩnh vực y tế - sức khỏe bằng cách kết hợp các mô hình truy xuất thông tin tiên tiến và mô hình ngôn ngữ lớn (LLM). Tiếp cận sâu vào các mô hình và thuật toán như học biểu diễn tương phản, các kiến trúc Bi-encoder và Cross-encoder dưới các phân tích về cấu trúc, ưu điểm và hạn chế, từ đó xác định phương pháp tối ưu để áp dụng vào hệ thống truy xuất thông tin y tế. Đề xuất giải pháp sử dụng các mô hình LLMs làm nền tảng để trả lời câu hỏi của người dùng, kết hợp với phương pháp truy xuất thông tin bằng các mô hình Bi-encoder và Cross-encoder để cải thiện quá trình tìm kiếm cơ bản, phương pháp kết hợp nhiều mô hình, tận dụng điểm mạnh của mỗi mô hình từ đó cải thiện đáng kể hiệu suất truy xuất thông tin.
- Ấn phẩmAgainst Cthulhu: Facing the Darkness - Trò chơi hành động nhập vai 2D(Đại học Bách khoa Hà Nội, 2025) Mai Nguyễn Ngọc Huy; Trịnh Thành TrungGiới thiệu thổng quan cũng như khảo sát và phân tích yêu cầu về trò chơi máy tính. Trình bày khảo sát và phân tích yêu cầu cũng như thiết kế trò chơi cùng thực nghiệm và đánh giá. Đưa ra các giải pháp và đóng góp nổi bật cùng kết luận và hướng phát triển trong thời gian tới.