Bởi Dylan Tong, Ka Ming Leung, Mingshi Liu và Tyler Ohlsen
Dịch bởi La Hoàng Tiến – FCJ Intern
Ngày đăng: 02/05/2025
Giới Thiệu
Amazon OpenSearch Service vừa giới thiệu AI Search Flow Builder, một công cụ trực quan cho phép các nhà phát triển dễ dàng thiết kế và triển khai các luồng tìm kiếm AI mà không cần xây dựng middleware tùy chỉnh phức tạp. Flow Builder hỗ trợ hai loại luồng chính:
- Luồng nhập (Ingest flows): Xử lý và làm phong phú dữ liệu khi lập chỉ mục.
- Luồng tìm kiếm (Search flows): Xử lý yêu cầu tìm kiếm và kết quả trả về một cách động.
Công cụ này tích hợp với các dịch vụ AI hàng đầu như Amazon Bedrock, SageMaker, OpenAI, và Cohere, đồng thời cho phép bạn xuất và triển khai luồng trực tiếp trên bất kỳ cụm OpenSearch phiên bản 2.19 trở lên. Bài viết sẽ trình bày hai kịch bản thực tế giúp bạn tận dụng AI Search Flow Builder: nâng cấp tìm kiếm từ khóa hiện có lên tìm kiếm ngữ nghĩa, và xây dựng hệ thống tìm kiếm hình ảnh đa phương thức sử dụng AI tạo sinh.
Các Khái Niệm Cơ Bản Cần Biết
| Tiếng Anh | Tiếng Việt | Giải thích tóm tắt |
|---|---|---|
| AI Search Flow Builder | Trình xây dựng luồng tìm kiếm AI | Công cụ trực quan để thiết kế và triển khai các luồng tìm kiếm AI |
| Pipeline (Quy trình) | Quy trình | Chuỗi các bước xử lý dữ liệu, từ trích xuất đến huấn luyện và triển khai mô hình AI |
| Ingest Flow (Luồng nhập) | Luồng nhập | Pipeline xử lý dữ liệu lúc thêm vào chỉ mục |
| Search Flow (Luồng tìm kiếm) | Luồng tìm kiếm | Pipeline xử lý truy vấn và kết quả tìm kiếm |
| Semantic Search | Tìm kiếm ngữ nghĩa | Tìm kiếm dựa trên ý nghĩa nội dung thay vì chỉ khớp từ khóa đơn thuần |
| Text Embeddings | Mã hóa văn bản | Biểu diễn vector của văn bản được dùng để tính toán tương đồng |
| RAG (Retrieval Augmented Generation) | Tạo sinh tăng cường bằng truy xuất | Kỹ thuật kết hợp giữa truy xuất dữ liệu và AI tạo sinh cải thiện kết quả trả về |
| Cross-encoder | Bộ mã hóa chéo | Mô hình AI dùng để xếp hạng lại kết quả tìm kiếm giúp nâng cao độ chính xác |
| Multimodal | Đa phương thức | Xử lý cùng lúc nhiều dạng dữ liệu khác nhau (văn bản, hình ảnh, âm thanh) |
| k-NN Query | Truy vấn k láng giềng gần nhất | Thuật toán tìm kiếm vector tương đồng trong không gian embedding |
| ML Inference Processor | Bộ xử lý suy luận ML | Thành phần pipeline thực hiện các tác vụ inference machine learning |
| Vector Database | Cơ sở dữ liệu vector | Cơ sở dữ liệu tối ưu lưu trữ và tìm kiếm dựa trên vector embeddings |
| Middleware | Phần mềm trung gian | Lớp phần mềm kết nối và điều phối các thành phần trong hệ thống |
| Placeholder | Trình giữ chỗ | Yếu tố tạm thời dùng để chèn dữ liệu trong pipeline |
Tình Huống Thực Tế 1: Nâng Cấp Tìm Kiếm Ngữ Nghĩa Trên Ứng Dụng Cũ
Bạn sở hữu một ứng dụng tìm kiếm dựa trên từ khóa truyền thống nhưng mong muốn nâng cấp lên tìm kiếm ngữ nghĩa nhằm cung cấp trải nghiệm thân thiện và chính xác hơn cho người dùng. Với AI Search Flow Builder, bạn không cần thay đổi mã phía client.
Quy trình triển khai:
- Chuẩn bị dữ liệu:
Chọn mẫu dữ liệu tài liệu cần lập chỉ mục và cấu hình sử dụng mô hình mã hóa văn bản (text embedding), ví dụ Amazon Bedrock Titan Text. - Tạo luồng nhập (Ingest flow):
Dữ liệu đầu vào sẽ được mã hóa thành vector embedding, giúp lưu trữ dưới dạng dạng số phục vụ truy vấn ngữ nghĩa. - Tạo luồng tìm kiếm (Search flow):
Truy vấn của người dùng cũng được mã hóa thành embedding và so khớp với dữ liệu trong chỉ mục bằng truy vấn k-NN. - Triển khai trên OpenSearch 2.19+:
Xuất pipeline và triển khai trực tiếp trên cụm OpenSearch mà không cần thay đổi code client.
Nhờ đó, bạn có thể kích hoạt tìm kiếm ngữ nghĩa nhanh chóng, cải thiện chất lượng kết quả, và giữ nguyên giao diện sử dụng cho người dùng cuối.
Tình Huống Thực Tế 2: Xây Dựng Hệ Thống Tìm Kiếm Hình Ảnh Đa Phương Thức
Ngoài tìm kiếm văn bản, AI Search Flow Builder còn hỗ trợ xây dựng các pipeline đa phương thức kết hợp văn bản và hình ảnh, sử dụng kỹ thuật RAG để cung cấp kết quả phong phú và sáng tạo hơn.
Điểm đáng chú ý:
- Sử dụng luồng nhập để mã hóa dữ liệu văn bản và hình ảnh thành embedding riêng biệt.
- Tích hợp mô hình AI tạo sinh từ Amazon Bedrock hoặc SageMaker cho phép tổng hợp thông tin hữu ích từ dữ liệu truy xuất.
- Thiết kế luồng tìm kiếm cho phép truy vấn đa phương thức, hỗ trợ xử lý và lọc kết quả phức tạp.
- Triển khai dễ dàng trên cụm OpenSearch tiêu chuẩn.
Ví dụ: ứng dụng tìm kiếm sản phẩm thời trang dựa trên mô tả và hình ảnh sản phẩm để đề xuất chính xác hơn cho người dùng.
Mẫu Mô Tả Sản Phẩm Dùng Cho Tìm Kiếm Ngữ Nghĩa
Dưới đây là mẫu mô tả sản phẩm thường dùng để huấn luyện embedding, giúp cho hệ thống nắm bắt tốt ý nghĩa và phong cách sản phẩm khi tìm kiếm:
| Mô tả sản phẩm |
|---|
| Chiếc váy xinh đẹp, hoàn hảo thể hiện tinh túy của hoàng hôn với hiệu ứng chuyển màu ombre tuyệt đẹp. Màu chuyển từ hồng đào nhẹ nhàng sang cam rực rỡ rồi vàng tươi ở viền váy, phù hợp nhiều dáng người. Thiết kế tay áo ngắn, form rộng thoải mái cho các chuyến đi mùa hè hoặc sự kiện giản dị. |
| Váy tie-dye rực rỡ với dải màu vàng óng, cam rực lửa, hồng đậm hòa quyện mượt mà, gợi nhớ bầu trời chạng vạng. Thiết kế không dây tôn vai thanh lịch, eo thắt tạo đường cong quyến rũ, chiều dài đến đầu gối, phù hợp cho kỳ nghỉ biển hoặc sự kiện mùa hè. |
Lợi Ích Khi Sử Dụng AI Search Flow Builder
- Tiết kiệm thời gian phát triển nhờ giao diện thiết kế trực quan, không cần viết middleware phức tạp.
- Nâng cao trải nghiệm người dùng với tìm kiếm ngữ nghĩa và đa phương thức, kết quả chính xác và phong phú hơn.
- Kết nối mạnh mẽ với các dịch vụ AI hàng đầu: Bedrock, SageMaker, OpenAI, Cohere…
- Triển khai linh hoạt trên mọi cụm OpenSearch phiên bản 2.19+ với khả năng mở rộng dễ dàng.
Kết Luận
AI Search Flow Builder là bước tiến đột phá giúp các doanh nghiệp và nhà phát triển nhanh chóng xây dựng các giải pháp tìm kiếm AI hiệu quả, hiện đại và dễ dàng bảo trì. Hãy bắt đầu trải nghiệm công cụ này ngay hôm nay để mở rộng khả năng xử lý dữ liệu và nâng cao giá trị sản phẩm của bạn.
Bài viết được tham khảo và dịch từ AWS Big Data Blog