Tác giả Yuxin Yang, Yuxin Yang, Sripriya Kannan, Ryan Thurston, and Inderpreet Singh, ngày 18 tháng 4 năm 2025 | Amazon DocumentDB, AWS Partner Network, Foundational (100), Partner solutions, Thought Leadership


Ngày càng nhiều doanh nghiệp ở mọi quy mô muốn đưa trí tuệ nhân tạo tạo sinh (generative AI) vào hoạt động của mình. Khi người dùng doanh nghiệp có quyền truy cập vào các mô hình ngôn ngữ lớn (LLM), họ sẽ hưởng lợi từ các đề xuất được cá nhân hóa, tóm tắt gần như tức thời, tạo nội dung và khai phá thông tin chuyên sâu cho các vận hành trọng yếu như dự báo bán hàng, xu hướng thị trường hoặc đánh giá rủi ro. Với generative AI, người dùng có thể truy vấn những tập dữ liệu lớn và đa dạng bằng ngôn ngữ tự nhiên dựa trên ngữ cảnh chứ không chỉ là từ khóa.
Ra mắt vào tháng 7/2024, tresle.ai nhận ra rằng ít doanh nghiệp có đủ năng lực kỹ thuật để xây dựng và vận hành các ứng dụng dựa trên generative AI. Sứ mệnh của công ty là cung cấp một nền tảng GenAI trọn vẹn giúp khách hàng tích hợp AI vào ứng dụng gần như “không ma sát”.
“Doanh nghiệp đang có làn sóng nhu cầu bổ sung GenAI vào ứng dụng hiện hữu nhưng thiếu chuyên môn và nhân sự để kết nối vô số công cụ/dịch vụ cần thiết để đưa ứng dụng vào sản xuất,” Patrick Salyer, đối tác tại quỹ Mayfield, chia sẻ. “Cần có một giải pháp đơn giản hóa triển khai ứng dụng GenAI, loại bỏ phức tạp: từ onboarding dữ liệu, chọn cơ sở dữ liệu vector, embeddings và RAG, tinh chỉnh/chọn mô hình, đánh giá, bảo mật cho đến vận hành. tresle.ai cung cấp tích hợp GenAI vào ứng dụng qua API, che giấu toàn bộ độ phức tạp ở lớp bên dưới.”
Sử dụng các Dịch vụ Quản trị của AWS để Xây dựng một Nền tảng GenAI Cắm là Chạy (Plug-and-Play)
Dù khởi đầu trên đám mây với hơn 49 dịch vụ AWS, tresle.ai vẫn đánh giá toàn bộ thị trường để chọn cơ sở dữ liệu vector — thành phần cốt lõi của mọi giải pháp GenAI. Vector search giúp nắm bắt nghĩa của dữ liệu bằng cách dùng biểu diễn số của dữ liệu phi cấu trúc (embeddings) để phát hiện mối quan hệ giữa những dữ liệu rời rạc.
“AWS là nhà cung cấp đám mây tối tân và đội ngũ của chúng tôi đã quen thuộc ngay từ ngày đầu,” Yuxin Yang (tresle.ai) nói. “Nhưng có rất nhiều cơ sở dữ liệu vector mới. Chúng tôi đã đánh giá nghiêm ngặt 10 lựa chọn theo hơn 20 tiêu chí như độ chính xác, hiệu năng và chi phí.”
Sau vài tháng đánh giá và thử nghiệm, tresle.ai đã quyết định xây dựng nền tảng của mình dựa trên Amazon DocumentDB một cơ sở dữ liệu tài liệu JSON gốc được quản lý toàn phần, giúp đơn giản hóa và tối ưu chi phí khi vận hành các khối lượng công việc tài liệu quan trọng ở hầu như bất kỳ quy mô nào mà không cần quản lý hạ tầng. Công ty được hưởng lợi từ cấu trúc lược đồ linh hoạt và khả năng tương thích với MongoDB của Amazon DocumentDB. Tính năng vector search for Amazon DocumentDB cho phép lưu trữ và truy vấn các vector embedding song song với dữ liệu gốc, giúp loại bỏ nhu cầu xây dựng hạ tầng vector riêng biệt và tránh trùng lặp dữ liệu. Khi sử dụng Amazon DocumentDB, tresle.ai được hưởng lợi từ các thực hành bảo mật tích hợp sẵn, độ bền dữ liệu cao, cũng như việc tự động hóa các tác vụ như quản lý phiên bản và bảo trì. “Nhờ sử dụng Amazon DocumentDB, chúng tôi không còn phải lo lắng về các sự cố tiềm ẩn,” Yang chia sẻ. “Vì đây là một dịch vụ được AWS quản lý, nó giúp chúng tôi tiết kiệm rất nhiều công sức kỹ thuật.” Ngoài ra, các lập trình viên tại tresle.ai cũng đánh giá cao sự hoàn thiện và ổn định của bộ công cụ AWS software development kit, vốn cung cấp các công cụ để tresle.ai tích hợp nền tảng của mình một cách liền mạch với ngôn ngữ lập trình Rust.
Vì Amazon DocumentDB tách biệt phần tính toán (compute) và lưu trữ (storage), nền tảng của tresle.ai có thể mở rộng hai thành phần này một cách độc lập, với khả năng nhanh chóng bổ sung tối đa 15 bản sao đọc (read replica) để xử lý lưu lượng truy cập tăng cao. Ngoài ra, tresle.ai không cần phải cấp phát trước dung lượng lưu trữ, vì Amazon DocumentDB tự động mở rộng lưu trữ lên đến 128 TB.
“Chúng tôi có thể mở rộng lên hoặc thu hẹp lại chỉ trong vài phút,” Yang chia sẻ. “Nếu tự mình quản lý kiểu triển khai này, mỗi lần triển khai có thể sẽ mất vài ngày.”
Hơn nữa, tresle.ai còn tối ưu hóa chi phí vận hành khối lượng công việc của mình thông qua Amazon DocumentDB I/O-Optimized một cấu hình lưu trữ dành cho các cụm cơ sở dữ liệu, mang lại tỷ lệ hiệu năng trên giá thành tốt hơn và mức định giá dễ dự đoán cho các ứng dụng có tần suất đọc/ghi (I/O) cao. Nhờ sử dụng Amazon DocumentDB I/O-Optimized, tresle.ai không phải chịu bất kỳ chi phí nào cho các thao tác đọc và ghi I/O, từ đó dễ dàng hơn trong việc dự đoán chi phí vận hành cơ sở dữ liệu.
Mở Rộng Hàng Loạt Trường Hợp Sử Dụng Thông Qua Việc Truy Cập Các LLMs Trong Amazon Bedrock
Nền tảng của tresle.ai tích hợp tính năng vector search cho Amazon DocumentDB với các LLMs được truy cập thông qua Amazon Bedrock — một dịch vụ được quản lý toàn phần, cung cấp một API duy nhất để truy cập và sử dụng nhiều mô hình nền tảng hiệu suất cao đến từ các công ty AI hàng đầu. Nhờ vậy, khách hàng của tresle.ai có thể tìm kiếm trong cơ sở dữ liệu của họ dựa trên ý nghĩa (semantics), từ đó mở ra nhiều trường hợp sử dụng đa dạng như: tìm kiếm ngữ nghĩa (semantic search), gợi ý sản phẩm, cá nhân hóa trải nghiệm, và chatbot.tresle.ai đảm nhiệm toàn bộ phần xử lý phức tạp, bao gồm kết nối với kho dữ liệu, tạo embedding và thực thi chức năng tìm kiếm.
Khách hàng của tresle.ai có sự linh hoạt trong việc nạp vào bất kỳ loại dữ liệu nào — bao gồm cả tệp PDF và các dạng dữ liệu phi cấu trúc khác — và sử dụng các khả năng của GenAI để tìm kiếm và hiểu ngữ cảnh. “Chúng tôi giúp mọi thứ trở nên dễ dàng hơn cho khách hàng,” Puneet Suri, đồng sáng lập tresle.ai, chia sẻ. “Chỉ trong vòng 1 đến 2 ngày, họ đã có một ứng dụng để sử dụng và thử nghiệm. Chúng tôi giúp triển khai các ứng dụng doanh nghiệp nhanh hơn gấp 50 lần với chi phí chỉ bằng một phần nhỏ.” Khách hàng chỉ cần chọn mô hình phù hợp nhất trong Amazon Bedrock cho ứng dụng cụ thể của mình.
Ví dụ, để tạo vector embeddings cho văn bản phi cấu trúc như tài liệu, đoạn văn, và câu, tresle.ai sử dụng Amazon Titan Text Embeddings v2, có khả năng xử lý đầu vào lên đến 8.192 token và tạo ra vector có 1.024 chiều. Các trường hợp sử dụng khác sẽ dựa vào các mô hình khác nhau trong Amazon Bedrock. Với những ứng dụng nhất định — chẳng hạn như các ứng dụng retrieval-augmented generation (tạo sinh có hỗ trợ truy xuất) phụ thuộc vào LLMs nền tảng của tresle.ai truy cập các phiên bản mới nhất của Anthropic’s Claude in Amazon Bedrock. “Vì chúng tôi là một nhóm nhỏ, chúng tôi muốn tập trung vào lợi thế công nghệ của mình — cụ thể là thuật toán. Chúng tôi được hưởng lợi từ độ chính xác trong quá trình truy xuất thông tin và khả năng tích hợp với nhiều LLMs khác nhau,” Yang chia sẻ.
“Khi sử dụng kết hợp Amazon DocumentDB và Amazon Bedrock, chúng tôi có thể mở rộng quy mô mà không làm tăng chi phí vận hành.”
tresle.ai triển khai nền tảng GenAI của mình bên trong Virtual Private Cloud (VPC) hoặc tài khoản AWS của khách hàng. Khách hàng được hưởng lợi từ các biện pháp kiểm soát mặc định (out-of-the-box guardrails) và các cơ chế Amazon Bedrock security and privacy được tích hợp sẵn.Dữ liệu của họ hoàn toàn nằm trong tầm kiểm soát — luôn được bảo mật và giữ riêng tư, được mã hóa cả khi truyền và khi lưu trữ. “Vì đây là một dịch vụ được quản lý, chúng tôi biết rằng các cấu hình bảo mật sẽ không dễ bị thay đổi, điều này giúp ngăn chặn các trường hợp vô tình loại bỏ những yêu cầu bảo mật cần thiết,” Yang chia sẻ. “Hơn nữa, rất nhiều khách hàng hiện tại của chúng tôi có yêu cầu tuân thủ cao, và họ muốn toàn bộ lưu lượng truy cập phải được giữ bên trong tài khoản của chính họ.”
Giúp Nhiều Khách Hàng Tích Hợp GenAI vào Ứng Dụng
tresle.ai phân phối nền tảng của mình trên AWS Marketplace, nơi khách hàng có thể khám phá, triển khai và quản lý các phần mềm chạy trên AWS. Trong khi đó, công ty cũng đang lên kế hoạch tích hợp thêm các công nghệ serverless mới khi chúng khả dụng, nhằm tối ưu hóa hơn nữa quy trình mở rộng cho khách hàng doanh nghiệp.
“Tìm kiếm là một phần cốt lõi trong nền tảng của chúng tôi,” Suri chia sẻ. “Thông qua Amazon DocumentDB, chúng tôi cung cấp một giải pháp toàn diện vượt xa việc tìm kiếm theo từ khóa truyền thống. Nó mang đến cho bạn các công cụ tìm kiếm văn bản và tìm kiếm ngữ nghĩa, giúp tạo ra kết quả phù hợp và sâu sắc hơn.”

Tresle AI – Tiêu điểm Đối tác AWS (AWS Partner Spotlight)
Tresle AI là một AWS ISV Partner, cung cấp AI Logic Server đạt chuẩn doanh nghiệp, sẵn sàng cho môi trường sản xuất, giúp tích hợp Gen AI một cách liền mạch vào cả các ứng dụng hiện có lẫn các ứng dụng nghiệp vụ mới. AI Logic Server của Tresle trao quyền cho các tổ chức trong việc thúc đẩy đổi mới sáng tạo, tự động hóa các quy trình phức tạp và khai phá những thông tin chi tiết có thể hành động được. Dù là nâng cấp hệ thống cũ hay xây dựng các giải pháp thế hệ tiếp theo, Tresle giúp việc áp dụng AI tiên tiến trở nên đơn giản, đáng tin cậy và tối ưu chi phí.
Contact Tresle AI | Partner Overview | AWS Marketplace
Thẻ: Amazon Bedrock, Amazon DocumentDB, Anthropic, AWS Marketplace, Generative AI