Những góc nhìn khi triển khai giải pháp sẵn sàng cho môi trường sản xuất với Generative AI

Đăng ngày  30/4/2025

Được viết bởi Giorgio Pessot, Amer Elhabbash, Aamna Najmi, Anwar Rizal, Dragica Boca, Subhro Bose, Sri Elaprolu, Hassen Riahi, Marco Guerriero, Nicolo Cosimo Albanese, Diar Sabri, and Daniel Zagyva 

Danh mục Artificial Intelligence, AWS Well-Architected Framework, Best Practices, Customer Solutions, Experience-Based Acceleration, Generative AI, Thought Leadership

Khi Generative AI đang cách mạng hóa các ngành công nghiệp, các tổ chức muốn khai thác tiềm năng to lớn của công nghệ này. Tuy nhiên, hành trình từ giải pháp thử nghiệm đến ứng dụng ở quy mô sản xuất đòi hỏi phải cân nhắc kỹ lưỡng cả về kỹ thuật lẫn vận hành. Bài viết này khám phá những bài học và kinh nghiệm từ các khách hàng của AWS tại EMEA (châu Âu, Trung Đông, Châu Phi) đã vượt qua giai đoạn này, cung cấp lộ trình rõ ràng cho các doanh nghiệp khác

Xây dựng một business case vững chắc: Sự xuất sắc vận hành thúc đẩy  trải nghiệm khách hàng

Nền tảng của việc triển khai AI tạo sinh thành công là các business case với đề xuất có giá trị rõ ràng và phù hợp với mục tiêu tổ chức, ví dụ như cải thiện hiệu suất, tiết kiệm chi phí hoặc tăng trưởng doanh thu. Các ví dụ điển hình bao gồm nâng cao trải nghiệm khách hàng, tối ưu hóa hoạt động, duy trì tuân thủ các tiêu chuẩn pháp lý, cải thiện mức độ dịch vụ hoặc tăng năng suất nhân viên.

Các công ty ở EMEA đã sử dụng các dịch vụ AWS để chuyển đổi hoạt động và cải thiện trải nghiệm khách hàng bằng AI tạo sinh, với những câu chuyện của họ cho thấy cách một business case mạnh mẽ có thể dẫn đến kết quả thực tế trên các ngành công nghiệp khác nhau.

Il Sole 24 Ore, tập đoàn xuất bản đa phương tiện hàng đầu của Italy, đã hợp tác với AWS Professional Services để tăng hiệu quả của một dịch vụ lịch sử, L’Esperto Risponde, nơi người dùng có thể đặt câu hỏi về thuế và nhận phản hồi từ một nhóm chuyên gia. Il Sole 24 Ore đã tận dụng kiến thức nội bộ rộng lớn của mình với giải pháp Retrieval Augmented Generation (RAG) được hỗ trợ bởi AWS. Giải pháp này duy trì độ chính xác trên 90% trong các phản hồi và giảm thời gian các chuyên gia dành cho việc tìm kiếm và xử lý thông tin, trao quyền cho họ tập trung vào các nhiệm vụ chiến lược hơn. Ngoài ra, công ty thường xuyên phản hồi của người dùng để giữ cho dịch vụ phù hợp với nhu cầu khách hàng.

Booking.com, một trong những dịch vụ du lịch kỹ thuật số hàng đầu thế giới, đang sử dụng AWS để cung cấp công nghệ AI tạo sinh mới nổi ở quy mô lớn, tạo ra trải nghiệm khách hàng được cá nhân hóa trong khi đạt được khả năng mở rộng và hiệu quả cao hơn trong hoạt động. Booking.com sử dụng Amazon SageMaker AI để cung cấp các đề xuất chỗ ở được cá nhân hóa cao cho khách hàng.

“Một trong những điều chúng tôi thực sự thích về cách tiếp cận AI tạo sinh của AWS là việc họ mang đến sự lựa chọn. Chúng tôi yêu thích mã nguồn mở và cảm thấy nó sẽ đóng vai trò quan trọng trong sự phát triển của AI tạo sinh.”

– Rob Francis, Giám đốc Công nghệ của Booking.com

Với sự hỗ trợ của AWS, Booking.com đang nâng cao khả năng generative AI và củng cố vị thế để tạo đà cho sự phát triển trong tương lai trong ngành du lịch và khách sạn. Để biết thêm chi tiết, bạn có thể xem bài phát biểu chính của Booking.com tại AWS re:Invent 2023, bài thuyết trình về generative AI từ ý tưởng đến sản xuất trên AWS tại AWS London Summit 2024, và đọc nghiên cứu tình huống về cách Booking.com giúp khách hàng trải nghiệm thế giới du lịch mới bằng cách sử dụng AWS và generative AI.

ENGIE là một công ty điện lực và tiện ích toàn cầu, với 25 đơn vị kinh doanh hoạt động trên toàn thế giới. Nhóm One Data của ENGIE đã hợp tác với AWS Professional Services để phát triển một chatbot được hỗ trợ bởi AI cho phép tìm kiếm cuộc trò chuyện bằng ngôn ngữ tự nhiên trong data lake Common Data Hub của ENGIE, hơn 3 petabyte dữ liệu. Giải pháp này bổ sung cho tìm kiếm dựa trên từ khóa truyền thống bằng cách cho phép người dùng khám phá các tập dữ liệu thông qua các truy vấn đối thoại đơn giản, giúp dễ dàng tìm thấy dữ liệu có liên quan trong hàng chục nghìn tập dữ liệu.

Những ví dụ này chứng minh cách các công ty trong nhiều lĩnh vực khác nhau đã thành công sử dụng khả năng AI tạo sinh của AWS để giải quyết các thách thức kinh doanh cụ thể.

Vượt qua các thách thức triển khai

Mặc dù thiết yếu, một business case vững chắc chỉ là bước đầu tiên. Khi các tổ chức đẩy mạnh các sáng kiến generative AI của họ, họ thường gặp phải những thách thức mới liên quan đến việc làm cho giải pháp có thể mở rộng, đáng tin cậy và tuân thủ quy định. Hãy cùng khám phá những gì cần thiết để thành công trong việc thúc đẩy các dự án generative AI từ giai đoạn tiền sản xuất, đảm bảo rằng giá trị ban đầu của business case sau đó được thực hiện đầy đủ trong ứng dụng thực tế.

Đạt được quy mô, độ tin cậy và tuân thủ

Các yếu tố cần xem xét trong việc chuyển đổi sang sản xuất quy mô đầy đủ bao gồm khả năng mở rộng, quản trị dữ liệu, quyền riêng tư, hành vi AI nhất quán và có trách nhiệm, bảo mật, tích hợp với các hệ thống hiện có, giám sát, thu thập phản hồi từ người dùng cuối và đo lường tác động kinh doanh. Như các tổ chức ở EMEA đã khám phá, thành công trong quá trình chuyển đổi này đòi hỏi một cách tiếp cận toàn diện vượt ra ngoài những cân nhắc công nghệ đơn thuần. Với vô số kinh nghiệm học hỏi từ khách hàng, kết hợp với chuyên môn của AWS, chúng ta có thể xác định các chiến lược chính cho việc triển khai.

Infrastructure, ứng dụng và quy trình sẵn sàng sản xuất trong cloud

Với sự gia tăng về phạm vi, số lượng và độ phức tạp của các ứng dụng generative AI, các tổ chức có nhu cầu tăng cao về việc giảm thiểu nỗ lực không tạo ra sự khác biệt và thiết lập tiêu chuẩn chất lượng cao cho các ứng dụng sẵn sàng sản xuất. Các best practice phát triển tiêu chuẩn và các mô hình vận hành cloud hiệu quả, như AWS Well-Architected và AWS Cloud Adoption Framework for Artificial Intelligence, Machine Learning, and Generative AI, là chìa khóa để cho phép các nhóm dành phần lớn thời gian cho các nhiệm vụ có giá trị kinh doanh cao, thay vì các hoạt động thủ công lặp đi lặp lại. Cách tiếp cận như vậy nên bao gồm các tiêu chuẩn ngành đã được thiết lập như infrastructure as code (IaC), continuous integration và continuous delivery (CI/CD), monitoring và observability, logging và auditing, cũng như các giải pháp cho khả năng mở rộng và high availability.

Ví dụ, Iveco Group, một nhà lãnh đạo ô tô toàn cầu hoạt động trong lĩnh vực Commercial và Specialty Vehicles, Powertrain, đã áp dụng một mô hình vận hành cloud có cấu trúc, tận dụng IaC thông qua Terraform để triển khai nhất quán và có thể lặp lại trên các môi trường. Một môi trường DevOps, thông qua các CI/CD pipeline, cho phép cập nhật và kiểm tra thường xuyên các mô hình và ứng dụng generative AI, cho phép các nhà phát triển tập trung vào việc cải thiện và mở rộng các giải pháp thay vì dành thời gian cho các hoạt động thủ công. Điều này cũng giúp đảm bảo rằng các giải pháp generative AI được tối ưu hóa về hiệu suất, bảo mật và hiệu quả chi phí. Cách tiếp cận tích hợp này không chỉ đẩy nhanh con đường từ tiền sản xuất đến triển khai quy mô đầy đủ, mà còn cho phép họ thích ứng nhanh chóng với những tiến bộ generative AI mới, quản lý các dependency phức tạp và mở rộng tài nguyên khi cần thiết, cuối cùng thúc đẩy đổi mới và lợi thế cạnh tranh trong lĩnh vực generative AI đang phát triển nhanh chóng. Xem phiên re:Invent 2024 để biết thêm thông tin.

Accor Group, một công ty khách sạn lớn đã phát triển ứng dụng đặt phòng được hỗ trợ bởi generative AI, đã thể hiện cách thức, ngay cả khi làm việc với các công nghệ mới như generative AI, các nguyên tắc phát triển phần mềm cơ bản vẫn là điều bắt buộc phải có. Họ đã triển khai một chiến lược kiểm tra toàn diện ba lớp. Đầu tiên, unit test xác minh rằng các prompt liên tục tạo ra các phản hồi chấp nhận được từ chatbot, ngay cả khi có sửa đổi prompt. Thứ hai, integration test xác minh luồng end-to-end của REST API và tương tác của chatbot với large language model (LLM). Bước cuối cùng là functional testing với các kịch bản được xác định trước cho việc kiểm tra và xác thực thủ công. Họ cũng triển khai các hệ thống phản hồi, thiết yếu cho vòng cải tiến của các ứng dụng hướng tới khách hàng, dưới dạng khảo sát trong ứng dụng, các tùy chọn phản hồi tức thì (thumbs-up hoặc thumbs-down), và một portal phản hồi chuyên dụng cho đầu vào chi tiết từ người dùng. Cuối cùng, để đo lường hiệu quả của giải pháp và tác động kinh doanh của nó, họ đã thiết lập một hệ thống để theo dõi việc đặt phòng được thực hiện thông qua ứng dụng generative AI.

Danske Bank, một ngân hàng hàng đầu Nordic, đã chuyển đổi từ thiết lập on-premises dựa trên container sang Amazon Elastic Container Service (Amazon ECS) với AWS Fargate. Điều này cho phép họ nhanh chóng chuyển các dịch vụ backend dựa trên API sang môi trường cloud-native. Kiến trúc tách rời này, được thiết kế để provider-agnostic, đã thiết lập cho họ sự linh hoạt trong việc tận dụng các công cụ và dịch vụ generative AI dựa trên cloud khác nhau khi cần thiết. Việc tích hợp với Amazon Bedrock diễn ra liền mạch và có tác động mạnh mẽ, vì nó cung cấp quyền truy cập nhanh hơn vào nhiều foundational model từ nhiều nhà cung cấp hơn. Điều này cho phép khách hàng nhanh chóng thử nghiệm, lặp lại và đánh giá các mô hình khác nhau cho các use case cụ thể của họ. Trường hợp này chứng minh cách sự kết hợp của các dịch vụ generative AI và kiến trúc cloud-native, API-driven đã cho phép khách hàng này lặp lại nhanh hơn và giữ trọng tâm vào giá trị kinh doanh thay vì tích hợp công nghệ.

Schaeffler Group đã thúc đẩy các phát minh và phát triển đột phá trong lĩnh vực công nghệ chuyển động trong hơn 75 năm. Công ty đã phát triển một framework generative AI toàn diện, thiết lập các guardrail quản trị và bảo mật cấp doanh nghiệp cho việc triển khai use case generative AI ở quy mô lớn với các infrastructure blueprint. Một generative AI inference gateway được tích hợp trong giải pháp, cung cấp quyền truy cập tập trung vào nhiều foundational model trong khi theo dõi việc sử dụng và chi phí. Trong tương lai, Schaeffler dự kiến sẽ tích hợp thêm các khả năng này vào landscape generative AI và dữ liệu rộng lớn hơn của họ, bao gồm các access control chi tiết hơn đối với data asset và việc áp dụng generative AI agent.

Những ví dụ này làm nổi bật một chủ đề chính cho các tổ chức trong các ngành: Thành công trong generative AI vượt ra ngoài việc phát triển các ứng dụng độc lập. Một mô hình vận hành dựa trên cloud toàn diện là rất quan trọng đối với các doanh nghiệp muốn theo kịp công nghệ phát triển nhanh chóng, với chi phí vận hành tối thiểu.

Thiết lập hàng ràng bảo mật, tuân thủ và sử dụng AI một cách có trách nhiệm 

Khi các ứng dụng generative AI của một tổ chức mở rộng để xử lý dữ liệu ngày càng nhạy cảm, bảo mật, tuân thủ và quản trị phải được ưu tiên tương ứng. Điều này bao gồm việc triển khai authentication và access control, mã hóa dữ liệu at rest và in transit, monitoring và auditing việc truy cập và sử dụng hệ thống, duy trì tuân thủ các quy định (như GDPR và EU AI Act gần đây), cũng như thiết lập các chính sách rõ ràng cho việc xử lý dữ liệu và sử dụng mô hình.

Dưới đây là một số ví dụ về khách hàng đã thành công trong việc điều hướng những yêu cầu quan trọng này.

Il Sole24 Ore đã triển khai một bộ quy tắc kỷ luật cho ứng dụng AI có đạo đức. Nó quy định việc duy trì các tiêu chuẩn chất lượng cao và tính trung tâm của dữ liệu đáng tin cậy. Các nguyên tắc bao gồm tuân thủ quy định, duy trì nguồn gốc và độ tin cậy của dữ liệu, kết hợp giám sát của con người thông qua human-in-the-loop, tính bao trùm và đa dạng trong việc sử dụng dữ liệu và áp dụng thuật toán, trách nhiệm và trách nhiệm giải trình, và giáo dục kỹ thuật số và minh bạch giao tiếp. Bằng cách tuân thủ những nguyên tắc này, Il Sole 24 Ore Group thể hiện cam kết của mình trong việc tận dụng các công nghệ đổi mới như generative AI một cách an toàn và có trách nhiệm, đặc biệt trong các lĩnh vực nhạy cảm như cung cấp tư vấn pháp lý và thuế chuyên môn. Cách tiếp cận này cho phép họ khai thác lợi ích của AI trong khi giảm thiểu các rủi ro tiềm ẩn và duy trì sự tin tưởng của người dùng.

Đối với Accor Group, việc triển khai ứng dụng đặt phòng thế hệ tiếp theo của họ đòi hỏi tương tác trực tiếp với khách hàng, nhấn mạnh nhu cầu quan trọng về các thực hành AI có trách nhiệm. Để đảm bảo chatbot sẽ cung cấp dịch vụ khách hàng hiệu quả trong khi hoạt động trong các ranh giới đạo đức nghiêm ngặt, họ đã thiết lập các biện pháp bảo vệ cụ thể để giảm thiểu việc sử dụng sai:

  • Chặn phản hồi đối với các truy vấn phân biệt đối xử
  • Giữ lại phản hồi đối với các hoạt động bất hợp pháp
  • Triển khai guardrail để giữ cuộc hội thoại trong bối cảnh kinh doanh phù hợp
  • Cài đặt bảo vệ chống lại các nỗ lực chuyển đổi vai trò hoặc thay đổi giọng điệu trong cuộc hội thoại
  • Triển khai các biện pháp phòng thủ kỹ thuật mạnh mẽ chống lại prompt injection

Kết luận

Quá trình chuyển đổi từ tiền sản xuất sang triển khai quy mô đầy đủ cho các ứng dụng generative AI mang đến những thách thức và cơ hội mới. Nó đòi hỏi việc xác định một business case vững chắc, duy trì tiêu chuẩn cao cho infrastructure và quy trình, tư duy chiến lược trong việc lựa chọn mô hình vận hành cloud hiệu quả, quản trị dữ liệu mạnh mẽ, bảo mật, tuân thủ, thực hành AI đạo đức, và nhiều hơn nữa.

Các tổ chức trên khắp EMEA đã chứng minh cách sử dụng các dịch vụ AWS có thể giúp vượt qua các rào cản và đẩy nhanh lợi thế của generative AI bằng cách áp dụng một cách tiếp cận toàn diện. Bằng cách học hỏi từ những use case này, nhiều doanh nghiệp hơn có thể đạt được việc triển khai thành công các giải pháp generative AI, và hưởng lợi từ công nghệ biến đổi này một cách đáng tin cậy, hiệu quả và có trách nhiệm.

Khám phá thêm các use case generative AI và câu chuyện thành công của khách hàng và tìm hiểu cách đẩy nhanh việc áp dụng AI của bạn trên cloud với đào tạo chuyên biệt và sự hỗ trợ của AWS Professional Services và Generative AI Innovation Center.

Tác giả

Dr. Giorgio Pessot là Machine Learning Engineer tại Amazon Web Services Professional Services. Với nền tảng về computational physics, ông chuyên về việc thiết kế các hệ thống AI cấp doanh nghiệp tại điểm giao thoa của lý thuyết toán học, DevOps và công nghệ cloud, nơi công nghệ và quy trình tổ chức hội tụ để đạt được các mục tiêu kinh doanh. Khi không bận rộn với các giải pháp cloud, bạn sẽ thấy Giorgio đang chế tác những sáng tạo ẩm thực trong bếp của mình.

Daniel Zagyva là Senior ML Engineer tại AWS Professional Services. Ông chuyên về phát triển các giải pháp machine learning có thể mở rộng, cấp sản xuất cho khách hàng AWS. Kinh nghiệm của ông trải rộng trên các lĩnh vực khác nhau, bao gồm natural language processing, generative AI và machine learning operations.

Nicolò Cosimo Albanese là Data Scientist và Machine Learning Engineer tại Amazon Web Services Professional Services. Với bằng Thạc sĩ Khoa học Kỹ thuật và các bằng sau đại học về Machine Learning và Biostatistics, ông chuyên về phát triển các giải pháp AI/ML tạo ra giá trị kinh doanh cho khách hàng doanh nghiệp. Chuyên môn của ông nằm tại điểm giao thoa của statistical modeling, công nghệ cloud và các hệ thống machine learning có thể mở rộng.

Subhro Bose là Data Architect trong Emergent Technologies and Intelligence Platform tại Amazon. Ông đam mê làm việc về các cách thức để các công nghệ mới nổi như AI/ML, big data, quantum và nhiều hơn nữa giúp các doanh nghiệp trong các ngành dọc khác nhau thành công trong hành trình đổi mới của họ.

Diar Sabri là Machine Learning Engineer tại AWS, giúp các tổ chức chuyển đổi kinh doanh thông qua các giải pháp AI đổi mới. Với kinh nghiệm trên nhiều ngành, ông xuất sắc trong việc kết nối khoảng cách giữa tầm nhìn chiến lược và triển khai công nghệ thực tế, cho phép khách hàng đạt được các kết quả kinh doanh có ý nghĩa.

Aamna Najmi là GenAI và Data Specialist tại AWS. Cô hỗ trợ khách hàng trên các ngành và khu vực trong việc vận hành và quản trị các hệ thống generative AI của họ ở quy mô lớn, đảm bảo chúng đáp ứng các tiêu chuẩn cao nhất về hiệu suất, an toàn và cân nhắc đạo đức, mang đến góc nhìn độc đáo về các chiến lược dữ liệu hiện đại để bổ sung cho lĩnh vực AI. Trong thời gian rảnh, cô theo đuổi đam mê thử nghiệm với thức ăn và khám phá những địa điểm mới.

Anwar Rizal là Senior Machine Learning consultant cho AWS Professional Services có trụ sở tại Paris. Ông làm việc với khách hàng AWS để phát triển các giải pháp dữ liệu và AI nhằm phát triển kinh doanh một cách bền vững.

Amer Elhabbash là Senior Data & AI Delivery Consultant với AWS Professional Services. Với hơn 25 năm kinh nghiệm quốc tế trong IT trải rộng trên nhiều lĩnh vực và domain; Viễn thông, Software Engineering, Database, Data Analytics và AI. Ông giúp khách hàng AWS di chuyển các hệ thống dữ liệu legacy và xây dựng các giải pháp cloud-native dựa trên dữ liệu đổi mới.

Hassen Riahi là Delivery Practice Manager Data & AI tại AWS Professional Services. Ông có bằng Tiến sĩ về Toán học & Khoa học Máy tính về quản lý dữ liệu quy mô lớn. Ông hợp tác với khách hàng AWS để xây dựng các giải pháp dựa trên dữ liệu.

Dr. Marco Guerriero lãnh đạo Data và GenAI tại AWS Professional Services cho France và Europe South, có bằng Tiến sĩ về Electrical and Computer Engineering từ University of Connecticut. Chuyên môn của ông trải rộng trên machine learning, statistical inference và mathematical optimization, với kinh nghiệm tại các tổ chức như NATO, GE và ABB trên các lĩnh vực quốc phòng, sản xuất, năng lượng và tự động hóa công nghiệp. Với hơn 60 ấn phẩm và năm bằng sáng chế Hoa Kỳ, Dr. Guerriero tập trung vào việc tận dụng các công nghệ mới nổi như GenAI và Quantum computing để thúc đẩy đổi mới kinh doanh trên các ngành.

Sri Elaprolu là Director của AWS Generative AI Innovation Center, nơi ông lãnh đạo một nhóm toàn cầu triển khai các giải pháp AI tiên tiến cho các tổ chức doanh nghiệp và chính phủ. Trong 12 năm làm việc tại AWS, ông đã lãnh đạo các nhóm ML science hợp tác với các tổ chức như NFL, Cerner và NASA. Trước AWS, ông đã dành 14 năm tại Northrop Grumman trong các vai trò lãnh đạo phát triển sản phẩm và software engineering. Sri có bằng Thạc sĩ về Engineering Science và MBA.

Dragica Boca là Managing Director của Professional Services EMEA tại Amazon Web Services (AWS), lãnh đạo các sáng kiến di chuyển cloud doanh nghiệp và chuyển đổi generative AI. Với 30 năm kinh nghiệm tư vấn công nghệ tại Microsoft và IBM Global Business Services, cô chuyên về triển khai các giải pháp AI sẵn sàng sản xuất cho các tổ chức Public Sector và Financial Services. Dragica hiện giám sát các triển khai GenAI quy mô lớn trên khắp EMEA, giúp các doanh nghiệp điều hướng sự phức tạp của việc triển khai AI có trách nhiệm, kiến trúc có thể mở rộng và các mô hình áp dụng bền vững.

Leave a comment