Cách iFood xây dựng nền tảng để chạy hàng trăm mô hình machine learning với Amazon SageMaker Inference

bởi Daniel Vieira, Debora Fanin, Gopi Mudiyala và Saurabh Trikande vào ngày 08 tháng 4 năm 2025 trong Nâng cao (300), Amazon SageMaker Data & AI Governance, Customer Solutions Permalink  Comments 

Có trụ sở chính tại São Paulo, Brazil, iFood là một công ty tư nhân quốc gia và là công ty hàng đầu trong lĩnh vực công nghệ thực phẩm ở Mỹ Latinh, xử lý hàng triệu đơn đặt hàng hàng tháng. iFood đã nổi bật với chiến lược kết hợp công nghệ tiên tiến vào hoạt động của mình. Với sự hỗ trợ của AWS, iFood đã phát triển cơ sở hạ tầng suy luận machine learning (ML) mạnh mẽ, sử dụng các dịch vụ như Amazon SageMaker để tạo và triển khai các mô hình ML một cách hiệu quả. Sự hợp tác này đã cho phép iFood không chỉ tối ưu hóa các quy trình nội bộ mà còn cung cấp các giải pháp sáng tạo cho các đối tác giao hàng và nhà hàng của mình.

Nền tảng ML của iFood bao gồm một tập hợp các công cụ, quy trình và quy trình làm việc được phát triển với các mục tiêu sau:

  • Đẩy nhanh quá trình phát triển và đào tạo các mô hình AI/ML, làm cho chúng đáng tin cậy và dễ tái tạo hơn
  • Đảm bảo rằng việc triển khai các mô hình này vào sản xuất là đáng tin cậy, có thể mở rộng và có thể truy xuất nguồn gốc
  • Tạo điều kiện thuận lợi cho việc thử nghiệm, giám sát và đánh giá các mô hình trong sản xuất một cách minh bạch, dễ tiếp cận và tiêu chuẩn hóa

Để đạt được những mục tiêu này, iFood sử dụng SageMaker, giúp đơn giản hóa việc đào tạo và triển khai các mô hình. Ngoài ra, việc tích hợp các tính năng của SageMaker trong cơ sở hạ tầng của iFood tự động hóa các quy trình quan trọng, chẳng hạn như tạo bộ dữ liệu đào tạo, mô hình đào tạo, triển khai mô hình vào sản xuất và liên tục theo dõi hiệu suất của chúng.

Trong bài đăng này, chúng tôi chỉ ra cách iFood sử dụng SageMaker để cách mạng hóa các hoạt động ML của mình. Bằng cách khai thác sức mạnh của SageMaker, iFood hợp lý hóa toàn bộ vòng đời ML, từ đào tạo mô hình đến triển khai. Sự tích hợp này không chỉ đơn giản hóa các quy trình phức tạp mà còn tự động hóa các tác vụ quan trọng.

Suy luận AI tại iFood
iFood đã khai thác sức mạnh của nền tảng AI / ML mạnh mẽ để nâng cao trải nghiệm của khách hàng trên các điểm tiếp xúc đa dạng của nó. Sử dụng khả năng tiên tiến của AI/ML, công ty đã phát triển một bộ giải pháp chuyển đổi để giải quyết vô số trường hợp sử dụng của khách hàng:

  • Đề xuất được cá nhân hóa – Tại iFood, các mô hình đề xuất do AI cung cấp phân tích lịch sử đặt hàng, sở thích và các yếu tố ngữ cảnh trong quá khứ của khách hàng để đề xuất các nhà hàng và món trong thực đơn phù hợp nhất. Cách tiếp cận được cá nhân hóa này đảm bảo khách hàng khám phá các món ăn và món ăn mới phù hợp với sở thích của họ, cải thiện sự hài lòng và thúc đẩy khối lượng đặt hàng tăng lên.
  • Theo dõi đơn hàng thông minh – Hệ thống AI của iFood theo dõi đơn hàng trong thời gian thực, dự đoán thời gian giao hàng với độ chính xác cao. Bằng cách hiểu các yếu tố như mô hình giao thông, thời gian chuẩn bị nhà hàng và vị trí chuyển phát nhanh, AI có thể chủ động thông báo cho khách hàng về trạng thái đơn hàng và thời gian đến dự kiến của họ, giảm sự không chắc chắn và lo lắng trong quá trình giao hàng.
  • Dịch vụ khách hàng tự động – Để xử lý hàng nghìn yêu cầu của khách hàng hàng ngày, iFood đã phát triển một chatbot được hỗ trợ bởi AI có thể nhanh chóng giải quyết các vấn đề và câu hỏi phổ biến. Trợ lý ảo thông minh này hiểu ngôn ngữ tự nhiên, truy cập dữ liệu liên quan và cung cấp phản hồi được cá nhân hóa, cung cấp hỗ trợ nhanh chóng và nhất quán mà không gây quá tải cho đội ngũ dịch vụ khách hàng của con người.
  • Hỗ trợ mua sắm hàng tạp hóa – Tích hợp các mô hình ngôn ngữ nâng cao, ứng dụng của iFood cho phép khách hàng chỉ cần nói hoặc nhập nhu cầu công thức nấu ăn hoặc danh sách hàng tạp hóa của họ và AI sẽ tự động tạo danh sách mua sắm chi tiết. Tính năng lập kế hoạch tạp hóa hỗ trợ giọng nói này giúp khách hàng tiết kiệm thời gian và công sức, nâng cao trải nghiệm mua sắm tổng thể của họ.

Thông qua các sáng kiến đa dạng được hỗ trợ bởi AI này, iFood có thể dự đoán nhu cầu của khách hàng, hợp lý hóa các quy trình chính và mang lại trải nghiệm đặc biệt nhất quán — củng cố hơn nữa vị trí là nền tảng công nghệ thực phẩm hàng đầu ở Mỹ Latinh.

Tổng quan về giải pháp

Sơ đồ sau đây minh họa kiến trúc kế thừa của iFood, có quy trình làm việc riêng biệt cho các nhóm khoa học dữ liệu và kỹ thuật, tạo ra những thách thức trong việc triển khai hiệu quả các mô hình máy học chính xác, thời gian thực vào các hệ thống sản xuất.

Trước đây, các nhóm khoa học dữ liệu và kỹ thuật tại iFood hoạt động độc lập. Các nhà khoa học dữ liệu sẽ xây dựng các mô hình bằng cách sử dụng sổ tay, điều chỉnh trọng số và xuất bản chúng lên các dịch vụ. Các nhóm kỹ thuật sau đó sẽ phải vật lộn để tích hợp các mô hình này vào hệ thống sản xuất. Sự mất kết nối giữa hai nhóm khiến việc triển khai các mô hình ML thời gian thực chính xác trở nên khó khăn.

Để vượt qua thách thức này, iFood đã xây dựng một nền tảng ML nội bộ giúp thu hẹp khoảng cách này. Nền tảng này đã hợp lý hóa quy trình làm việc, mang lại trải nghiệm liền mạch cho việc tạo, đào tạo và cung cấp các mô hình để suy luận. Nó cung cấp một tích hợp tập trung, nơi các nhà khoa học dữ liệu có thể xây dựng, đào tạo và triển khai các mô hình liền mạch từ một cách tiếp cận tích hợp, xem xét quy trình phát triển của các nhóm. Tương tác với các nhóm kỹ thuật có thể sử dụng các mô hình này và tích hợp chúng vào các ứng dụng từ cả góc độ trực tuyến và ngoại tuyến, cho phép quy trình làm việc hiệu quả và hợp lý hơn.

Bằng cách phá vỡ rào cản giữa khoa học dữ liệu và kỹ thuật, các nền tảng AI của AWS đã trao quyền cho iFood sử dụng toàn bộ tiềm năng dữ liệu của họ và đẩy nhanh quá trình phát triển các ứng dụng AI. Khả năng triển khai tự động và suy luận có thể mở rộng do SageMaker cung cấp đảm bảo rằng các mô hình luôn sẵn sàng để hỗ trợ các ứng dụng thông minh và cung cấp dự đoán chính xác theo yêu cầu. Việc tập trung các dịch vụ ML như một sản phẩm đã thay đổi cuộc chơi đối với iFood, cho phép họ tập trung vào việc xây dựng các mô hình hiệu suất cao hơn là các chi tiết suy luận phức tạp.

Một trong những khả năng cốt lõi của nền tảng ML của iFood là khả năng cung cấp cơ sở hạ tầng để phục vụ các dự đoán. Một số trường hợp sử dụng được hỗ trợ bởi suy luận được cung cấp thông qua ML Go!, chịu trách nhiệm triển khai quy trình và điểm cuối SageMaker. Cái trước được sử dụng để lên lịch cho các công việc dự đoán ngoại tuyến và cái sau được sử dụng để tạo ra các dịch vụ mô hình, được sử dụng bởi các dịch vụ ứng dụng. Sơ đồ sau đây minh họa kiến trúc cập nhật của iFood, kết hợp nền tảng ML nội bộ được xây dựng để hợp lý hóa quy trình làm việc giữa các nhóm khoa học dữ liệu và kỹ thuật, cho phép triển khai hiệu quả các mô hình máy học vào các hệ thống sản xuất.

Tích hợp triển khai mô hình vào quy trình phát triển dịch vụ là một sáng kiến quan trọng để cho phép các nhà khoa học dữ liệu và kỹ sư ML triển khai và duy trì các mô hình đó. Nền tảng ML trao quyền cho việc xây dựng và phát triển các hệ thống ML. Một số tích hợp khác với các nền tảng quan trọng khác, như nền tảng tính năng và nền tảng dữ liệu, đã được cung cấp để tăng trải nghiệm cho người dùng nói chung. Quá trình sử dụng các quyết định dựa trên ML đã được sắp xếp hợp lý — nhưng nó không kết thúc ở đó. Nền tảng ML của iFood, ML Go!, hiện đang tập trung vào các khả năng suy luận mới, được hỗ trợ bởi các tính năng gần đây trong đó nhóm của iFood chịu trách nhiệm hỗ trợ ý tưởng và phát triển của họ. Sơ đồ sau đây minh họa kiến trúc cuối cùng của nền tảng ML của iFood, cho thấy cách triển khai mô hình được tích hợp vào quy trình phát triển dịch vụ, kết nối của nền tảng với các nền tảng tính năng và dữ liệu cũng như tập trung vào các khả năng suy luận mới.

Một trong những thay đổi lớn nhất là tạo ra một khái niệm trừu tượng để kết nối với SageMaker Endpoints và Jobs, được gọi là ML Go! Gateway, và cả việc tách các mối quan tâm trong Điểm cuối, bằng cách sử dụng tính năng Thành phần suy luận, giúp việc phân phối nhanh hơn và hiệu quả hơn. Trong cấu trúc suy luận mới này, các Điểm cuối cũng được quản lý bởi ML Go! CI/CD, để lại cho các đường ống, chỉ xử lý các quảng cáo mô hình, chứ không phải bản thân cơ sở hạ tầng. Nó sẽ giảm thời gian thay đổi và thay đổi tỷ lệ thất bại trong quá trình triển khai.

Sử dụng SageMaker Inference Model Serving Containers:

Một trong những tính năng chính của nền tảng máy học hiện đại là tiêu chuẩn hóa máy học và các dịch vụ AI. Bằng cách đóng gói các mô hình và phần phụ thuộc dưới dạng bộ chứa Docker, các nền tảng này đảm bảo tính nhất quán và tính di động trên các môi trường và giai đoạn khác nhau của ML. Sử dụng SageMaker, các nhà khoa học dữ liệu và nhà phát triển có thể sử dụng các bộ chứa Docker dựng sẵn, giúp việc triển khai và quản lý các dịch vụ ML trở nên đơn giản. Khi dự án tiến triển, họ có thể khởi động các phiên bản mới và định cấu hình chúng theo yêu cầu cụ thể của họ. SageMaker cung cấp các vùng chứa Docker được thiết kế để hoạt động liền mạch với SageMaker. Các bộ chứa này cung cấp một môi trường được tiêu chuẩn hóa và có thể mở rộng để chạy khối lượng công việc ML trên SageMaker.

SageMaker cung cấp một bộ chứa được tạo sẵn cho các khung và thuật toán ML phổ biến, chẳng hạn như TensorFlow, PyTorch, XGBoost và nhiều thuật toán khác. Các vùng chứa này được tối ưu hóa cho hiệu suất và bao gồm tất cả các phần phụ thuộc và thư viện cần thiết được cài đặt sẵn, giúp bạn bắt đầu với các dự án ML của mình một cách đơn giản. Ngoài các bộ chứa được tạo sẵn, nó cung cấp các tùy chọn để đưa các vùng chứa tùy chỉnh của riêng bạn vào SageMaker, bao gồm mã ML, phần phụ thuộc và thư viện cụ thể của bạn. Điều này có thể đặc biệt hữu ích nếu bạn đang sử dụng một framework ít phổ biến hơn hoặc có các yêu cầu cụ thể mà các container dựng sẵn không đáp ứng.

iFood tập trung cao độ vào việc sử dụng các vùng chứa tùy chỉnh để đào tạo và triển khai khối lượng công việc ML, cung cấp một môi trường nhất quán và có thể tái tạo cho các thử nghiệm ML, đồng thời giúp theo dõi và sao chép kết quả trở nên dễ dàng. Bước đầu tiên trong hành trình này là chuẩn hóa mã tùy chỉnh ML, đây thực sự là đoạn mã mà các nhà khoa học dữ liệu nên tập trung vào. Không có sổ ghi chép và với BruceML, cách tạo mã để đào tạo và phục vụ các mô hình đã thay đổi, được đóng gói ngay từ đầu dưới dạng hình ảnh vùng chứa. BruceML chịu trách nhiệm tạo ra giàn giáo cần thiết để tích hợp liền mạch với nền tảng SageMaker, cho phép các nhóm tận dụng các tính năng khác nhau của nó, chẳng hạn như điều chỉnh siêu tham số, triển khai mô hình và giám sát. Bằng cách chuẩn hóa các dịch vụ ML và sử dụng container hóa, các nền tảng hiện đại dân chủ hóa ML, cho phép iFood nhanh chóng xây dựng, triển khai và mở rộng quy mô các ứng dụng thông minh.

Tự động hóa triển khai mô hình và đào tạo lại hệ thống ML

Khi chạy các mô hình ML trong sản xuất, điều quan trọng là phải có một quy trình mạnh mẽ và tự động để triển khai và hiệu chỉnh lại các mô hình đó trên các trường hợp sử dụng khác nhau. Điều này giúp đảm bảo các mô hình vẫn chính xác và hiệu suất theo thời gian. Nhóm tại iFood hiểu rõ thách thức này – không chỉ mô hình được triển khai. Thay vào đó, họ dựa vào một khái niệm khác để giữ cho mọi thứ hoạt động tốt: ML pipelines.

Bằng cách sử dụng Amazon SageMaker Pipelines, họ có thể xây dựng hệ thống CI/CD cho ML, để cung cấp đào tạo lại tự động và triển khai mô hình. Họ cũng tích hợp toàn bộ hệ thống này với quy trình CI / CD hiện có của công ty, làm cho nó hiệu quả và cũng duy trì các phương pháp DevOps tốt được sử dụng tại iFood. Nó bắt đầu với ML Go! CI/CD pipeline đẩy các tạo tác mã mới nhất chứa logic triển khai và đào tạo mô hình. Nó bao gồm quy trình đào tạo, sử dụng các vùng chứa khác nhau để triển khai toàn bộ quy trình. Khi đào tạo hoàn tất, quy trình suy luận có thể được thực thi để bắt đầu triển khai mô hình. Nó có thể là một mô hình hoàn toàn mới hoặc quảng bá một phiên bản mới để tăng hiệu suất của một mô hình hiện có. Mọi mô hình có sẵn để triển khai cũng được bảo mật và đăng ký tự động bởi ML Go! trong Amazon SageMaker Model Registry, cung cấp khả năng lập phiên bản và theo dõi.

Bước cuối cùng phụ thuộc vào các yêu cầu suy luận dự kiến. Đối với các trường hợp sử dụng dự đoán hàng loạt, quy trình tạo tác vụ chuyển đổi hàng loạt SageMaker để chạy các dự đoán quy mô lớn. Để suy luận theo thời gian thực, quy trình triển khai mô hình đến điểm cuối SageMaker, lựa chọn cẩn thận biến thể bộ chứa và loại phiên bản thích hợp để xử lý nhu cầu về lưu lượng sản xuất và độ trễ dự kiến. Tự động hóa từ đầu đến cuối này đã thay đổi cuộc chơi cho iFood, cho phép họ nhanh chóng lặp lại các mô hình ML của mình và triển khai các bản cập nhật và hiệu chỉnh lại một cách nhanh chóng và tự tin trên các trường hợp sử dụng khác nhau của họ. SageMaker Pipelines đã cung cấp một cách hợp lý để điều phối các quy trình làm việc phức tạp này, đảm bảo hoạt động của mô hình hiệu quả và đáng tin cậy.

Chạy suy luận ở các định dạng SLA khác nhau

iFood sử dụng khả năng suy luận của SageMaker để hỗ trợ các ứng dụng thông minh của mình và đưa ra dự đoán chính xác cho khách hàng. Bằng cách tích hợp các tùy chọn suy luận mạnh mẽ có sẵn trong SageMaker, iFood đã có thể triển khai liền mạch các mô hình ML và cung cấp chúng để dự đoán hàng loạt và theo thời gian thực. Đối với các trường hợp sử dụng dự đoán trực tuyến, theo thời gian thực của iFood, công ty sử dụng các điểm cuối được lưu trữ bởi SageMaker để triển khai các mô hình của họ. Các điểm cuối này được tích hợp vào các ứng dụng hướng tới khách hàng của iFood, cho phép suy luận ngay lập tức về dữ liệu đến từ người dùng. SageMaker xử lý việc mở rộng quy mô và quản lý các điểm cuối này, đảm bảo rằng các mô hình của iFood luôn sẵn sàng để cung cấp dự đoán chính xác và nâng cao trải nghiệm người dùng.

Ngoài dự đoán thời gian thực, iFood còn sử dụng chuyển đổi hàng loạt SageMaker để thực hiện suy luận không đồng bộ, quy mô lớn trên các tập dữ liệu. Điều này đặc biệt hữu ích cho các yêu cầu tiền xử lý dữ liệu và dự đoán lô dữ liệu của iFood, chẳng hạn như tạo các đề xuất hoặc thông tin chi tiết cho các đối tác nhà hàng của họ. Các tác vụ chuyển đổi hàng loạt SageMaker cho phép iFood xử lý hiệu quả lượng dữ liệu khổng lồ, nâng cao hơn nữa khả năng ra quyết định dựa trên dữ liệu của họ.

Dựa trên sự thành công của việc tiêu chuẩn hóa SageMaker Inference, iFood đã đóng vai trò quan trọng trong việc hợp tác với nhóm SageMaker Inference để xây dựng và nâng cao khả năng suy luận AI quan trọng trong nền tảng SageMaker. Kể từ những ngày đầu của ML, iFood đã cung cấp cho nhóm SageMaker Inference những thông tin đầu vào và chuyên môn có giá trị, cho phép giới thiệu một số tính năng và tối ưu hóa mới:

  • Tối ưu hóa chi phí và hiệu suất cho suy luận AI tổng quát – iFood đã giúp nhóm SageMaker Inference phát triển các kỹ thuật sáng tạo để tối ưu hóa việc sử dụng các bộ tăng tốc, cho phép SageMaker Inference giảm trung bình 50% chi phí triển khai mô hình nền tảng (FM) và độ trễ trung bình 20% với các thành phần suy luận. Bước đột phá này giúp tiết kiệm chi phí và cải thiện hiệu suất đáng kể cho khách hàng chạy khối lượng công việc AI tổng quát trên SageMaker.
  • Cải tiến mở rộng quy mô cho suy luận AI – chuyên môn của iFood về hệ thống phân tán và tự động mở rộng quy mô cũng đã giúp nhóm SageMaker phát triển các khả năng nâng cao để xử lý tốt hơn các yêu cầu mở rộng quy mô của các mô hình AI tổng quát. Những cải tiến này giúp giảm thời gian tự động thay đổi quy mô lên đến 40% và phát hiện tự động thay đổi quy mô sáu lần, đảm bảo rằng khách hàng có thể nhanh chóng thay đổi quy mô khối lượng công việc suy luận của họ trên SageMaker để đáp ứng nhu cầu tăng đột biến mà không ảnh hưởng đến hiệu suất.
  • Triển khai mô hình AI tổng quát được sắp xếp hợp lý để suy luận – Nhận thấy nhu cầu triển khai mô hình đơn giản hóa, iFood đã hợp tác với AWS để giới thiệu khả năng triển khai các mô hình ngôn ngữ lớn mã nguồn mở (LLM) và FM chỉ với vài cú nhấp chuột. Chức năng thân thiện với người dùng này loại bỏ sự phức tạp truyền thống liên quan đến việc triển khai các mô hình tiên tiến này, cho phép nhiều khách hàng khai thác sức mạnh của AI.
  • Mở rộng quy mô về không cho các điểm cuối suy luận – iFood đóng một vai trò quan trọng trong việc hợp tác với SageMaker Inference để phát triển và ra mắt tính năng mở rộng quy mô về không cho các điểm cuối suy luận SageMaker. Khả năng cải tiến này cho phép các điểm cuối suy luận tự động tắt khi không sử dụng và nhanh chóng quay theo yêu cầu khi có yêu cầu mới. Tính năng này đặc biệt có lợi cho môi trường phát triển/thử nghiệm, các ứng dụng lưu lượng truy cập thấp và các trường hợp sử dụng suy luận với các nhu cầu suy luận khác nhau, vì nó loại bỏ chi phí tài nguyên nhàn rỗi trong khi vẫn duy trì khả năng nhanh chóng phục vụ các yêu cầu khi cần. Chức năng mở rộng quy mô bằng không thể hiện một tiến bộ lớn về hiệu quả chi phí cho suy luận AI, giúp nó dễ tiếp cận hơn và khả thi về mặt kinh tế cho nhiều trường hợp sử dụng hơn.
  • Đóng gói suy luận mô hình AI hiệu quả hơn – Để đơn giản hóa hơn nữa vòng đời mô hình AI, iFood đã làm việc với AWS để nâng cao khả năng đóng gói LLM và mô hình của SageMaker để triển khai. Những cải tiến này giúp việc chuẩn bị và triển khai các mô hình AI này trở nên đơn giản, đẩy nhanh quá trình áp dụng và tích hợp chúng.
  • Điểm cuối đa mô hình cho GPU – iFood đã hợp tác với nhóm SageMaker Inference để khởi chạy điểm cuối đa mô hình cho các phiên bản dựa trên GPU. Cải tiến này cho phép bạn triển khai nhiều mô hình AI trên một điểm cuối hỗ trợ GPU duy nhất, cải thiện đáng kể việc sử dụng tài nguyên và hiệu quả chi phí. Bằng cách tận dụng chuyên môn của iFood trong việc tối ưu hóa GPU và phục vụ mô hình, SageMaker hiện cung cấp giải pháp có thể tải và dỡ các mô hình tự động trên GPU, giảm chi phí cơ sở hạ tầng lên đến 75% cho khách hàng có nhiều kiểu máy và các kiểu lưu lượng truy cập khác nhau.
  • Suy luận không đồng bộ – Nhận thấy nhu cầu xử lý các yêu cầu suy luận chạy trong thời gian dài, nhóm tại iFood đã hợp tác chặt chẽ với nhóm Suy luận SageMaker để phát triển và khởi chạy Suy luận không đồng bộ trong SageMaker. Tính năng này cho phép bạn xử lý tải trọng lớn hoặc yêu cầu suy luận tốn thời gian mà không bị ràng buộc bởi các lệnh gọi API thời gian thực. Kinh nghiệm của iFood với các hệ thống phân tán quy mô lớn đã giúp định hình giải pháp này, giờ đây cho phép quản lý tốt hơn các tác vụ suy luận sử dụng nhiều tài nguyên và khả năng xử lý các yêu cầu suy luận có thể mất vài phút để hoàn thành. Khả năng này đã mở ra các trường hợp sử dụng mới cho suy luận AI, đặc biệt là trong các ngành xử lý các tác vụ xử lý dữ liệu phức tạp như bộ gen, phân tích video và mô hình tài chính.

Bằng cách hợp tác chặt chẽ với nhóm SageMaker Inference, iFood đã đóng một vai trò quan trọng trong việc thúc đẩy sự phát triển nhanh chóng của khả năng suy luận AI và suy luận AI tổng quát trong SageMaker. Các tính năng và tối ưu hóa được giới thiệu thông qua sự hợp tác này đang trao quyền cho khách hàng AWS mở khóa tiềm năng chuyển đổi của suy luận một cách dễ dàng, tiết kiệm chi phí và hiệu suất hơn.

“Tại iFood, chúng tôi đi đầu trong việc áp dụng công nghệ AI và máy học biến đổi, đồng thời quan hệ đối tác của chúng tôi với nhóm sản phẩm SageMaker Inference đã đóng vai trò quan trọng trong việc định hình tương lai của các ứng dụng AI. Cùng nhau, chúng tôi đã phát triển các chiến lược để quản lý hiệu quả khối lượng công việc suy luận, cho phép chúng tôi chạy các mô hình với tốc độ và hiệu suất giá cả. Các bài học chúng tôi đã học được đã hỗ trợ chúng tôi trong việc tạo ra nền tảng nội bộ của mình, có thể đóng vai trò như một kế hoạch chi tiết cho các tổ chức khác đang tìm cách khai thác sức mạnh của suy luận AI. Chúng tôi tin rằng các tính năng mà chúng tôi đã hợp tác xây dựng sẽ giúp ích rộng rãi cho các doanh nghiệp khác chạy khối lượng công việc suy luận trên SageMaker, mở ra những biên giới mới của đổi mới và chuyển đổi kinh doanh, bằng cách giải quyết các vấn đề quan trọng và lặp đi lặp lại trong vũ trụ kỹ thuật học máy.”

– Daniel Vieira, giám đốc Nền tảng ML tại iFood cho biết.

Kết thúc

Sử dụng các khả năng của SageMaker, iFood đã chuyển đổi cách tiếp cận của mình đối với ML và AI, mở ra những khả năng mới để nâng cao trải nghiệm của khách hàng. Bằng cách xây dựng một nền tảng ML tập trung và mạnh mẽ, iFood đã thu hẹp khoảng cách giữa các nhóm khoa học dữ liệu và kỹ thuật, hợp lý hóa vòng đời mô hình từ phát triển đến triển khai. Việc tích hợp các tính năng của SageMaker đã cho phép iFood triển khai các mô hình ML cho cả trường hợp sử dụng theo thời gian thực và theo lô. Đối với các ứng dụng hướng đến khách hàng theo thời gian thực, iFood sử dụng các điểm cuối được lưu trữ SageMaker để cung cấp dự đoán ngay lập tức và nâng cao trải nghiệm người dùng. Ngoài ra, công ty sử dụng chuyển đổi hàng loạt SageMaker để xử lý hiệu quả các bộ dữ liệu lớn và tạo thông tin chi tiết cho các đối tác nhà hàng của mình. Sự linh hoạt trong các tùy chọn suy luận này là chìa khóa cho khả năng của iFood trong việc cung cấp năng lượng cho nhiều ứng dụng thông minh khác nhau.

Việc tự động hóa triển khai và đào tạo lại thông qua ML Go!, được hỗ trợ bởi SageMaker Pipelines và SageMaker Inference, đã thay đổi cuộc chơi cho iFood. Điều này đã cho phép công ty nhanh chóng lặp lại các mô hình ML của mình, tự tin triển khai các bản cập nhật và duy trì hiệu suất và độ tin cậy liên tục của các ứng dụng thông minh. Hơn nữa, quan hệ đối tác chiến lược của iFood với nhóm SageMaker Inference đã đóng vai trò quan trọng trong việc thúc đẩy sự phát triển của khả năng suy luận AI trong nền tảng. Thông qua sự hợp tác này, iFood đã giúp tối ưu hóa chi phí và hiệu suất, cải thiện quy mô và đơn giản hóa các tính năng triển khai mô hình—tất cả đều mang lại lợi ích cho nhiều khách hàng AWS hơn.

Bằng cách tận dụng các khả năng mà SageMaker cung cấp, iFood đã có thể mở khóa tiềm năng biến đổi của AI và ML, cung cấp các giải pháp sáng tạo giúp nâng cao trải nghiệm của khách hàng và củng cố vị trí là nền tảng công nghệ thực phẩm hàng đầu ở Mỹ Latinh. Hành trình này là minh chứng cho sức mạnh của cơ sở hạ tầng AI dựa trên đám mây và giá trị của quan hệ đối tác chiến lược trong việc thúc đẩy chuyển đổi kinh doanh dựa trên công nghệ.

Bằng cách làm theo ví dụ của iFood, bạn có thể khai thác toàn bộ tiềm năng của SageMaker cho doanh nghiệp của mình, thúc đẩy sự đổi mới và luôn dẫn đầu trong ngành của bạn.

Giới thiệu về các tác giả

Daniel Vieira là Giám đốc Kỹ thuật Học máy dày dạn kinh nghiệm tại iFood, với nền tảng học thuật vững chắc về khoa học máy tính, có cả bằng cử nhân và thạc sĩ của Đại học Liên bang Minas Gerais (UFMG). Với hơn một thập kỷ kinh nghiệm trong lĩnh vực kỹ thuật phần mềm và phát triển nền tảng, Daniel lãnh đạo nền tảng ML của iFood, xây dựng một hệ sinh thái mạnh mẽ, có thể mở rộng nhằm thúc đẩy các giải pháp ML có tác động trong toàn công ty. Trong thời gian rảnh rỗi, Daniel Vieira thích âm nhạc, triết học và tìm hiểu về những điều mới mẻ trong khi uống một tách cà phê ngon.

Debora Fanin là Giám đốc giải pháp khách hàng cấp cao của AWS cho phân khúc Doanh nghiệp gốc kỹ thuật số ở Brazil. Trong vai trò này, Debora quản lý chuyển đổi khách hàng, tạo ra các chiến lược áp dụng đám mây để hỗ trợ triển khai kịp thời, hiệu quả về chi phí. Trách nhiệm của cô bao gồm thiết kế kế hoạch quản lý thay đổi, hướng dẫn các quyết định tập trung vào giải pháp và giải quyết các rủi ro tiềm ẩn để phù hợp với mục tiêu của khách hàng. Con đường học tập của Debora bao gồm bằng Thạc sĩ Quản trị tại FEI và các chứng chỉ như Chứng chỉ Amazon Solutions Architect Associate và Agile. Lịch sử chuyên môn của cô trải dài các vai trò CNTT và quản lý dự án trong nhiều lĩnh vực khác nhau, nơi cô đã phát triển chuyên môn về công nghệ đám mây, khoa học dữ liệu và quan hệ khách hàng.

Saurabh Trikande là Giám đốc sản phẩm cấp cao của Amazon Bedrock và Amazon SageMaker Inference. Anh đam mê làm việc với khách hàng và đối tác, được thúc đẩy bởi mục tiêu dân chủ hóa AI. Ông tập trung vào những thách thức cốt lõi liên quan đến việc triển khai các ứng dụng AI phức tạp, suy luận với các mô hình nhiều đối tượng thuê, tối ưu hóa chi phí và làm cho việc triển khai các mô hình AI tổng quát dễ tiếp cận hơn. Trong thời gian rảnh rỗi, Saurabh thích đi bộ đường dài, tìm hiểu về các công nghệ tiên tiến, theo dõi TechCrunch và dành thời gian cho gia đình.

Gopi Mudiyala là Giám đốc tài khoản kỹ thuật cấp cao tại AWS. Anh ấy giúp đỡ khách hàng trong ngành dịch vụ tài chính với các hoạt động của họ trong AWS. Là một người đam mê máy học, Gopi làm việc để giúp khách hàng thành công trong hành trình ML của họ. Khi rảnh rỗi, anh thích chơi cầu lông, dành thời gian cho gia đình và đi du lịch.