Category: AWS Big Data Blog
-
Apache Spark 4.0.1 preview hiện đã có trên Amazon EMR Serverless
Tác giả: Al MS, Emilie Faracci, and Karthik PrabhakarNgày phát hành: 26 JAN 2026Chuyên mục: Advanced (300), Amazon EMR, Analytics, Announcements, Serverless Amazon EMR Serverless hiện hỗ trợ Apache Spark 4.0.1 ở chế độ preview, giúp phân tích dữ liệu dễ tiếp cận hơn với nhiều người dùng, đơn giản hóa quy trình kỹ thuật…
-
Kích hoạt quản lý chất lượng dữ liệu chiến lược với nhãn AWS Glue DQDL
Tác giả: Arun A K, Annie Wang, và Roshin BabuNgày phát hành: 26 JAN 2026Chuyên mục: Analytics, AWS Glue, Intermediate (200), Technical How-to Các tổ chức ngày càng phụ thuộc vào dữ liệu đáng tin cậy, chất lượng cao để thúc đẩy phân tích, báo cáo quy định và ra quyết định vận hành. Khi…
-
10 phương pháp hay nhất cho Amazon EMR Serverless
Tác giả: Karthik Prabhakar, Amber Runnels, Neil Mukerje, và Parul SaxenaNgày phát hành: 26 JAN 2026Chuyên mục: Advanced (300), Amazon EMR, Analytics, AWS Well-Architected Framework, Best Practices Amazon EMR Serverless là một tùy chọn triển khai cho Amazon EMR mà bạn có thể sử dụng để chạy các framework phân tích dữ liệu lớn mã…
-
Tăng tốc phân tích dữ liệu nhận biết ngữ cảnh và quy trình làm việc ML với Amazon SageMaker Data Agent
Tác giả: Kshitija Dound, Siddharth Gupta, Ishneet Kaur, Mohan Gandhi, Murali Balakrishnan Narayanaswamy, Shubham Mehta, Amit Sinha, và Vikramank SinghNgày phát hành: 22 JAN 2026Chuyên mục: Advanced (300), Amazon SageMaker, Technical How-to Việc tăng tốc phân tích dữ liệu và phát triển học máy (ML) đòi hỏi các công cụ AI hiểu rõ môi trường…
-
Tự động điều chỉnh quy mô theo yêu cầu và theo lịch trình cho các cụm dựa trên Amazon MSK Express
Tác giả: Subham Rakshit và Rakshith RaoNgày phát hành: 22 JAN 2026Chuyên mục: Advanced (300), Amazon Managed Streaming for Apache Kafka (Amazon MSK), Technical How-to Các khối lượng công việc streaming hiện đại có tính động cao—lưu lượng truy cập biến động dựa trên thời gian trong ngày, chu kỳ kinh doanh hoặc các đợt…
-
Hợp lý hóa việc di chuyển đối tượng nhị phân lớn: Giải pháp dựa trên Kafka cho Oracle sang Amazon Aurora PostgreSQL và Amazon S3
Tác giả: Naresh Dhiman, Archana Sharma, Ron Kolwitz, và Karan LakhwaniNgày phát hành: 21 JAN 2026Chuyên mục: Advanced (300), Amazon Aurora, Amazon Managed Streaming for Apache Kafka (Amazon MSK), Amazon Simple Storage Service (S3), PostgreSQL compatible, Technical How-to Các khách hàng di chuyển từ cơ sở dữ liệu Oracle tại chỗ sang AWS phải đối…
-
Sử dụng bộ nhớ đệm kế hoạch chia sẻ cho Amazon Aurora PostgreSQL
Tác giả: Stephen Wood, Jungkook Lee, và Souvik BhattacherjeeNgày phát hành: 20 JAN 2026Chuyên mục: Advanced (300), Amazon Aurora, PostgreSQL compatible, Technical How-to Trong bài viết này, chúng tôi thảo luận về cách tính năng Shared Plan Cache của Amazon Aurora PostgreSQL-Compatible Edition có thể giảm đáng kể mức tiêu thụ bộ nhớ của các…
-
Di chuyển tại chỗ quy mô doanh nghiệp sang Apache Iceberg: Hướng dẫn triển khai
Tác giả: Mihir Borkar, Arghya Banerjee, and Amit MaindolaNgày phát hành: 20 JAN 2026Chuyên mục: Advanced (300), Amazon EMR, Analytics, AWS Glue, Technical How-to Các tổ chức quản lý khối lượng công việc phân tích quy mô lớn ngày càng đối mặt với những thách thức với các data lake truyền thống dựa trên Apache…
-
Bazaarvoice đã hiện đại hóa hạ tầng Apache Kafka của họ với Amazon MSK như thế nào
Tác giả: Oleh Khoruzhenko, Aravind Marthineni, Christian SilvaNgày phát hành: 20 JAN 2026Chuyên mục: Advanced (300), Amazon Managed Streaming for Apache Kafka (Amazon MSK), Customer Solutions Đây là bài đăng của khách mời bởi Oleh Khoruzhenko, Kỹ sư DevOps cấp cao tại Bazaarvoice, hợp tác với AWS. Bazaarvoice là một công ty có trụ sở…
-
Mở khóa kiểm soát tài nguyên chi tiết với QMR dựa trên hàng đợi trong Amazon Redshift Serverless
Tác giả: Srini Ponnada, Davide Pagano, Ashish Agrawal, và Niranjan KulkarniNgày phát hành: 15 JAN 2026Chuyên mục: Amazon Redshift, Announcements, Intermediate (200), Serverless, Technical How-to Amazon Redshift Serverless loại bỏ việc quản lý cơ sở hạ tầng và các yêu cầu mở rộng thủ công khỏi các hoạt động kho dữ liệu. Quản lý tài…