Trình làng vào ngày 10/10, tại sự kiện Advancing AI ở San Francisco, Instinct MI325X là bản kế nhiệm của MI300, nhưng được tăng VRAM lên 256 GB HBM3e thay vì 192 GB HBM3 như "đàn anh". Cách tiếp cận này tương tự H200 của Nvidia từ năm ngoái, khi giữ nguyên khả năng tính toán nhưng tăng dung lượng bộ nhớ và băng thông.
Trong bối cảnh chip AI cần xử lý khối lượng công việc lớn, cách làm của AMD được đánh giá hợp lý, theo The Register. Bộ nhớ càng nhanh và càng nhiều, hiệu suất vận hành càng tốt. AMD đã tạo sự khác biệt với Nvidia bằng cách nhồi nhét nhiều bộ nhớ băng thông cao (HBM) hơn vào chip, phù hợp với các nhà cung cấp đám mây muốn triển khai mô hình với quy mô nghìn tỷ tham số, như GPT-4o của OpenAI, trên ít nút xử lý hơn.
MI325X hiện cung cấp mức tăng băng thông bộ nhớ lên tới 6 TB/giây, không nhiều so với 5,3 TB/giây trên MI300X. Dù vậy, công suất tiêu thụ tăng khá lớn từ 250 lên 1.000 watt. AMD khẳng định trong thử nghiệm thực tế, MI325X sức mạnh cao hơn Nvidia H200 từ 20% đến 40% về hiệu suất suy luận đối với mô hình Llama 3.1 70B (70 tỷ tham số) và 405B (405 tỷ tham số) của Meta.
AMD cho biết Instinct MI325X sẽ được sản xuất hàng loạt trong quý IV/2024, tương thích với hệ thống từ Dell, Eviden, Gigabyte, Hewlett Packard Enterprise, Lenovo, Supermicro, nhưng hiện tại giá sản phẩm vẫn chưa được tiết lộ. Ngoài MI325X, phiên bản MI355X với 288 GB HBM3e sẽ có mặt năm sau.
Theo CNBC, MI325X đang trở thành đối trọng giúp AMD cạnh tranh trực diện hơn với Nvidia. Công ty của Jensen Huang đang thống trị thị trường GPU AI, nhưng nếu AMD được các nhà phát triển và các ông lớn điện toán đám mây chọn thay thế, họ có thể gây áp lực lớn đến Nvidia.
Tại sự kiện ra mắt sản phẩm, AMD đặt mục tiêu giành thị phần từ đối thủ hoặc ít nhất chiếm một phần lớn trong thị trường ước tính trị giá 500 tỷ USD vào 2028.Bà Lisa Su, CEO AMD, cho biết: "Nhu cầu về AI tiếp tục tăng mạnh và thực sự vượt kỳ vọng. Rõ ràng tỷ lệ đầu tư đang tiếp tục tăng trưởng khắp nơi".
Với MI325X, AMD đang tăng tốc lịch trình ra mắt sản phẩm để phát hành chip mới hàng năm nhằm cạnh tranh tốt hơn với Nvidia và tận dụng sự bùng nổ của thị trường. Bà Su cho biết MI300X bắt đầu được giao cuối năm ngoái, còn chip dự kiến ra mắt năm 2025 được gọi là MI350, trong khi chip 2026 có tên MI400.