Quảng Cáo
0943778078
Meta đang tăng cường nỗ lực phát triển chip AI tùy chỉnh (ASIC) của riêng mình, tập trung vào hiệu suất suy luận. Nhu cầu điện toán khổng lồ đã buộc các nhà cung cấp dịch vụ siêu quy mô (hyperscaler) phải tìm kiếm các giải pháp thay thế cho GPU truyền thống từ các nhà sản xuất như NVIDIA. Google và Amazon là những ví dụ điển hình về thành công của việc phát triển chip ASIC tối ưu hóa cho khối lượng công việc nội bộ, và Meta đang đi theo con đường tương tự.
Trong một bài đăng blog gần đây, Meta tiết lộ lộ trình MTIA của họ đang đi đúng hướng với tốc độ phát triển cực kỳ nhanh chóng. Công ty dự định triển khai bốn thế hệ chip mới thuộc dòng MTIA trong vòng hai năm tới, mỗi loại nhắm mục tiêu vào một khối lượng công việc cụ thể, từ huấn luyện đến suy luận GenAI.
Bắt đầu với MTIA 300, chip này chủ yếu được thiết kế cho các tác vụ xếp hạng và đề xuất, với mạng lưới mở rộng quy mô đạt 200 GB/s. Chip MTIA 300 bao gồm một chiplet điện toán và hai chiplet mạng, cùng với nhiều ngăn xếp HBM với dung lượng 216 GB và băng thông 6,12 TB/s. Meta cho biết MTIA 300 đã đặt nền móng cho MTIA 400 tiên tiến hơn, có khả năng cạnh tranh cao hơn.
MTIA 400 mang lại hiệu suất FP8 FLOPS cao hơn 400% và băng thông HBM cao hơn 51% so với thế hệ trước, với trọng tâm là hiệu suất thô. Chip này có cấu hình mở rộng quy mô 72 chip được kết nối thông qua một mặt phẳng chuyển mạch. Thế hệ chip này đang được triển khai, cho thấy Meta hài lòng với hiệu suất cạnh tranh của nó. Các tùy chọn thú vị hơn là MTIA 450 và MTIA 500, được thiết kế trực tiếp cho nhu cầu suy luận bằng cách tập trung vào dung lượng và băng thông HBM.
Meta cho biết họ có kế hoạch cạnh tranh với các giải pháp thương mại bằng cách duy trì chu kỳ sản phẩm nhanh chóng để theo kịp nhu cầu điện toán đang thay đổi. Chu kỳ nhanh này có thể thực hiện được nhờ khả năng mô-đun chiplet của Meta, cho phép họ hoán đổi các chiplet riêng lẻ giữa các thế hệ mà không cần phải cải tổ toàn bộ cơ sở hạ tầng. Với MTIA 450 và 500, Meta đang áp dụng cách tiếp cận ưu tiên suy luận để tạo sự khác biệt so với các GPU tiêu chuẩn.
Mặc dù thỏa thuận gần đây của Meta với NVIDIA và các báo cáo khác có thể gợi ý rằng công ty có thể từ bỏ nỗ lực chip tùy chỉnh, nhưng Meta dường như tự tin vào khả năng kỹ thuật của mình. Công ty đã áp dụng một chiến lược khá mạnh mẽ, với tất cả các thế hệ chip MTIA đã thảo luận sẽ được triển khai vào năm 2026, giúp Meta vượt qua nút thắt cổ chai về điện toán.
