Chia Sẻ RAM giữa các server: Cách CXL và OpenCAPI thay đổi cuộc chơi

07/03/2026

Chia Sẻ RAM giữa các server: Cách CXL và OpenCAPI thay đổi cuộc chơi

Ngành công nghiệp đang chờ đợi bộ nhớ tách rời và chia sẻ giữa nhiều máy chủ trở thành tiêu chuẩn. Tuy nhiên, không phải ai cũng muốn đợi đến khi PCI-Express 6.0, 7.0 hay CXL 3.0 hoàn thiện toàn bộ khả năng sharing ở cấp độ rack hoặc cluster. Một hướng tiếp cận thực tế hơn là tận dụng các công nghệ đã sẵn sàng, kết hợp CXL ở phía máy chủ với OpenCAPI ở phía bộ nhớ, liên kết qua hệ thống switching PCI-Express. Mục tiêu là tạo ra thiết bị memory appliance có thể mở rộng đến 16 TB và cho phép nhiều server cùng truy cập.

Bài toán “Stranded Memory” và nhu cầu Disaggregation

Trong trung tâm dữ liệu, bộ nhớ thường bị “mắc kẹt” trong từng máy chủ riêng lẻ. Một số server dư RAM nhưng thiếu CPU, server khác lại thiếu RAM nhưng dư tài nguyên khác. Mô hình truyền thống khiến việc cân bằng tài nguyên trở nên kém hiệu quả.

Disaggregated memory giải quyết vấn đề này bằng cách:

Tách RAM khỏi server vật lý
Gom RAM thành một pool tập trung
Cho phép cấp phát động cho nhiều máy chủ

Để làm được điều đó, cần một interconnect đủ nhanh, đủ ổn định và có khả năng hỗ trợ coherence hoặc ít nhất là truy cập bộ nhớ độ trễ thấp.

Vì sao kết hợp CXL và OpenCAPI?

CXL cung cấp cơ chế mở rộng và quản lý bộ nhớ từ phía CPU x86 qua PCIe. Tuy nhiên, việc triển khai memory sharing quy mô lớn qua CXL 3.0 vẫn cần chờ các thế hệ PCIe mới và hệ sinh thái hoàn thiện.

Trong khi đó, OpenCAPI Memory Interface của IBM mang lại lợi thế lớn về mặt vật lý kết nối. OMI sử dụng giao tiếp tuần tự thay vì song song, giúp:

Giảm số chân kết nối trên FPGA hoặc ASIC
Giảm độ phức tạp PCB
Tăng mật độ module bộ nhớ trên mỗi controller

Nếu dùng giao tiếp song song để kết nối 16 DIMM vào một chip, số tín hiệu có thể lên tới hàng trăm. Điều này đẩy chi phí FPGA lên rất cao. Với OMI, mỗi DIMM được kết nối qua các lane serial tốc độ cao tương tự PCIe, giúp tối ưu phần cứng mà vẫn giữ băng thông.

Kiến trúc tổng thể gồm:

CXL ở phía server để giao tiếp với CPU
OpenCAPI OMI ở phía bộ nhớ
PCI-Express switching fabric làm lớp trung gian

Cách tiếp cận này cho phép vừa mở rộng bộ nhớ, vừa chuẩn bị sẵn nền tảng cho memory sharing.

Các nền tảng phần cứng

M1000 là nền tảng phát triển ban đầu. Hệ thống sử dụng hai CPU AMD Epyc 7313 và 32 khe RAM, hỗ trợ tối đa 8 TB. Máy chủ có thể kết nối tới memory server thông qua InfiniBand hoặc Ethernet RoCE.

M4000 là memory appliance dự kiến đưa kiến trúc ra thị trường. Thiết bị gồm:

Switch PCIe 4.0 với 100 lane I/O
Ba controller OMI trên FPGA
48 OMI DIMM
Dung lượng tối đa 12 TB với thanh 256 GB

Thiết bị có ba khe PCIe Gen4 để kết nối bên ngoài và sử dụng giao thức truy cập bộ nhớ riêng hoạt động trên PCIe 4.0, không yêu cầu PCIe 5.0 switching như CXL.

M5000 nâng cấp lên PCIe 5.0 và CXL 2.0. Hệ thống gồm:

Bốn FPGA triển khai PCIe 5.0 và CXL 2.0
64 OMI DIMM
Dung lượng tối đa 16 TB
Switch PCIe 5.0 144 lane hoặc có thể 256 lane

Phiên bản này hỗ trợ memory pooling thực thụ và đặt nền móng cho memory sharing giữa nhiều máy chủ.

FPGA hôm nay, ASIC ngày mai

Do hệ sinh thái CXL vẫn đang thay đổi nhanh, việc triển khai bằng FPGA cho phép linh hoạt cập nhật giao thức. Tuy nhiên, để đạt hiệu quả cao hơn và hỗ trợ memory sharing hoàn chỉnh ở quy mô lớn, kiến trúc sẽ chuyển sang ASIC tùy chỉnh khi chuẩn CXL 3.0 và PCIe 6.0 ổn định.

Điểm quan trọng là mô hình này không chờ đợi “phiên bản hoàn hảo” của tương lai. Thay vào đó, nó tận dụng những gì sẵn có để đưa disaggregated memory vào triển khai thực tế sớm hơn.

Ý nghĩa với hạ tầng AI và data center

Với AI, phân tích dữ liệu và workload memory-intensive, việc có thể truy cập pool RAM 12 TB đến 16 TB mà không phải gắn toàn bộ vào một server duy nhất mang lại lợi thế lớn:

Tăng khả năng tận dụng tài nguyên
Giảm lãng phí bộ nhớ
Mở rộng linh hoạt theo nhu cầu
Giảm chi phí thay thế toàn bộ server khi chỉ thiếu RAM

Kết hợp CXL và OpenCAPI theo cách này cho thấy một hướng đi trung gian nhưng thực dụng, giúp tiến gần hơn đến mô hình bộ nhớ dùng chung quy mô rack mà không cần chờ thế hệ chuẩn tiếp theo hoàn thiện hoàn toàn.

Bài viết liên quan

12/02/2026

Chia Sẻ RAM giữa các server: Cách CXL và OpenCAPI thay đổi cuộc chơi

Bài viết liên quan

TORmem AI Edge Systems: Hiệu năng Inference cấp doanh nghiệp không cần hạ tầng quá mức

FusionPoD cho AI – Máy chủ làm mát bằng chất lỏng ở quy mô rack

Giải pháp làm mát bằng chất lỏng trực tiếp GIGABYTE (GIGABYTE Direct Liquid Cooling Solution)

Vì sao hạ tầng compute/GPU/storage truyền thống ngày càng “đốt tiền” và cách giải bài toán bộ nhớ

CÔNG TY TNHH UCV

Thông tin cần biết