07/03/2026
Chia Sẻ RAM giữa các server: Cách CXL và OpenCAPI thay đổi cuộc chơi
Ngành công nghiệp đang chờ đợi bộ nhớ tách rời và chia sẻ giữa nhiều máy chủ trở thành tiêu chuẩn. Tuy nhiên, không phải ai cũng muốn đợi đến khi PCI-Express 6.0, 7.0 hay CXL 3.0 hoàn thiện toàn bộ khả năng sharing ở cấp độ rack hoặc cluster. Một hướng tiếp cận thực tế hơn là tận dụng các công nghệ đã sẵn sàng, kết hợp CXL ở phía máy chủ với OpenCAPI ở phía bộ nhớ, liên kết qua hệ thống switching PCI-Express. Mục tiêu là tạo ra thiết bị memory appliance có thể mở rộng đến 16 TB và cho phép nhiều server cùng truy cập.
Bài toán “Stranded Memory” và nhu cầu Disaggregation
Trong trung tâm dữ liệu, bộ nhớ thường bị “mắc kẹt” trong từng máy chủ riêng lẻ. Một số server dư RAM nhưng thiếu CPU, server khác lại thiếu RAM nhưng dư tài nguyên khác. Mô hình truyền thống khiến việc cân bằng tài nguyên trở nên kém hiệu quả.
Disaggregated memory giải quyết vấn đề này bằng cách:
- Tách RAM khỏi server vật lý
- Gom RAM thành một pool tập trung
- Cho phép cấp phát động cho nhiều máy chủ
Để làm được điều đó, cần một interconnect đủ nhanh, đủ ổn định và có khả năng hỗ trợ coherence hoặc ít nhất là truy cập bộ nhớ độ trễ thấp.

Vì sao kết hợp CXL và OpenCAPI?
CXL cung cấp cơ chế mở rộng và quản lý bộ nhớ từ phía CPU x86 qua PCIe. Tuy nhiên, việc triển khai memory sharing quy mô lớn qua CXL 3.0 vẫn cần chờ các thế hệ PCIe mới và hệ sinh thái hoàn thiện.
Trong khi đó, OpenCAPI Memory Interface của IBM mang lại lợi thế lớn về mặt vật lý kết nối. OMI sử dụng giao tiếp tuần tự thay vì song song, giúp:
- Giảm số chân kết nối trên FPGA hoặc ASIC
- Giảm độ phức tạp PCB
- Tăng mật độ module bộ nhớ trên mỗi controller
Nếu dùng giao tiếp song song để kết nối 16 DIMM vào một chip, số tín hiệu có thể lên tới hàng trăm. Điều này đẩy chi phí FPGA lên rất cao. Với OMI, mỗi DIMM được kết nối qua các lane serial tốc độ cao tương tự PCIe, giúp tối ưu phần cứng mà vẫn giữ băng thông.
Kiến trúc tổng thể gồm:
- CXL ở phía server để giao tiếp với CPU
- OpenCAPI OMI ở phía bộ nhớ
- PCI-Express switching fabric làm lớp trung gian
Cách tiếp cận này cho phép vừa mở rộng bộ nhớ, vừa chuẩn bị sẵn nền tảng cho memory sharing.
Các nền tảng phần cứng
M1000 là nền tảng phát triển ban đầu. Hệ thống sử dụng hai CPU AMD Epyc 7313 và 32 khe RAM, hỗ trợ tối đa 8 TB. Máy chủ có thể kết nối tới memory server thông qua InfiniBand hoặc Ethernet RoCE.

M4000 là memory appliance dự kiến đưa kiến trúc ra thị trường. Thiết bị gồm:
- Switch PCIe 4.0 với 100 lane I/O
- Ba controller OMI trên FPGA
- 48 OMI DIMM
- Dung lượng tối đa 12 TB với thanh 256 GB
Thiết bị có ba khe PCIe Gen4 để kết nối bên ngoài và sử dụng giao thức truy cập bộ nhớ riêng hoạt động trên PCIe 4.0, không yêu cầu PCIe 5.0 switching như CXL.
M5000 nâng cấp lên PCIe 5.0 và CXL 2.0. Hệ thống gồm:
- Bốn FPGA triển khai PCIe 5.0 và CXL 2.0
- 64 OMI DIMM
- Dung lượng tối đa 16 TB
- Switch PCIe 5.0 144 lane hoặc có thể 256 lane
Phiên bản này hỗ trợ memory pooling thực thụ và đặt nền móng cho memory sharing giữa nhiều máy chủ.

FPGA hôm nay, ASIC ngày mai
Do hệ sinh thái CXL vẫn đang thay đổi nhanh, việc triển khai bằng FPGA cho phép linh hoạt cập nhật giao thức. Tuy nhiên, để đạt hiệu quả cao hơn và hỗ trợ memory sharing hoàn chỉnh ở quy mô lớn, kiến trúc sẽ chuyển sang ASIC tùy chỉnh khi chuẩn CXL 3.0 và PCIe 6.0 ổn định.
Điểm quan trọng là mô hình này không chờ đợi “phiên bản hoàn hảo” của tương lai. Thay vào đó, nó tận dụng những gì sẵn có để đưa disaggregated memory vào triển khai thực tế sớm hơn.
Ý nghĩa với hạ tầng AI và data center
Với AI, phân tích dữ liệu và workload memory-intensive, việc có thể truy cập pool RAM 12 TB đến 16 TB mà không phải gắn toàn bộ vào một server duy nhất mang lại lợi thế lớn:
- Tăng khả năng tận dụng tài nguyên
- Giảm lãng phí bộ nhớ
- Mở rộng linh hoạt theo nhu cầu
- Giảm chi phí thay thế toàn bộ server khi chỉ thiếu RAM
Kết hợp CXL và OpenCAPI theo cách này cho thấy một hướng đi trung gian nhưng thực dụng, giúp tiến gần hơn đến mô hình bộ nhớ dùng chung quy mô rack mà không cần chờ thế hệ chuẩn tiếp theo hoàn thiện hoàn toàn.



