Hỗ Trợ
Hỗ trợ trực tuyến
Tin Tức
So Sánh Cache L2, Cache L3 Intel Skylake & Intel Broadwell
Cập nhật: 6/8/2018
Trong phần này, chúng ta sẽ đi sâu hơn một chút vào các tính năng kiến trúc vi mô của bộ xử lý Intel Xeon Scalable mới. Chúng tôi đang thực hiện đánh giá tổng thể về Intel Xeon Scalable từ cấp độ nền tảng, chipset, kết nối mạng lưới, benchmarks, vendor launches, và SKU stacks. Vì các bộ vi xử lý mới có tên khá dài, nên chúng tôi sử dụng tên mã chính thức của Skylake-SP trong bài viết này

So Sánh Cache L2, Cache L3 Intel Skylake & Intel Broadwell

 

So Sánh Cache L2, Cache L3 Intel Skylake & Intel Broadwell

1. Bắt đầu với một lõi Skylake

Chúng tôi bắt đầu thảo luận về kiến trúc vi mô với lõi Skylake-SP cơ bản. Điều đáng ngạc nhiên là một số độc giả có thể nhận ra đây là lõi Skylake cơ bản đã được Intel sử dụng trong nhiều năm. Và sau đó mở rộng thêm bộ nhớ L2 và tăng thêm FMA trong AVX (vector nâng cao)

Intel Skylake-SP Core

Không phải tất cả các chip xử lý sẽ có đơn vị FMA thứ hai. Đó là một phần khác của sự khác biệt giữa các tầng bộ xử lý khác nhau.

Đây là slide mô tả một số cải tiến về kiến trúc vi mô kỹ thuật hơn Broadwell-EP.

Intel Skylake SP Microarchitecture Changes

Intel hy vọng cải thiện hiệu năng IPC tăng 10% so với lõi Intel Xeon E5-2600 V4 (Broadwell-EP) Các thông số kỹ thuật sau của chúng tôi sẽ cho thấy rằng ở cùng tốc độ đó, chúng tôi nhận thấy hiệu năng > 30% so với Intel Xeon E5-2600 V1 (Sandy Bridge-EP)

Đó là một số liệu quan trọng vì hai lý do. Đầu tiên, các máy chủ Intel Xeon E5-2600 V1 là những máy đã đạt tới chu kỳ làm mới 5 năm với thế hệ Gia Đình Intel Xeon. Thứ hai, cải thiện 30% + IPC được kết hợp với số lượng Core tối đa tăng từ 8 đến 28 Core. Đây là lúc thích hợp để diễn ra chu kỳ thay thế ở quy mô rất lớn. Trên cùng một nguyên tắc chung là ở cùng một tốc độ đo, 3 chip Skylake-SP sẽ thực hiện công việc bằng bốn 4 Intel Xeon E5-2600 V1.

2. Kiến trúc Intel Skylake SP Microarchitecture Thay đổi khái niệm Cache L2 và L3.

Intel đã thực hiện thay đổi để tăng số lượng Low Latency mà nó có sẵn cho mỗi lõi. Phần server được tăng cường 768KB Cache L2 cho tổng số 1MB Cache L2 so với trước đây chỉ là 256M Cache.

Intel Skylake SP Microarchitecture Major L2 And L3 Cache Changes

Đồng thời, Intel đã giảm bộ nhớ cache L3 gần một nửa từ 2,5MB (lõi trong Broadwell-EP) xuống còn 1,375M(lõi trong Skylake-SP). Sự thay đổi đó giúp Intel giảm ngân sách bán dẫn để tăng kích thước bộ nhớ Cache L2 và cốt lõi đếm tất cả trên một quy trình 14nm.
Vậy lý do tại sao Intel sẽ thực hiện thay đổi độ trễ bộ nhớ cache ??? đơn giản là vì bộ nhớ Cache L2 có tốc độ nhanh hơn bộ đệm L3 từ 3,5-4 lần. Khi số lượng lõi tăng lên, độ trễ bộ nhớ Cache L3 tăng lên do đó Intel cần di chuyển nhiều dữ liệu CPU hơn. Nên việc thay đổi kiến trúc này làm giảm tải hoàn toàn cho bộ đệm Cache L3, Đây củng tạo nên sự thay đổi khi so sánh thông số Cache không giống như trước đây.

Intel Skylake SP Microarchitecture L2 L3 Cache LatencyMột phương pháp mà Intel đang sử dụng là làm cho bộ nhớ Cache L3 giảm tải là đây. Đây là slide của Intel mô tả sự khác biệt về quy trình vận hành:

Intel Skylake SP Microarchitecture L3 Cache Inclusive V Non Inclusive

Chìa khóa ở đây là thay vì dữ liệu được sao chép cả vào cache L2 và L3, dữ liệu có thể được tải trực tiếp vào bộ đệm L2. Nếu bạn là một chuyên gia về storage quen với việc sắp xếp lưu trữ bạn có thể hình dung điều này tương tự như việc có thể tải dữ liệu trực tiếp lên cấp NVMe và sau đó xủ lý và đẩy thẳng dữ liệu ra. Không giống như SSD SATA/ SAS hoặc HDD cần thay phải sao chép nó vào cả hai tầng trước khi sử dụng nó.

Để được rõ ràng, tổng kích thước bộ nhớ cache đi xuống với thiết kế này. L2 + L3 trên Broadwell-EP là 2,75MB trong khi trên Skylake-SP là 2,375MB. Bộ nhớ cache Broadwell-EP L3 có một bản sao của dữ liệu bộ nhớ cache L2 vì vậy ta có tổng bộ nhớ cache L3 là 2,5MB. Cách tính cache trước đây là số core nhân với tổng nhớ cache VD: CPU E5 2620v4 có 8 core x 2,5Mb = 20M Cache. Nhưng với kiến trúc mới này việc so sánh Cache giữa 2 dòng mới và cũ là không thể vì 2 kiến trúc Xeon trên 2 nền tảng công nghệ khác nhau. 

Intel không bao giờ cho chúng ta cái nhìn này, nhưng thông qua một bài trình bày dài, nhưng bản phác thảo cực kỳ thô sơ về lý do tại sao công trình này trông giống như thế này:

Intel Skylake SP V Broadwell SP Average Cache Latency Cumulative Capacity

Intel Skylake SP V Broadwell SP Dung lượng tích lũy Cache trễ trung bình của Intel

Hiệu quả vì mỗi lõi có thể nhận được bộ nhớ Cache L2 độ trễ thấp hơn, nó có thể nhận được lợi ích lớn ở mức dung lượng giữa 256KB và 1MB trong khi từ bỏ tương đối ít từ 0-256KB và 1MB đến 2,375MB. 128KB cuối cùng là đồng bằng còn lại trong các kích thước bộ nhớ cache hiệu quả.

Đó là một sơ đồ rất thô sơ để minh họa cho sự cân bằng. Yếu tố khác rõ ràng là bộ nhớ cache L3 được chia sẻ có nghĩa là dữ liệu độ trễ cao hơn trong bộ nhớ cache L3 của Broadwell-EP có sẵn cho các lõi khác. Với Skylake-SP, không có nhiều dữ liệu cache L3 được chia sẻ trên chip này.

Trong thực tế, điều này có nghĩa là kết hợp với các cải tiến lưới Skylake-SP, phần lớn thời gian Skylake-SP nhanh hơn,  nhưng vẫn có khi Broadwell-EP nhanh hơn. Dưới đây là dữ liệu của Intel sử dụng các thành phần SPECint_rate 2006.

Kiến trúc Intel Skylake SP L3 Cache Inclusive V Không bao gồm SPECint

Intel Skylake SP Microarchitecture L3 Cache Inclusive V Non Inclusive SPECint

Intel Skylake SP Microarchitecture L3 Cache Inclusive V Non Inclusive SPECint


Đây là phiên bản SPECfp_rate 2006 của biểu đồ đó:

Kiến trúc Intel Skylake SP L3 Cache Inclusive V Không bao gồm SPECfp

Intel Skylake SP Microarchitecture L3 Cache Inclusive V Non Inclusive SPECfp

Intel Skylake SP Microarchitecture L3 Cache Inclusive V Non Inclusive SPECfp

Về cơ bản những gì dữ liệu này cho chúng ta biết là đối với khối lượng công việc SPECint và SPECfp, có bộ nhớ cache L2 lớn hơn có nghĩa là xác suất truy cập bộ nhớ cache độ trễ thấp tăng lên. Nó cũng cho chúng ta thấy rằng đối với những khối lượng công việc này Cache L3 lớn hơn hay nhỏ hơn trong kiến trúc mới Skylake-SP củng không ảnh hưởng nhiều.

Tài liệu tham khảo: Xem tại đây.

 Tại TP. Hồ Chí Minh
596/14 Trường Chinh, Phường 13, Quận Tân Bình, Tp.HCM
 Tại Hà Nội
Tầng 6, phòng 604, tòa nhà Bảo Hân, số 66, ngõ 34, Hoàng Cầu, quận Đống Đa, Hà Nội