Chọn XEON hay EPYC cho BIG DATA?

Danh mục sản phẩm

Công nghệ

Review

Hướng dẫn

Tuyển dụng

Tin tức khuyến mại

Tin tức build PC

Game

Sự kiện

Chọn XEON hay EPYC cho BIG DATA?

khanhninh 17-09-2019, 10:49 pm

Apache Spark là con đẻ của việc xử lý Big Data. Tăng tốc các ứng dụng Big Data là dự án ưu tiên hàng đầu tại phòng thí nghiệm của trường đại học Đại học West-Flanders, vì vậy họ đã tạo ra một bài benchmark sử dụng nhiều tính năng của Spark và dựa trên việc sử dụng trong thế giới thực .

Bài kiểm tra được mô tả trong biểu đồ trên. Đầu tiên bài benchmark sẽ bắt đầu với 300 GB dữ liệu nén được thu thập từ Common Crawl. Những tập tin nén này là một số lượng lớn tài liệu lưu trữ web. Nó giải nén dữ liệu một cách nhanh chóng để tránh phải chờ đợi lâu mà chủ yếu liên quan đến lưu trữ.

Sau đó, bài benchmark sẽ trích xuất dữ liệu văn bản có ý nghĩa ra khỏi kho lưu trữ bằng cách sử dụng thư viện Java "Boiler Pipe". Sử dụng Bộ công cụ xử lý ngôn ngữ tự nhiên Stanford Core NLP, chúng tôi trích xuất các thực thể ("từ có nghĩa là gì đó") ra khỏi văn bản và sau đó đếm xem URL nào có sự xuất hiện cao nhất của các thực thể này.

Thuật toán Alternating Least Square sau đó được sử dụng để đề xuất URL nào thú vị nhất cho một chủ đề nhất định. Các máy chủ mới nhất của chúng tôi chia thành các cụm ảo để sử dụng tốt hơn tất cả các lõi đó. Chúng tôi chạy với 8 manager. Nhà nghiên cứu Esli Heyvaert cũng đã nâng cấp bài benchamark Spark để nó có thể chạy trên Apache Spark 2.1.1.

Đây là kết quả:

Bài benchmark Spark của chúng tôi cần khoảng 120 GB RAM để chạy. Thời gian dành cho I/O lưu trữ là không đáng kể. Xử lý dữ liệu rất song song, nhưng các pha xáo trộn đòi hỏi nhiều tương tác bộ nhớ. Pha ALS không mở rộng tốt trên nhiều luồng, nhưng nó ít hơn 4% tổng thời gian thử nghiệm.

Như trên bảng kết quả các bạn có thể thấy vi xử lý Xeon Platinum 8280 mới nhất có hiệu năng xử lý Big Data rất tốt, tốt hơn một chút so với thế hệ trước đó 8176 và mạnh hơn rất nhiều so với thế hệ cũ Xeon E5 2699 v4.

Còn khi so sáng với vi xử lý Epyc 7601 mới nhất của AMD thì 8280 vẫn mạnh hơn đáng kể, mặc dù số lượng nhân xử lý của nó là ít hơn. Thế nên khi các bạn đang quan tâm đến các hệ thống server cho Big Data thì hãy quan tâm đến vẫn đề này.

Bài viết liên quan

Hướng Dẫn Cách Gỡ Và Cách Khắc Phục Windows 11 Nhanh Chóng

Hướng Dẫn Cách Gỡ Và Cách Khắc Phục Windows 11 Nhanh Chóng

17-07-2021, 8:08 am

Theo dõi hướng dẫn chi tiết cách gỡ cài đặt Windows 11 và cách khắc phục các sự cố phổ biến một cách nhanh chóng và hiệu quả tại trang web Nguyễn Công PC.

Hướng dẫn cài đặt win 11 trên máy ảo VMware Workstation

Hướng dẫn cài đặt win 11 trên máy ảo VMware Workstation

08-07-2021, 7:26 am

Nếu bạn muốn dùng thử Windows 11 trên PC nhưng không muốn mạo hiểm thay thế phiên bản Windows 10 ổn định bằng hệ điều hành beta mới có thể có lỗi, bạn có thể sử dụng máy ảo VMware Workstation

Cách tối ưu hóa GPU để khai thác Ethereum

Cách tối ưu hóa GPU để khai thác Ethereum

15-05-2021, 3:37 am

Trước khi bắt đầu các bạn cần chú ý rằng mỗi loại card sẽ cho ra một hiệu năng đào khác nhau, ngay cả với những con card cũng đời cùng mã cùng nhà sản xuất

Hướng dẫn cài đặt RAM kênh đôi DDR4 trên bo mạch chủ 4 khe RAM

Hướng dẫn cài đặt RAM kênh đôi DDR4 trên bo mạch chủ 4 khe RAM

27-04-2021, 9:52 am

Sau đây Nguyencongpc sẽ hướng dẫn các bạn cách tự cài đặt bộ nhớ (RAM) DDR4 lên trên bo mạch chủ kênh đôi có 4 khe cắm thông dụng nhất hiện nay.

Cách tháo, lắp tản Stock Intel

Cách tháo, lắp tản Stock Intel

27-04-2021, 3:45 am

Hướng dẫn này áp dụng cho tất cả các giải pháp nhiệt đi kèm với bộ xử lý Intel, bao gồm các loại Socket LGA1150, LGA1151, LGA1155, LGA1156 và LGA1200.

10 Lý do tại sao bạn nên mua bàn phím cơ để làm việc

10 Lý do tại sao bạn nên mua bàn phím cơ để làm việc

12-10-2019, 11:04 am

Sự thật là bàn phím không có gì khác biệt so với những công cụ mà bạn nên đầu tư, bởi nếu một ngày bạn làm việc từ 8 giờ trở lên hoặc chơi game mà bàn phím máy tính của bạn bị chậm hoặc hay bị lỗi thì quả thật bạn sẽ cảm thất rất khó chịu.

Cổng kết nối màn hình là gì? Người dùng nên chọn cổng HDMI, DisplayPort và DVI?

Cổng kết nối màn hình là gì? Người dùng nên chọn cổng HDMI, DisplayPort và DVI?

16-07-2019, 2:40 am

Cổng kết nối màn hình là cầu nối truyền tín hiệu hình ảnh và âm thanh giữa máy tính và màn hình. Hiện nay, ba chuẩn phổ biến nhất là HDMI, DisplayPort và DVI, mỗi loại có ưu điểm riêng về chất lượng và khả năng truyền tải. Việc lựa chọn đúng cổng kết nối sẽ giúp tối ưu hiệu năng và trải nghiệm hiển thị của người dùng.

Người dùng nên lựa chọn VGA nào phù hợp nhất cho nhu cầu sử dụng?

Người dùng nên lựa chọn VGA nào phù hợp nhất cho nhu cầu sử dụng?

12-07-2019, 2:05 am

Card đồ họa (VGA) đóng vai trò quan trọng trong hiệu năng của máy tính, đặc biệt với người dùng chơi game, làm đồ họa hay dựng phim. Việc chọn đúng VGA giúp tối ưu hiệu suất và tiết kiệm chi phí đầu tư. Nguyễn Công PC sẽ giúp bạn xác định đâu là VGA phù hợp nhất cho từng nhu cầu cụ thể.

Chọn nguồn thích hợp cho card đồ họa: Tối ưu hiệu năng, tiết kiệm chi phí

Chọn nguồn thích hợp cho card đồ họa: Tối ưu hiệu năng, tiết kiệm chi phí

01-07-2019, 7:14 pm

Trong bài viết này Nguyễn Công PC sẽ hướng dẫn bạn cách bạn có thể chọn một bộ nguồn thích hợp cho card đồ họa của bạn.

7 lý do quạt VGA không quay và tìm hiểu cách khắc phục triệt để

7 lý do quạt VGA không quay và tìm hiểu cách khắc phục triệt để

27-06-2019, 8:48 pm

Quạt GPU không quay là một trong những vấn đề rất nghiêm trọng mà một số người dùng card đồ họa gặp phải. Quạt GPU được sử dụng để làm mát tản nhiệt của card đồ họa và ngăn không cho nó quá nóng. Gần như tất cả các card đồ họa hiện nay đều đi kèm với tản nhiệt và quạt để làm mát.

CPU và những điều bạn cần phải biết trước khi build PC

CPU và những điều bạn cần phải biết trước khi build PC

10-05-2019, 1:05 am

Hướng dẫn Render Farm với Corona trong 3Ds Max

Hướng dẫn Render Farm với Corona trong 3Ds Max

27-04-2019, 3:48 am

mes
Chat Facebook(8h-22h30)
mes
Chat Zalo(8h-22h30)
Tặng màn hình

Thêm sản phẩm vào giỏ hàng thành công!