Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Google tuyên bố AI của họ đánh bại GPT-4 trong hầu hết các thử nghiệm, trong khi Microsoft cho biết GPT-4 tốt hơn, với những lời nhắc phù hợp.
Tuần trước, Google đã ra mắt AI mới, hay đúng hơn là mô hình ngôn ngữ lớn mới, được đặt tên là Gemini . Mô hình Gemini 1.0 có sẵn trong ba phiên bản: Gemini Nano được cho là phù hợp nhất cho các tác vụ trên một thiết bị cụ thể, Gemini Pro được cho là lựa chọn tốt nhất cho nhiều tác vụ hơn và Gemini Ultra là mô hình ngôn ngữ lớn nhất của Google. sẽ xử lý những nhiệm vụ phức tạp nhất mà bạn có thể giao cho nó.
>> Xem ngay: Mainboard WRX90 tăng tốc CPU AMD Threadripper PRO 7985WX lên 94% so với 7980X
Điều mà Google muốn nhấn mạnh khi ra mắt Gemini Ultra là mô hình ngôn ngữ này đã vượt trội hơn phiên bản mới nhất của GPT-4 của OpenAI ở 30 trong số 32 bài kiểm tra được sử dụng phổ biến nhất để đo lường khả năng của các mô hình ngôn ngữ. Các bài kiểm tra bao gồm mọi thứ, từ đọc hiểu và các câu hỏi toán học khác nhau đến viết mã cho Python và phân tích hình ảnh. Trong một số thử nghiệm, sự khác biệt giữa hai mô hình AI chỉ là vài phần mười điểm phần trăm, trong khi ở những thử nghiệm khác, con số này lên tới 10 điểm phần trăm.
Tuy nhiên, có lẽ thành tích ấn tượng nhất của Gemini Ultra là mô hình ngôn ngữ đầu tiên đánh bại các chuyên gia về con người trong các bài kiểm tra hiểu ngôn ngữ đa nhiệm (MMLU) quy mô lớn, trong đó Gemini Ultra và các chuyên gia phải đối mặt với các nhiệm vụ giải quyết vấn đề trong 57 lĩnh vực khác nhau, từ toán học và vật lý đến y học, luật và đạo đức. Gemini Ultra đã đạt được số điểm 90,0%, trong khi chuyên gia về con người mà nó được so sánh với “chỉ” đạt được 89,8%.
Sự ra mắt của Gemini sẽ diễn ra dần dần. Tuần trước, Gemini Pro đã ra mắt công chúng khi chatbot Bard của Google bắt đầu sử dụng phiên bản sửa đổi của mô hình ngôn ngữ và Gemini Nano được tích hợp vào một số chức năng khác nhau trên điện thoại thông minh Pixel 8 Pro của Google. Gemini Ultra vẫn chưa sẵn sàng ra mắt công chúng. Google cho biết họ vẫn đang trong quá trình thử nghiệm bảo mật và chỉ được chia sẻ với một số nhà phát triển và đối tác cũng như các chuyên gia về trách nhiệm pháp lý và bảo mật AI. Tuy nhiên, ý tưởng là cung cấp Gemini Ultra cho công chúng thông qua Bard Advanced khi nó ra mắt vào đầu năm tới.
Microsoft hiện đã phản bác lại tuyên bố của Google rằng Gemini Ultra có thể đánh bại GPT-4 bằng cách cho GPT-4 chạy lại các bài kiểm tra tương tự, nhưng lần này với các lời nhắc hoặc đầu vào được sửa đổi một chút. Các nhà nghiên cứu của Microsoft đã công bố nghiên cứu vào tháng 11 về thứ mà họ gọi là Medprompt , một sự kết hợp của nhiều chiến lược khác nhau để đưa lời nhắc vào mô hình ngôn ngữ nhằm đạt được kết quả tốt hơn. Bạn có thể nhận thấy câu trả lời bạn nhận được từ ChatGPT hoặc hình ảnh bạn nhận được từ trình tạo hình ảnh của Bing hơi khác một chút khi bạn thay đổi cách diễn đạt một chút. Khái niệm đó, nhưng cao cấp hơn nhiều, là ý tưởng đằng sau Medprompt.
Bằng cách sử dụng Medprompt, Microsoft đã cố gắng làm cho GPT-4 hoạt động tốt hơn Gemini Ultra trong một số trong số 30 bài kiểm tra mà Google đã nêu bật trước đó, bao gồm cả bài kiểm tra MMLU, trong đó GPT-4 với đầu vào Medprompt đã đạt được số điểm 90,10%. Mô hình ngôn ngữ nào sẽ thống trị trong tương lai vẫn còn phải xem. Cuộc chiến giành ngai vàng AI còn lâu mới kết thúc.
>> Xem thêm các bài viết liên quan:
Rò rỉ thông tin Intel Core i3-14100 sẽ ra mắt vào ngày 8/1/2024
Card màn hình GeForce RTX 4090 do Redditor thiết kế với ba quạt Noctua
Bài viết liên quan
04-11-2024, 10:21 am
Trong bài viết này, mình sẽ phân tích về thông số kỹ thuật và hiệu suất của cả Core Ultra 5 245K và Ryzen 5 9600X để giúp bạn có cái nhìn rõ ràng hơn cũng như có thể đưa ra được quyết định chọn lựa phù hợp nhất nhé!
23-10-2024, 11:31 am
Trong bài viết này, Nguyễn Công PC sẽ đánh giá chi tiết về CPU Intel Core Ultra 5 245K, để xem nó có thể kế thừa được những gì mà Core i5-13600K hay 14600K để lại hay không nhé!
23-10-2024, 8:59 am
Intel Core Ultra 7 265K là một trong những bộ vi xử lý mạnh mẽ nhất thuộc dòng sản phẩm Arrow Lake-S mới của Intel, được thiết kế cho các hệ thống máy tính để bàn, hướng tới những người dùng cần hiệu suất cao. Dưới đây là đánh giá chi tiết của Nguyễn Công PC về hiệu suất của vi xử lý Intel Core Ultra 7 265K.
22-10-2024, 4:52 pm
Bài viết này của Nguyễn Công PC sẽ cung cấp cái nhìn tổng quan nhất tới bạn về Intel Core Ultra 9 285K, trong đó bao gồm thông số kỹ thuật, các tính năng nổi bật và đánh giá hiệu năng thực tế, giúp bạn dễ dàng cân nhắc liệu sản phẩm này có đáng để đầu tư hay không.
19-09-2024, 2:30 pm
Trong bài viết này, Nguyễn Công PC sẽ giới thiệu đến bạn TOP 8 ổ cứng SSD 1TB chính hãng giá tốt, đáp ứng nhu cầu sử dụng đa dạng từ cá nhân đến doanh nghiệp, giúp bạn dễ dàng lựa chọn sản phẩm phù hợp nhất.
15-08-2024, 3:09 pm
Trong bài viết này, Nguyễn Công PC sẽ tiến hành thử nghiệm mẫu CPU AMD Ryzen 5 9600X. Hãy cùng xem chúng sẽ mang đến những trải nghiệm như thế nào cho người dùng nhé!
14-12-2023, 9:57 am
Quyết định của NVIDIA đưa Shengyi Technology vào danh sách các nhà cung cấp của mình có thể tỏ ra khá có lợi cho công ty Trung Quốc, vì không chỉ nhu cầu về CCL đang ở mức cao nhất...
14-12-2023, 9:25 am
Nhiều card đồ họa GeForce RTX 4090 có thể vẫn được bảo hành. Tuy nhiên, việc thay thế bộ làm mát có thể gây ra nguy cơ làm mất hiệu lực hỗ trợ của nhà sản xuất trong trường hợp có sự cố.
12-12-2023, 10:18 am
Hầu hết các bài đánh giá về tản nhiệt khí trước đây của tôi đều sử dụng vỏ máy tính để bàn truyền thống, nhưng với bài đánh giá ngày hôm nay,...
09-12-2023, 1:46 pm
Với 1.4 tỉ dân, Trung Quốc là thị trường hết sức màu mỡ cho bất kỳ công ty nào. Bởi vậy nên khi NVIDIA bỏ bớt card RTX 4090 ra khỏi danh sách sản phẩm bán tại đây,...
08-12-2023, 4:43 pm
Được thấy trong nhánh sản xuất gần đây nhất của trình điều khiển NVIDIA RTX Enterprise, GPU máy trạm RTX 5880 ADA mới được giới thiệu phục vụ một mục đích duy nhất điều hướng...
08-12-2023, 9:13 am
V-Color cung cấp bộ nhớ DDR5 R-DIMM với tốc độ lên tới 7200 MT/s cho nền tảng CPU AMD Ryzen Threadripper 7000. Công ty đã thể hiện một số kỷ lục ấn tượng kể từ khi bo mạch chủ TRX50 mới được giới thiệu bằng cách đẩy các mô-đun lên DDR5-7200.
Khách cá nhân
Khách doanh nghiệp