انویدیا اخیرا در یک رویداد مطبوعاتی تواناییهای GPUهای مصرفی RTX خودش رو نشون داد. این شرکت به این نکته اشاره کرد که GPUهاش نسبت به PCهای مجهز به NPU معمولی در انجام وظایف هوش مصنوعی بهتر عمل میکنن. همچنین چندین معیار (بنچمارک) ارائه داد که نشون میده GPUهای نویدیا در مقایسه با نوتبوکهای رقیب که از شتابدهندههای سختافزاری هوش مصنوعی استفاده میکنن، مانند مکبوک پرو با تراشه M3 Max از اپل، عملکرد بهتری دارن. ادامه این خبر رو با توییک فا همراه باشید.
انویدیا اعلام کرده که GPUهاش قابلیتهای AI بسیار بهتری نسبت به NPUهای امروزی دارن.
کل این رویداد درمورد این بود که چطور GPUهای RTX نویدیا از PCهای “AI” مدرن که با NPU تجهیز شدهاند، بهتر عمل میکنن. انویدیا گفت که عملکرد ۱۰ تا ۴۵ TOPS که در پردازندههای مدرن اینتل، AMD، اپل و کوالکام یافت میشه، فقط برای کارهای “پایهای” AI کافیه. شرکت چندین مثال زد، از جمله ویرایش عکس، تولید تصویر، ارتقای کیفیت تصویر و کمک به کدنویسی از طریق AI، که گفته میشه PCهای مجهز به NPU یا نمیتونن انجام بدن یا فقط در سطح پایهای قادر به انجامشون هستن. از طرف دیگه، GPUهای نویدیا میتونن تمام کارهای AI رو انجام بدن و با عملکرد یا کیفیت بهتری اجرا کنن، اونم بهطور طبیعی.
انویدیا اعلام کرد که GPUهای RTX آن بسیار کارآمدتر از NPUها هستن و میتونن بسته به مدل GPU عملکردی بین ۱۰۰ تا بیش از ۱۳۰۰+ TOPS داشته باشن! این رویداد انویدیا تا جایی پیش رفت که GPUهای RTX را در دسته “تجهیزات AI پیشرفته” قرار داد، در حالی که NPUها را در دسته “تجهیزات AI پایهای” طبقهبندی کرد. (انویدیا همچنین یک دسته دیگه هم اضافه کرد، محاسبات ابری، که اون رو در دسته “تجهیزات AI سنگین” با هزاران TOPS عملکرد قرار داده، که قطعاً اشارهای به GPUهای شرکتی H100 و B200 Blackwell خودشه.)
مقایسه 4090 و 4050 لپ تاپ انویدیا با M3 Max
انویدیا چندین بنچمارک با تمرکز روی AI نشون داد که در اونها GPUهای جدید سری RTX 40 رو با رقبا مقایسه کرده بود. برای خلق محتوا، انویدیا یک بنچمارک نشون داد که در اون RTX 4090 لپتاپ، RTX 4050 لپتاپ و مکبوک پرو اپل M3 Max رو در چندین برنامه خلق محتوایی که از AI استفاده میکنن مقایسه کرده بود. برنامههایی مثل Stable Diffusion, Arnold, Blender, Chaos V-ray, Octane, Adobe Premier Pro Enhance Speech, DaVinci Resolve و ON1 Resize AI. بنچمارک نشون داد که RTX 4090 لپتاپ تو بعضی موارد تا بیش از ۷ برابر از مکبوک پرو مجهز به M3 Max سریعتر بوده و RTX 4050 لپتاپ هم تا بیش از ۲ برابر از همون مکبوک پرو بهتر عمل کرده. بهطور میانگین، RTX 4090 موبایل ۵ برابر و RTX 4050 LT بین ۵۰ تا ۱۰۰ درصد بهتر از M3 Max عمل کرده.
یک بنچمارک دیگه که انویدیا نشون داد، شامل مدلهای زبان بزرگ (LLMs) بود و از بار کاری Llama 2 7B int4 LLM استفاده میکرد. انویدیا RTX 4090 موبایل رو در برابر M3 Max و RTX 4050 موبایل رو در برابر چیپ M3 پایه اپل قرار داد. RTX 4090 تقریبا ۴۲٪ سریعتر از M3 Max بود، اما با اندازه (Batch) دسته هشتتایی، این چیپ ۹۰٪ سریعتر بود. بهطور مشابه، RTX 4050 موبایل ۴۸٪ سریعتر از اپل M3 بود، اما با اندازه دسته هشتتایی، RTX 4050 تقریبا ۹۰٪ سریعتر بود. تغییر اندازه Batch میتونه یک بهینهسازی باشه که عملکرد AI رو بسته به معماری بهبود ببخشه.
انویدیا بنچمارک سومی رو با استفاده از UL Procyon Stable Diffusion 1.5 در برابر AMD نشون داد. در این تست، انویدیا تمام خط تولید GPUهای دسکتاپ سری RTX 40 رو در برابر Radeon RX 7900 XTX از AMD قرار داد. هر کدام از GPUهای نویدیا، از RTX 4070 Super به بالا، از پرچمدار AMD بهتر عمل کردن و RTX 4090 تا ۲.۸ برابر بهتر از اون بود. RTX 4060 Ti و RTX 4060 بهطور قابل توجهی کندتر بودن. نکتهای که باید در نظر گرفت اینه که GPU پرچمدار انویدیا بهطور قابلتوجهی از GPU معادل AMD، حداقل در این بار کاری خاص، سریعتره.