انویدیا میگه 45TOPS برای سیستم های هوش مصنوعی اعلامی مایکروسافت اصلا کافی نیست!

انویدیا اخیرا در یک رویداد مطبوعاتی توانایی‌های GPU‌های مصرفی RTX خودش رو نشون داد. این شرکت به این نکته اشاره کرد که GPU‌هاش نسبت به PC‌های مجهز به NPU معمولی در انجام وظایف هوش مصنوعی بهتر عمل می‌کنن. همچنین چندین معیار (بنچمارک) ارائه داد که نشون میده GPU‌های نویدیا در مقایسه با نوت‌بوک‌های رقیب که از شتاب‌دهنده‌های سخت‌افزاری هوش مصنوعی استفاده می‌کنن، مانند مک‌بوک پرو با تراشه M3 Max از اپل، عملکرد بهتری دارن. ادامه این خبر رو با توییک فا همراه باشید.

انویدیا اعلام کرده که GPU‌هاش قابلیت‌های AI بسیار بهتری نسبت به NPUهای امروزی دارن.

کل این رویداد درمورد این بود که چطور GPU‌های RTX نویدیا از PC‌های “AI” مدرن که با NPU تجهیز شده‌اند، بهتر عمل می‌کنن. انویدیا گفت که عملکرد ۱۰ تا ۴۵ TOPS که در پردازنده‌های مدرن اینتل، AMD، اپل و کوالکام یافت میشه، فقط برای کارهای “پایه‌ای” AI کافیه. شرکت چندین مثال زد، از جمله ویرایش عکس، تولید تصویر، ارتقای کیفیت تصویر و کمک به کدنویسی از طریق AI، که گفته میشه PC‌های مجهز به NPU یا نمی‌تونن انجام بدن یا فقط در سطح پایه‌ای قادر به انجامشون هستن. از طرف دیگه، GPU‌های نویدیا می‌تونن تمام کارهای AI رو انجام بدن و با عملکرد یا کیفیت بهتری اجرا کنن، اونم به‌طور طبیعی.

انویدیا اعلام کرد که GPU‌های RTX آن بسیار کارآمدتر از NPU‌ها هستن و می‌تونن بسته به مدل GPU عملکردی بین ۱۰۰ تا بیش از ۱۳۰۰+ TOPS داشته باشن! این رویداد انویدیا تا جایی پیش رفت که GPU‌های RTX را در دسته “تجهیزات AI پیشرفته” قرار داد، در حالی که NPU‌ها را در دسته “تجهیزات AI پایه‌ای” طبقه‌بندی کرد. (انویدیا همچنین یک دسته دیگه هم اضافه کرد، محاسبات ابری، که اون رو در دسته “تجهیزات AI سنگین” با هزاران TOPS عملکرد قرار داده، که قطعاً اشاره‌ای به GPU‌های شرکتی H100 و B200 Blackwell خودشه.)

مقایسه 4090 و 4050 لپ تاپ انویدیا با M3 Max

انویدیا چندین بنچمارک با تمرکز روی AI نشون داد که در اون‌ها GPU‌های جدید سری RTX 40 رو با رقبا مقایسه کرده بود. برای خلق محتوا، انویدیا یک بنچمارک نشون داد که در اون RTX 4090 لپ‌تاپ، RTX 4050 لپ‌تاپ و مک‌بوک پرو اپل M3 Max رو در چندین برنامه خلق محتوایی که از AI استفاده می‌کنن مقایسه کرده بود. برنامه‌هایی مثل Stable Diffusion, Arnold, Blender, Chaos V-ray, Octane, Adobe Premier Pro Enhance Speech, DaVinci Resolve و ON1 Resize AI. بنچمارک نشون داد که RTX 4090 لپ‌تاپ تو بعضی موارد تا بیش از ۷ برابر از مک‌بوک پرو مجهز به M3 Max سریع‌تر بوده و RTX 4050 لپ‌تاپ هم تا بیش از ۲ برابر از همون مک‌بوک پرو بهتر عمل کرده. به‌طور میانگین، RTX 4090 موبایل ۵ برابر و RTX 4050 LT بین ۵۰ تا ۱۰۰ درصد بهتر از M3 Max عمل کرده.

یک بنچمارک دیگه که انویدیا نشون داد، شامل مدل‌های زبان بزرگ (LLMs) بود و از بار کاری Llama 2 7B int4 LLM استفاده می‌کرد. انویدیا RTX 4090 موبایل رو در برابر M3 Max و RTX 4050 موبایل رو در برابر چیپ M3 پایه اپل قرار داد. RTX 4090 تقریبا ۴۲٪ سریع‌تر از M3 Max بود، اما با اندازه (Batch) دسته هشت‌تایی، این چیپ ۹۰٪ سریع‌تر بود. به‌طور مشابه، RTX 4050 موبایل ۴۸٪ سریع‌تر از اپل M3 بود، اما با اندازه دسته هشت‌تایی، RTX 4050 تقریبا ۹۰٪ سریع‌تر بود. تغییر اندازه Batch می‌تونه یک بهینه‌سازی باشه که عملکرد AI رو بسته به معماری بهبود ببخشه.

انویدیا بنچمارک سومی رو با استفاده از UL Procyon Stable Diffusion 1.5 در برابر AMD نشون داد. در این تست، انویدیا تمام خط تولید GPU‌های دسکتاپ سری RTX 40 رو در برابر Radeon RX 7900 XTX از AMD قرار داد. هر کدام از GPU‌های نویدیا، از RTX 4070 Super به بالا، از پرچم‌دار AMD بهتر عمل کردن و RTX 4090 تا ۲.۸ برابر بهتر از اون بود. RTX 4060 Ti و RTX 4060 به‌طور قابل توجهی کندتر بودن. نکته‌ای که باید در نظر گرفت اینه که GPU پرچم‌دار انویدیا به‌طور قابل‌توجهی از GPU معادل AMD، حداقل در این بار کاری خاص، سریع‌تره.

برچسب ها