سرور GPU به سرور با یک یا چند واحد پردازش گرافیکی (GPU) اطلاق میشود که قدرت و سرعت بیشتری را برای اجرای وظایف محاسباتی فشرده، مانند رندرینگ ویدئو، تجزیه و تحلیل اطلاعات، و یادگیری ماشین (machine learning) ارائه میدهد. سرورهای اختصاصی GPU ممکن است دارای یک CPU تخصصی به همراه مقادیر زیادی رم و فضای ذخیرهسازی نیز باشند.
معماری موازی یک GPU، که در اصل برای پردازش گرافیک و ویدئو طراحی شده است، به یک سرور اختصاصی GPU اجازه میدهد تا چندین کار را به طور همزمان با سرعتی فراتر از تواناییهای یک سرور مبتنیبر CPU مدیریت کند.
سرور رک GPU یا سرور گرافیکی یک سرور مجهز به GPU است که برای قرار گرفتن در رک سرور طراحی شده است. رک سرور یک چارچوب مستطیل شکل با چندین چفت برای نصب (اسلات) است که برای نگهداری سرورهای رک و سایر اجزای شبکه طراحی شده است. سرورها برای به حداقل رساندن استفاده از فضای اصلی، به طور پلهای روی هم قرار گرفتهاند و در صورت لزوم به داخل و خارج از رک کشیده میشوند. سرور رک GPU چندین مزیت از جمله استفاده بهینه از فضا، افزایش مقیاسپذیری، حداکثر جریان هوا و تعمیر و نگهداری آسان را ارائه میدهد.
پردازندههای گرافیکی را باید نسخه بهینهسازی شده و تخصصی سرورهای GPU دانست. این سرورها به جای داشتن هستههای سنگین وزن با سرعت کلاک بالا، که قادر به انجام طیف گستردهای از وظایف محاسباتی هستند، از هزاران هسته سبکوزن استفاده میکنند که برای پردازش موازی عملیات مشابه (مانند یک دستورالعمل، چند دیتا [SIMD]) بهینه شدهاند. این هستهها دارای مجموعه دستورالعملهایی هستند که برای فرمولهای محاسباتی ماتریس بعدی و اعداد ممیز شناور (floating point calculations) بهینه شدهاند و فرایند محاسبه جبر خطی را تسریع میبخشند. نتیجه نهایی این امر، در واقع یک سیستم بهینه شده برای محاسبات موازی است.
دلایلی که سرور GPU یا سرور گرافیکی را از سایر سرورها متمایز میسازد، عبارتاند از:
سرورهای رک GPU به طور عمومی در سرورهای رک یا کابینتها (cabinets) قرار میگیرند. قفسههای سرور و تجهیزات نصب شده در آنها در واحدهای رک اندازهگیری میشوند که به صورت “U” یا گاهی اوقات “RU” نوشته میشود. “U” توصیفکننده ارتفاع تجهیزات میباشد (به عنوان مثال، ارتفاع یک سرور یا ارتفاع و تعداد قفسههای یک رک سرور). هر U برابر با 1.75 اینچ است، بنابراین ارتفاع سرور 1U 1.75 اینچ و سرور 2U 3.5 اینچ خواهد بود. برای مثال، یک رک 32U می تواند 32 سرور 1U، 4 سرور 8U یا 1 سرور 32U را در خود جای دهد.
تفاوت اصلی بین فرم فاکتورهای کوچکتر با فرم فاکتورهای بزرگتر (Smaller Form Factors vs. Larger Form Factors، چگالی و قابلیت گسترش آنهاست. نکته: فرم فاکتورها با نام “ضریب شکل” نیز شناخته میشوند.
فرم فاکتورهای کوچکتر، مانند سرورهای رک GPU 1U و 2U، به طور خاص مبتنی بر تراکم عملکرد طراحی شدهاند، اما نسبت به فرم فاکتورهای بزرگتر سرور GPU، قدرت کمتری دارند. آنها معمولاً به دلیل هزینه کمتر و توانایی در ذخیره فضای رک سرور استفاده میشوند.
سرورهای رک GPU 1U و 2U به راحتی قابل نگهداری هستند. همچنین، حمل آنها بسیار آسان است و از لحاظ مقیاسپذیری نیز در شرایط خوبی قرار دارند. (شما میتوانید با استفاده از چندین مورد از آنها عملکرد سرور را مقیاسبندی کنید). یک سرور 1U به طور معمول میتواند یک یا دو CPU، چندین ترابایت حافظه و چندین GPU را در خود جای دهد. این در حالی است که ارتفاع سرور 2U تقریبا دو برابر ارتفاع سرور 1U است که همین مسئله کمی فضای اضافی برای قدرت محاسباتی و ذخیرهسازی در اختیار شما میگذارد.
در سرورهای فرم فاکتور کوچکتر، GPUها معمولاً به دلیل محدودیت فضا به صورت افقی نصب میشوند. همچنین فضای کمتری برای جای نصب (اسلات) و فضای ذخیرهسازی PCIe وجود دارد؛ اگرچه میتوانید با استفاده از کیت توسعه PCIe یا محفظه JBOD، آنها را گسترش دهید.
سرورهای رک GPU بزرگتر مانند 8U و 16U برای کارهای سنگینتر، که به قابلیتهای عملکرد گستردهتری نیاز دارند، طراحی شدهاند. آنها دارای فضای بیشتری برای ذخیرهسازی و نصب اسلاتهای اضافی هستند که به شما امکان میدهد کارتهای PCIe اضافی را برای افزایش عملکرد پردازش اطلاعات به آن وصل کنید. فضای اضافی همچنین باعث گردش بهتر هوا برای جلوگیری از گرمای بیش از حد میشود.
در فرم فاکتور بزرگتر، کارتهای گرافیکی به صورت عمودی نصب میشوند و اتصالات برق آنها به جای این که در پشت دستگاه باشد در بالای کارت قرار دارند.
هنگام اندازهگیری سرور GPU اختصاصی، باید ویژگیهای محصول مورد نظر خود و همچنین نیازهای فعلی و آینده کسبوکار خود را در نظر بگیرید. پیکربندی بهینه سرور به حجم کاری شما، موارد استفاده خاص آن سرور و سرعت مورد نیاز شما بستگی دارد.سرورهای اختصاصی GPU را میتوان برای کارهای خاص، مانند رندر ویدیو، آموزش یادگیری عمیق، تجزیه و تحلیل اطلاعات بزرگ، استنباط و محاسبات سریع (HPC) پیکربندی کرد. پیکربندی بهینه سرور به حجم کاری هدف، موارد استفاده خاص آن سرور و سرعت مورد نیاز شما بستگی دارد.
سرورهای اختصاصی GPU ضمن مصرف انرژی بالا، گرمای زیادی نیز تولید میکنند. به همین سبب، از CPU بزرگتری برخوردارند که همین مسئله لزوم به کارگیری فضای اضافی برای اتصالات برق در آنها را ضروری میکند. شاسی سرور به اندازه کافی بزرگ است تا بتواند با مقدار سرورهای اختصاصی GPU مورد نظر، سازگار باشد. توجه داشته باشید که این سرورها برای جلوگیری از گرمای بیش از حد نیاز به تهویه مناسب دارند. لذا، هنگام خرید حتما به برخوردار بودن آنها به سک سیستم تهویه مناسب توجه کنید.
قابل درک است که هزینهها با توجه به اخصاصی بودن یا نبودن سرور GPU، خدمات اضافی و کیفیت ساخت آن متفاوت خواهد بود.اگر قصد خرید دائمی سرور اختصاصی دارید، باید هزینه GPU و همچنین منبع تغذیه، شاسی، CPU تخصصی، رم و فضای ذخیرهسازی را در نظر بگیرید. همچنین ممکن است لازم باشد هزینههای ایجاد دیتاسنتر در محل، مانند هزینههای برق، فضا، سرمایش و نگهداری را نیز در نظر بگیرید.
پردازندههای گرافیکی بر اساس ویژگیهای آنها طبقهبندی میشوند و قیمتها بسته به اهداف استفاده متفاوت است. به عنوان مثال، NVIDIA سرورهای مبتنی بر Tesla V100 را برای یادگیری عمیق و محاسبات با دقت بالا ارائه میدهد. یک پردازنده گرافیکی با رتبه برتر مانند NVIDIA’s Nvidia GTX Titan Z می تواند حدود 3000 دلار قیمت داشته باشد.
اگر تصمیم به استفاده از پلتفرم ابری دارید، چندین شرکت خدمات ابری وجود دارند که برنامههای سرور اختصاصی مبتنی بر GPU از جمله ارائهدهندگان خدمات ابری اصلی مانند AWS V2 Cloud، Google Cloud Platform و Azure را ارائه میدهند. به عنوان مثال، هزینه سرویس چهار هستهای AWS به ازای هر یک ساعت، 90 سنت میباشد.
این گزینه بستگی به بودجه شرکت شما و موارد استفاده از آن دارد. خرید سرور رک GPU مستلزم هزینههای اولیه است. پردازندههای گرافیکی با رتبه بالا برای فعالیتهایی چون سیستم یادگیری ماشینی میتوانند قیمت بالایی داشته باشند. به این مورد، هزینههای نگهداری، انرژی و پهنای باند ذخیرهسازی سرور GPU در محل را نیز اضافه کنید.با توجه به بهروزرسانیهای مداومی که در حوزه فناوری سرور صورت میگیرد، خرید آن میتواند ریسک بزرگی باشد و سرمایه شما را صرفا هدر بدهد. چراکه هنگام خرید یک سرور گرافیکی ممکن است از آپدیتهای رایگان آن به صورت آنلاین توسط شرکت ارائهدهنده محروم شوید؛ این مسئله شما را مجبور میکند که برای هر بهروزرسانی مبلغ هنگفتی را به شرکتهای ارائهدهنده بپردازید.
حال، اگر اطلاعات قابل ذخیره کسب و کار شما بسیار زیاد است و قصد دارید مدلهای خود را در یک محیط اشتراکی مستقر کنید، زیرساخت GPU را از طریق یک ارائهدهنده خدمات ابری اجاره کنید. این مدل اشتراک به شما امکان میدهد بسته به منابعی که استفاده میکنید (ساعتی، ماهانه یا سالانه) هزینهای را پرداخت کنید و بر اساس تقاضاهای فعلی مقیاس را افزایش یا کاهش دهید.
یک سرور اختصاصی GPU چندین مزیت را نسبت به سرور مبتنی بر CPU ارائه میدهد. از جمله این مزایا میتوان به موارد زیر اشاره کرد:
سرورهای اختصاصی GPU را میتوان به طور کامل خریداری یا از یک ارائه دهنده خدمات اجاره کرد.
AIRI//S™ یک زیرساخت هوش مصنوعی ساده، بسیار مقیاس پذیر و مبتنی بر فلش است که توسط Pure Storage® و NVIDIA توسعه یافته است. AIRI//S از جدیدترین سیستمهای NVIDIA DGX با ذخیرهسازی Pure Storage FlashBlade//S®، سیستم عامل Pure Storage Purity//FB و مدیریت ابری Pure1® پشتیبانی میکند.سطوح جدیدی از موفقیت هوش مصنوعی را با Pure و AIRI//S تجربه کنید.