سیستم های خوشه ای در محاسبات علمی. سیستم های خوشه ای

فن آوری های خوشه ای به مدت طولانی برای سازمان های عادی در دسترس هستند. این به دلیل استفاده از سرورهای ارزان قیمت اینتل، ابزار استاندارد برای ارتباطات و سیستم عامل گسترده در خوشه های سطح اولیه امکان پذیر شد. راه حل های خوشه ای در سیستم عامل های مایکروسافت عمدتا بر روی مبارزه با خطاهای اپراتور، خرابی تجهیزات هدایت می شود. راه حل های خوشه ای - یک وسیله موثر برای حل این مشکلات است.

به عنوان تکنولوژی کامپیوتر توسعه می یابد، درجه ادغام آن به فرآیندهای کسب و کار شرکت ها و فعالیت های سازمان ها به طور چشمگیری افزایش یافته است. مشکلی در افزایش شدید در زمان وجود دارد که در آن منابع محاسباتی در دسترس هستند، و به طور فزاینده ای مرتبط می شود. قابلیت اطمینان سرورها در حال تبدیل شدن به یکی از عوامل کلیدی کار موفقیت آمیز شرکت های توسعه یافته است زیرساخت شبکهاین امر به ویژه برای شرکت های بزرگ مهم است که در آن سیستم های ویژه از فرآیندهای تولید در زمان واقعی حمایت می کنند، زیرا بانک ها با شبکه های شعبه گسترده یا مراکز خدمات اپراتور تلفن که از سیستم پشتیبانی تصمیم استفاده می کنند. همه این شرکت ها نیاز به سرورهایی دارند که به طور مداوم کار می کنند و اطلاعات هر روز 24 ساعت بدون وقفه را ارائه می دهند.

هزینه تجهیزات بیکار برای شرکت به طور مداوم در حال رشد است، زیرا این امر شامل ارزش اطلاعات گمشده، سود از دست رفته، هزینه های پشتیبانی فنی و ترمیم، نارضایتی مشتری و غیره است. نحوه ایجاد یک سیستم قابل اعتماد و هزینه های حل هزینه این مشکل؟ تعدادی از تکنیک هایی وجود دارد که به شما امکان می دهد هزینه یک دقیقه از خرابی را برای این شرکت محاسبه کنید و سپس بر اساس این محاسبه، شما می توانید راه حل قابل قبول ترین با بهترین قیمت و عملکرد را انتخاب کنید.

گزینه های بسیاری وجود دارد و به معنی ساخت یک سیستم قابل اعتماد از سیستم محاسبات است. آرایه های دیسک RAID، منبع تغذیه پشتیبان، به عنوان مثال، "بیمه" بخشی از تجهیزات سیستم را در صورت شکست دیگر اجزای مشابه سیستم، و به شما اجازه می دهد تا پردازش درخواست ها را به اطلاعات زمانی که امتناع می کنند، قطع نکنید. منابع قدرت بی وقفه از عملکرد سیستم در صورت شکست در شبکه منبع تغذیه پشتیبانی می کنند. هیئت مدیره سیستم چند منظوره عملکرد سرور را در صورت شکست یک پردازنده تضمین می کند. با این حال، هیچ یک از این گزینه ها ذخیره نمی شود اگر کل سیستم محاسبات از کل سیستم محاسبات خارج شود. خوشه بندی به نجات می رسد.

از لحاظ تاریخی، اولین گام به ایجاد خوشه ها در زمان خود در سیستم "داغ" ذخیره می شود. یک یا دو چنین سیستمی که در شبکه از چندین سرور گنجانده شده، هیچ کار مفید را انجام نمی دهند، اما آماده شروع کار هستند، به محض اینکه هر یک از سیستم های اصلی نتواند انجام شود. بنابراین، سرورها در صورت شکست یا شکستن یکی از آنها یکدیگر را تکرار می کنند. اما من می خواهم چندین رایانه را ترکیب کنم، آنها فقط یکدیگر را تکرار نکردند، بلکه یک کار مفید دیگر را انجام دادند، توزیع بار را در میان خود انجام دادند. برای چنین سیستمی، در بسیاری از موارد، خوشه ها مناسب هستند.

در ابتدا خوشه ها فقط برای محاسبات قدرتمند و پشتیبانی از پایگاه داده های توزیع شده مورد استفاده قرار گرفتند، به ویژه در مواردی که افزایش قابلیت اطمینان مورد نیاز است. در آینده، آنها شروع به درخواست خدمات وب کردند. با این حال، کاهش قیمت ها برای خوشه ها منجر به این واقعیت شد که چنین راه حل ها به طور فزاینده ای برای نیازهای دیگر استفاده می شود. فن آوری های خوشه ای در نهایت به سازمان های عادی در دسترس می شوند - به ویژه، به لطف استفاده از سرورهای کم هزینه اینتل، ابزار استاندارد برای ارتباطات و سیستم عامل های مشترک (OS) در خوشه های سطح اولیه.

راه حل های خوشه ای در سیستم عامل های مایکروسافت عمدتا به طور عمده به منظور مبارزه با تجهیزات و شکست نرم افزار (نرم افزار) هدایت می شود. آمار گزاف گویی چنین سیستم هایی به خوبی شناخته شده است: تنها 22٪ از آنها به طور مستقیم توسط شکست تجهیزات، سیستم عامل، منبع تغذیه، و غیره به منظور حذف این عوامل، فن آوری های مختلف برای افزایش سرورها شکست خورده است (دیسک های اضافی و قابل تعویض، منبع تغذیه، هیئت مدیره در اتصالات PCI، و غیره). با این حال، 78٪ از حوادث باقی مانده معمولا ناشی از شکست های کاربردی و خطاهای اپراتور است. راه حل های خوشه ای - یک وسیله موثر برای حل این مشکل است.

خوشه ها به شما اجازه می دهد تا یک معماری منحصر به فرد ایجاد کنید که عملکرد کافی، مقاومت در برابر شکست تجهیزات و نرم افزار دارد. چنین سیستمی به راحتی مقیاس و ارتقا یافته توسط ابزار جهانی، بر اساس اجزای استاندارد و برای قیمت مناسب، که به طور قابل توجهی کمتر از قیمت یک کامپیوتر متضاد منحصر به فرد یا یک سیستم با موازی توده ای است، به طور قابل توجهی ارتقا یافته است.

اصطلاح "خوشه" به معنای تحمل گسل و مقیاس پذیری و مدیریت آن است. شما می توانید یک تعریف خوشه کلاسیک را ارائه دهید: "خوشه یک سیستم موازی یا توزیع شده است که شامل چندین کامپیوتر مربوط به یکدیگر و در همان زمان به عنوان یک منبع کامپیوتری یکپارچه و یکپارچه استفاده می شود." خوشه ترکیبی از چندین رایانه است که در سطح معینی انتزاع کنترل می شود و به عنوان یک عدد صحیح استفاده می شود. در هر گره خوشه (گره معمولا یک کامپیوتر موجود در خوشه است) کپی خود را از سیستم عامل است. به یاد بیاورید که سیستم هایی با معماری SMP و NUMA داشتن یک کپی مشترکنمی توان خوشه ها را در نظر گرفت. گره خوشه می تواند هر دو یک پردازنده تک پردازنده و چند پردازنده باشد و در یک خوشه، رایانه ها ممکن است پیکربندی های مختلفی داشته باشند (تعداد دیگری از پردازنده ها، حجم های مختلف RAM و دیسک ها). گره های خوشه ای به یکدیگر متصل می شوند و یا با استفاده از اتصالات شبکه های معمولی (اترنت، FDDI، کانال فیبر) یا توسط فن آوری های غیر استاندارد. چنین اتصالات intraclastic یا interstal اجازه می دهد گره ها به طور مستقل از محیط شبکه خارجی ارتباط برقرار کنند. در کانال های داخل خوشه ای گره ها نه تنها با اطلاعات ارتباط برقرار می کنند، اما همچنین کنترل کارایی یکدیگر را کنترل می کند.

یک تعریف گسترده تر از یک خوشه وجود دارد: "خوشه یک سیستم عمل می کند به عنوان یک عدد صحیح تنها تضمین قابلیت اطمینان بالا با مدیریت متمرکز تمام منابع و یک سیستم فایل مشترک و علاوه بر این، ارائه انعطاف پذیری پیکربندی و سهولت در تولید منابع."

همانطور که قبلا ذکر شد، هدف اصلی خوشه این است که اطمینان حاصل شود که در مقایسه با مجموعه تقسیم شده از رایانه ها یا سرورها - سطح آمادگی (در غیر این صورت به عنوان سطح دسترسی، در دسترس بودن، HA)، و همچنین درجه بالایی از آن نامیده می شود مقیاس پذیری و سهولت اداری. بهبود آمادگی سیستم، کار برنامه های کاربردی حیاتی برای کاربر در طول طولانی ترین مدت زمان را تضمین می کند. این امکان وجود دارد که تمام برنامه های کاربردی را شامل شود که به طور مستقیم بستگی به توانایی شرکت برای ایجاد سود، ارائه خدمات یا ارائه سایر توابع حیاتی دارد. به عنوان یک قاعده، استفاده از خوشه اجازه می دهد تا اطمینان حاصل کنید که اگر سرور یا هر برنامه متوقف شود، به طور معمول، سرور دیگری در خوشه، ادامه می دهد تا وظایف خود را ادامه دهد نقش یک سرور معیوب را بر عهده خواهد گرفت (یا یک کپی از یک برنامه معیوب را اجرا کنید) به منظور به حداقل رساندن خرابی کاربر به دلیل سوء عملکرد در سیستم.

آمادگی معمولا اندازه گیری می شود به عنوان یک درصد از زمان صرف شده توسط سیستم در شرایط کار، از کل زمان کار. برنامه های کاربردی مختلف نیاز به آمادگی مختلف از سیستم محاسبات دارند. آمادگی سیستم را می توان با روش های مختلف افزایش داد. انتخاب روش بسته به هزینه سیستم و هزینه برای شرکت زمان بیکار انجام می شود. راه حل های نسبتا ارزان وجود دارد که به عنوان یک قاعده، به طور عمده تمرکز می کنند، عمدتا به کاهش زمان بیکار پس از سوء عملکرد رخ می دهد. گران تر تر ارائه عملکرد نرمال سیستم و ارائه خدمات به کاربران حتی اگر یک یا چند از اجزای آن شکست خورده است. همانطور که سیستم شنیده می شود، قیمت آن غیر خطی افزایش می یابد. به طور مشابه، هزینه پشتیبانی آن غیر خطی است. سیستم هایی با هزینه های نسبتا کم، سطح بالایی از تحمل گسل ندارند - بیش از 99٪ (این بدان معنی است که تقریبا چهار روز در سال ساختار اطلاعاتی شرکت غیر قابل استفاده خواهد بود). این خیلی زیاد نیست اگر در اینجا شامل هر دو خرابی برنامه ریزی شده مربوط به کار پیشگیرانه یا تنظیم مجدد باشد.

در دسترس بودن بالا (آمادگی) این راه حل را به این نتیجه می رساند که می تواند به عملکرد یا بازگرداندن عملکرد پس از وقوع اکثر خطاها ادامه یابد بدون دخالت اپراتور پیشرفته ترین راه حل های شکست خورده (و به طور طبیعی گران قیمت) قادر به ارائه 99.999٪ از قابلیت اطمینان سیستم است (به عنوان مثال نه بیشتر از 5 دقیقه خرابی در سال)

بین سیستم های تک سرور با زیرسیستم های دیسک آینه ای (یا آرایه های دیسک RAID) و سیستم های تحمل خطا، "متوسط \u200b\u200bطلا" ارائه راه حل های خوشه ای است. از لحاظ در دسترس بودن، آنها به سیستم های مقاوم در برابر خطا با هزینه کمتر غیر قابل اندازه گیری می رسند. چنین راه حل هایی ایده آل برای مواردی است که تنها خرابی بسیار غیرقابل پیش بینی می تواند مجاز باشد.

در صورت شکست سیستم خوشه ای بازیابی نرم افزار و سخت افزار ویژه را مدیریت می کند. نرم افزار خوشه ای به شما اجازه می دهد تا به طور خودکار یک مشکل سخت افزاری یا نرم افزاری را تعریف کنید، آن را جدا کنید و سیستم را بازگردانید. زیرمجموعه های ویژه طراحی شده می تواند بیشترین انتخاب را انتخاب کند راه سریع بازیابی و در حداقل زمان برای اطمینان از عملکرد خدمات. با کمک یک ابزار ابزار داخلی برای توسعه و رابط برنامه نویسی، می توانید برنامه های خاصی را ایجاد کنید که تشخیص، عایق بندی و از بین بردن شکست هایی که در برنامه های توسعه یافته توسط کاربر رخ می دهد، ایجاد کنید.

مزیت مهمی از خوشه بندی، اطمینان از مقیاس پذیری است. خوشه اجازه می دهد تا شما را به انعطاف پذیری سیستم محاسبات سیستم را افزایش دهید، اضافه کردن گره های جدید به آن و بدون وقفه کاربران. راه حل های خوشه ای مدرن، توزیع بار اتوماتیک بین گره های خوشه را ارائه می دهد، در نتیجه یک برنامه می تواند بر روی سرورهای مختلف کار کند و از منابع محاسباتی خود استفاده کند. برنامه های معمول بر روی خوشه ها عمل می کنند، این است:

پایگاه داده؛
سیستم های مدیریت منابع سازمانی (ERP)؛
پردازش پیام و سیستم های پستی؛
ابزار پردازش تراکنش از طریق وب سایت ها و سرورهای وب؛
سیستم های تعامل مشتریان (CRM)؛
سیستم های جداسازی فایل و چاپ.

بنابراین، خوشه ترکیبی از سرورهای متعدد متصل شده است کانال ارتباطات ویژه، اغلب به نام شبکه سیستم نامیده می شود. گره های خوشه کنترل عملکرد یکدیگر و تبادل اطلاعات خاص، مانند پیکربندی خوشه ای، و همچنین انتقال اطلاعات بین درایوهای رایج و استفاده از آنها را هماهنگ کنید.

کنترل کار با کمک کمک کرد ضربان قلب سیگنال ویژه. ("نبض"). این گره های خوشه سیگنال یکدیگر را انتقال می دهند تا عملکرد طبیعی خود را تأیید کنند. در خوشه های سرسبز کوچک، کانال های مشابه در کانال های مشابه انتقال می یابند، زیرا داده ها، خطوط ویژه در سیستم های خوشه ای بزرگ برجسته می شوند. نرم افزار خوشه باید یک سیگنال "پالس" هر سرور را در یک فاصله زمانی خاص دریافت کند - در صورت عدم درمان آن، سرور به صورت غیر کار در نظر گرفته می شود و خوشه به طور خودکار دوباره تنظیم می شود. درگیری های بین سرورها به طور خودکار اجازه می دهد زمانی که مشکل انتخاب یک سرور "استاد" یا سرور سرور هنگامی رخ می دهد که خوشه شروع شود، وظیفه ای است که یک خوشه جدید ایجاد می کند.

برای سازمان کانال ارتباطی خوشه، فن آوری های شبکه معمولی (اترنت، حلقه نشانه، FDDI، ATM)، اتوبوس I / O مشترک (SCSI یا PCI)، رابط کانال فیبر با سرعت بالا و یا فن آوری های اختصاصی CI (Computer Interconnect)، DSSI (سیستم ذخیره سازی دیجیتال اتصال) یا کانال حافظه.

رابط DSSI برای دسترسی به درایو ها و سیستم های تعامل در میان خود طراحی شده است. این شبیه به پروتکل چند پایان SCSI-2 است، اما عملکرد بیشتری دارد و امکان سازماندهی تعامل کامپیوتر را دارد. خوشه های DSSI پشتیبانی از ابزارهای قابلیت اطمینان سیستم، جداسازی منابع، سیستم فایل توزیع شده و شفافیت. از نقطه نظر کنترل و امنیت، خوشه DSSI توسط یک دامنه تک نشان داده شده است.

رابط CI - تایر دو متوالی با نرخ ارز تا 70 مگابیت در ثانیه. این سیستم به سیستم کامپیوتری I / O متصل شده است، با استفاده از یک کنترل کننده هوشمند که قادر به نگهداری هر دو دوگانه و با یک اتوبوس تنها بسته به شرایط مناسب برای دسترسی به یک کامپیوتر خاص است. تمام خطوط ارتباطی رابط CI با یک Integrator CI متصل می شوند - اتصالات ردیابی دستگاه مخصوص با گره ها و تنظیمات خوشه ای.

فن آوری کانال حافظه اجازه می دهد تا شما را به ایجاد یک محیط ارتباطی بسیار کارآمد که فراهم می کند سرعت بالا (حداکثر 100 مگابایت بر ثانیه) پیام بین سرورها در یک خوشه.

الزامات سرعت کانال ارتباطی بستگی به درجه ادغام گره های خوشه ای و ماهیت استفاده از برنامه های کاربردی دارد. اگر، به عنوان مثال، برنامه های کاربردی در گره های مختلف با یکدیگر ارتباط برقرار نمی کنند و دسترسی همزمان به درایوهای دیسک را انجام نمی دهند، گره ها فقط با پیام های کنترل تایید عملکرد خود، و همچنین اطلاعات در مورد تغییر پیکربندی خوشه، یعنی اضافه کردن جدید گره ها، توزیع مجدد حجم دیسک، و غیره. این نوع مبادله نیازی به منابع قابل توجهی از بین نمی گذارد و ممکن است با یک کانال اترنت ساده 10 مگابیت راضی باشد.

پیکربندی های خوشه ای واقعی مقدار زیادی وجود دارد. راه حل هایی وجود دارد که ترکیبی از چند خوشه، و حتی با دستگاه های اضافی وجود دارد. هر گزینه مطابق با الزامات مربوطه است برنامه های مختلف و به طور طبیعی، از لحاظ هزینه و پیچیدگی پیاده سازی متفاوت است. چنین توپولوژی خوشه ها به عنوان یک ستاره، حلقه، N-N و دیگران به طور گسترده ای مورد استفاده قرار می گیرند. اما مهم نیست که چگونه خوشه پیچیده و عجیب و غریب را می توان در دو معیار واجد شرایط است:

سازمان از گره های خوشه ای،

میزان دسترسی به دستگاه های I / O، اول از همه دیسک ها.

همانطور که برای RAM، دو گزینه وجود دارد: هر کدام از گره های خوشه ای مستقل هستند رمیا آنها یک حافظه مشترک مشترک دارند. میزان دسترسی به دستگاه های خوشه ای I / O به طور عمده توسط امکان استفاده از حافظه خارجی با دیسک های مشترک تعیین می شود و این بدان معنی است که هر گره دارای دسترسی شفاف به سیستم فضای دیسک به اشتراک گذاشته شده است. علاوه بر زیرسیستم دیسک به اشتراک گذاشته شده، دیسک های محلی می توانند دیسک های محلی را بر روی گره های خوشه ای داشته باشند، اما در این مورد آنها عمدتا برای بارگذاری سیستم عامل در گره استفاده می شود. چنین خوشه ای باید یک زیر سیستم خاص به نام مدیر قفل توزیع شده، DLM، برای از بین بردن درگیری ها در هنگام نوشتن به فایل های از گره های خوشه ای مختلف داشته باشد. در سیستم هایی که DLM وجود ندارد، برنامه ها نمی توانند به صورت موازی با داده های مشابه کار کنند و حافظه کل دیسک، در صورت وجود، به یکی از گره ها در یک نقطه خاص اختصاص داده شده است.

در خوشه هایی که دسترسی همزمان به حافظه خارجی را پشتیبانی نمی کنند، تمام گره ها به طور کامل سرورهای مستقل هستند.در مورد دو گره، دسترسی به حافظه مشترک در دیسک ها با استفاده از اتوبوس جدا شده I / O (شکل 1) انجام می شود. برای هر گره، چنین تایر به پایان می رسد در یک آرایه دیسک. در هر زمان، تنها یک گره دارای یک سیستم فایل مشترک است. اگر یکی از سرورها نتواند، کنترل اتوبوس را کنترل کند و دیسک های جدا شده به گره دیگری برسد.

شکل. 1. ساخت یک خوشه ای از دو گره.

برای شرکت ها با یک سیستم اطلاعاتی یکپارچه، جایی که تنها بخشی از منابع درگیر برای انجام قابلیت اطمینان کاربردی انتقادی است، یک طرح برای ساخت یک خوشه پشتیبان فعال (شکل 2) می تواند اعمال شود. در چنین سیستمی، ساده ترین مورد شامل یک سرور فعال است که مهمترین برنامه ها را انجام می دهد و یک دستگاه پشتیبان که وظایف کمتر مسئولیت را حل می کند. اگر سرور فعال نتواند، تمام برنامه های کاربردی آن به طور خودکار به پشتیبان گیری منتقل می شود، جایی که برنامه های کاربردی با اولویت پایین عملکرد متوقف می شوند. این پیکربندی به شما اجازه می دهد تا کاهش سرعت کار برنامه های کاربردی انتقادی را حذف کنید - کاربران به سادگی هیچ تغییری را متوجه نخواهند شد (یک مورد خاص از این طرح - پیکربندی "پشتیبان منفعل"، که در آن سرور پشتیبان هر بار حمل نمی کند و در حالت آماده به کار است)

شکل. 2. ساخت یک خوشه نوع "فعال - ذخیره".

همچنین پیکربندی "Active-Active" وجود دارد که به این معنی است که اجرای تمام سرورهای خوشه ای برنامه های انتخاب شده همان اولویت بالا، منابع محاسباتی سرور پشتیبان در کار روزمره استفاده می شود. مزیت این روش این است که کاربر دارای یک سیستم بسیار قابل دسترس است (سرور کپی شده است) و در عین حال می تواند از تمامی منابع محاسباتی خوشه استفاده کند. این هزینه کلی سیستم را کاهش می دهد، که به یک واحد قدرت محاسباتی اشاره می شود. برنامه های کاربردی در صورت شکست از دستگاه غیر کارگری به باقی مانده منتقل می شود که البته، عملکرد کلی را تحت تاثیر قرار می دهد. خوشه های "فعال" فعال می توانند تنها به عنوان سیستم های اختصاصی که در آن کارهای کم اولویت نوع نوع پشتیبانی از نوع کار دفتر را اجرا می کنند، وجود داشته باشد. علاوه بر این، هنگام ساخت خوشه ها با یک سرور پشتیبان فعال، می توانید سرورهای تکراری را با دیسک های شخصی خود کپی کنید. در عین حال، لازم است به طور مداوم اطلاعات را از سرور اصلی به پشتیبان گیری کپی کنید - این تضمین می کند که در صورت شکست، سرور پشتیبان داده های مناسب را دارد. از آنجا که داده ها به طور کامل تکرار می شوند، مشتری می تواند به هر سرور دسترسی داشته باشد، که به شما اجازه می دهد تا در مورد تعادل بار در یک خوشه مشابه صحبت کنید. علاوه بر این، گره های چنین خوشه ای را می توان با جغرافیایی جدا کرد، که پیکربندی مقاوم به فاجعه را می سازد. این رویکرد سطح بسیار بالایی از دسترسی را فراهم می کند، اما دارای تعدادی از نقاط ضعف زیر است:

نیاز به دائما کپی داده ها (این بدان معنی است که بخشی از محاسبات و منابع شبکه به طور مداوم در هماهنگ سازی هزینه می شود)؛

حتی سریعترین رابط شبکه بین سرورهای داخل خوشه، تاخیر در انتقال اطلاعات را رد نمی کند، که در نهایت می تواند منجر به عدم انطباق شود، اگر یک سرور شکست خورده باشد، و نه تمام معاملات ساخته شده با دیسک خود را در دیسک سرور دوم منعکس نمی شود.

در یک خوشه بدون جدایی از منابع (شکل 3) سرورها به یک آرایه دیسک متصل می شوند، اما هر یک از آنها کنترل می کنند با مجموعه ای از دیسک ها. در صورت سوء عملکرد در یکی از گره ها، سرور باقی مانده کنترل دیسک های خود را کنترل می کند. این روش نیاز به هماهنگ سازی داده های ثابت بین سرورها را از بین می برد و به این ترتیب محاسبات اضافی و منابع شبکه را منتشر می کند. اما در این پیکربندی، دیسک ها تبدیل به یک نقطه از شکست می شوند، بنابراین، در این مورد، درایو ها با استفاده از تکنولوژی RAID استفاده می شود.

شکل. 3. ساخت یک خوشه بدون منابع مشترک.

در سیستم ها با جداسازی منابع کامل (شکل 4) تمام سرورها در خوشه دسترسی همزمان به همان دیسک را دارند. این رویکرد نشان می دهد که یک نرم افزار با دقت توسعه یافته است که دسترسی چندگانه به یک محیط را فراهم می کند. همانطور که در مورد قبلی، دیسک ها در اینجا می توانند یک نقطه شکست را داشته باشند، بنابراین نیز مطلوب برای استفاده از آرایه های RAID است. در این تجسم، نیاز به هماهنگ سازی داده های ثابت بین سرورها را از بین می برد. بنابراین، محاسبات اضافی و منابع شبکه آزاد می شود.

شکل. 4. ساخت یک خوشه با منابع مشترک.

تمام برنامه های اجرا شده توسط یک خوشه می تواند به صورت مشروط به چندین دسته تقسیم شود. در هر گره خوشه ای، شما می توانید تقریبا هر برنامه متعارف را اجرا کنید. علاوه بر این، یک برنامه مشابه می تواند بر روی گره های خوشه ای مختلف اجرا شود. با این حال، هر کپی از برنامه باید از منابع خود (سیستم فایل) استفاده کند، زیرا سیستم فایل توسط یک گره خاص محافظت می شود. علاوه بر نرم افزار معمول برای خوشه ها، به اصطلاح برنامه های خوشه ای به اصطلاح وجود دارد. چنین برنامه هایی از طریق گره های خوشه توزیع می شود، و بین بخش هایی از برنامه عامل در گره های مختلف، تعامل سازماندهی شده است. برنامه های خوشه ای واقعی به شما این امکان را می دهند که بار خود را بر روی خوشه قرار دهید. موقعیت متوسط \u200b\u200bبرنامه های کاربردی طراحی شده برای کار در یک خوشه. بر خلاف برنامه های خوشه ای واقعی، آن را در آنها با موازی صریح استفاده نمی شود؛ در واقع، این برنامه معمول است، اما می تواند از برخی امکانات خوشه استفاده کند، که عمدتا با مهاجرت منابع همراه است.

تمام راهکارهای خوشه ای در سیستم عامل های مایکروسافت عمدتا به منظور مبارزه با تجهیزات و شکست نرم افزار گرا هستند. نرم افزار ویژه چیزی است که سرورها را در خوشه ترکیب می کند. بسیاری از برنامه های شرکت های بزرگ و سیستم عامل دارای پشتیبانی خوشه ای ساخته شده اند، اما عملکرد بی وقفه و شفافیت خوشه می تواند تنها سطح ویژه ای را در سطح متوسط \u200b\u200bتضمین کند. مسئول است:

برای کار هماهنگ تمام سرورها؛

برای مجوز ناشی از سیستم درگیری،

تشخیص و تنظیم مجدد خوشه پس از شکست را تضمین می کند؛

توزیع بار را از طریق گره های خوشه ای فراهم می کند؛

به رسمیت شناختن بازسازی عملیات سرورهای شکست خورده در گره های موجود (Failover - روش مهاجرت)؛

محیط های سخت افزاری و محیط نرم افزار را نظارت می کند؛

به شما اجازه می دهد هر برنامه ای را بر روی خوشه بدون سازگاری اولیه با معماری سخت افزاری جدید اجرا کنید.

نرم افزار خوشه ای معمولا دارای چندین اسکریپت بازیابی سیستم پیش تعیین شده است و همچنین می تواند مدیر را با توانایی پیکربندی چنین سناریوها ارائه دهد. بازیابی پس از شکست می تواند هر دو برای گره به عنوان یک کل و برای اجزای فردی - برنامه های کاربردی، حجم دیسک، و غیره پشتیبانی شود. این تابع به طور خودکار در مورد شکست سیستم آغاز می شود، و همچنین می تواند توسط مدیر اجرا شود اگر آن را اجرا کنید به عنوان مثال، باید یکی از گره ها برای تنظیم مجدد غیرفعال شود.

راه حل های خوشه ای در سیستم های محاسباتی مدرن علاوه بر افزایش قابلیت اطمینان و سرعت، چندین مورد اضافی ارائه شده است:

آنها باید یک نماینده خارجی را از سیستم ارائه دهند

پشتیبان گیری با سرعت بالا و بازیابی اطلاعات،

دسترسی به موازی به پایگاه داده،

امکان انتقال بار از گره های اضطراری را برای استفاده قابل استفاده،

سطح بالایی از ابزار پیکربندی آمادگی، پس از یک تصادف تضمین می شود.

البته، استفاده از چند گره خوشه ای، که به طور همزمان به داده های مشابه اشاره می کند، پیچیدگی پشتیبان گیری و بهبود پس از آن را افزایش می دهد. انتقال بار از گره اضطراری به سرویس دهنده، مکانیسم اصلی برای اطمینان از کاربرد مداوم برنامه های کاربردی، با استفاده از استفاده بهینه از منابع خوشه ای است. برای موثر همکاری سیستم های خوشه ای و سیستم DBMS باید داشته باشند مدیر قفل توزیع شده، ارائه یک تغییر سازگار در پایگاه داده هنگام درخواست توالی از گره های خوشه ای مختلف. پیکربندی پیکربندی خوشه ای با ارائه همزمان در دسترس بودن برنامه های کاربردی، یک فرایند نسبتا پیچیده است (این به دلیل پیچیدگی تعیین قوانینی است که از آن ها یا سایر برنامه های کاربردی از گره های اورژانس خوشه ای به خوبی منتقل می شود). سیستم خوشه ای موظف است به شما اجازه دهد به راحتی برنامه های کاربردی را از یک گره خوشه به دیگری انتقال دهید و همچنین یک برنامه اضطراری را در گره دیگری بازگردانید. سیستم سیستم لازم نیست بدانید که آن را با یک سیستم خوشه ای کار می کند، بنابراین خوشه باید یک کامپیوتر واحد باشد. این باید یک سیستم فایل واحد برای تمام گره ها، یک آدرس IP واحد و یک هسته سیستم داشته باشد.

قابل اطمینان ترین هستند خوشه های توزیع شده. حتی سیستم های قابل اعتماد ممکن است اگر آتش سوزی، زلزله، سیل یا حمله تروریست ها رخ دهد، شکست خورده است. با مقیاس جهانی کسب و کار مدرن، چنین حوادثی نباید به آن آسیب برساند، بنابراین خوشه ممکن است (یا باید) توزیع شود.

همه نویسندگان شرکت های کامپیوتری (Compaq، Dell، Hewlett-Packard، IBM، Sun Microsystems) راه حل های خوشه ای خود را ارائه می دهد. موقعیت های پیشرو در بخش یونیکس خوشه IBM، که به طور فعال پایگاه داده DB2 خود را ارتقا می دهد، خورشید به طور فعال راه حل خوشه ای خورشید را ترویج می کند. یکی از فعال ترین بازیکنان (هر دو توسط تعداد سیستم عامل های گواهی شده برای خوشه ها و با انواع راه حل های خوشه ای خود) شرکت Compaq را تشخیص می دهد که عملا طیف گسترده ای از خوشه ها را در سیستم عامل های ویندوز برای یک بخش یا یک شاخه از راه دور ارائه می دهد برای برنامه های کاربردی در زیرساخت های شرکت و مراکز بزرگ. پردازش داده ها. محلول خوشه سرور Compaq TrueCluster، الزامات فعلی را برای شرکت ها به این تکنولوژی به حداکثر می رساند. برای مثال، نرم افزار جدید اجازه می دهد تا یک پایگاه داده را در سرورهای متعدد مرتبط با هم بسازیم. برای مثال، نیاز به چنین ارتباطی رخ می دهد، اگر یک ظرف بزرگ مورد نیاز باشد یا نیاز به کاهش زمان بیکاری در صورت شکست در سرور، که با انتقال عملیات به سرور خوشه ای دیگر به دست می آید، کاهش می یابد. این به شما این امکان را می دهد که هزینه های سیستم عامل های سخت افزاری را به طور قابل توجهی کاهش دهید، و آن را به طور اقتصادی خوشه های ساختمانی را از سرورهای معماری استاندارد کم هزینه حتی برای شرکت های نسبتا کوچک استفاده می کنند. Compaq و اوراکل فعالانه در تکنولوژی و کسب و کار همکاری می کنند، که یک پلت فرم پایگاه داده خوشه ای مقیاس پذیر، مدیریت، قابل اعتماد، قابل اعتماد و مقرون به صرفه را ایجاد می کند. علاوه بر این، اوراکل شروع به همکاری با Dell و Sun Microsystems، که مشتریان پیش از پیکربندی شده و سیستم های آزمایش شده با خوشه های اوراکل را ارائه می دهند. به عنوان مثال، دل، نرم افزار خوشه ای را بر روی سرورهای آزمایش شده با ویندوز و لینوکس ارائه می دهد.

در بازار سیستم های شرکت ها، خوشه ها یکی از نقش های کلیدی را بازی می کنند. در بسیاری از موارد، راه حل های خوشه ای به سادگی هیچ جایگزینی ارزشمند ندارند. در دسترس بودن بالا و مقیاس پذیری گسترده سیستم های اطلاعات خوشه ای، به آنها اجازه می دهد تا با موفقیت به کار خود ادامه دهند و با نیازهای روزافزون، قدرت محاسباتی پلت فرم را با یک شرکت مبتنی بر هزینه قابل قبول افزایش می دهد.

خوشه (گروهی از کامپیوترها)

خوشه های توزیع بار

اصل عمل آنها بر اساس توزیع درخواست ها از طریق یک یا چند گره ورودی است که آنها را به پردازش به گره های باقیمانده و محاسبات هدایت می کند. هدف اولیه چنین خوشه ای بهره وری است، اما روش هایی که قابلیت اطمینان را افزایش می دهند نیز در آنها استفاده می شود. سازه های مشابه مزارع سرور نامیده می شوند. نرم افزار (نرم افزار) می تواند هر دو تجاری (OpenVMS، Mosix، پلت فرم LSF HPC، Cluster Solaris، Soite Cluster Moui، Maui Cluster Scheduler) و رایگان (OpenMosix، موتور شبکه خورشیدی، سرور مجازی لینوکس) باشد.

خوشه های محاسباتی

خوشه ها در اهداف محاسباتی، به ویژه در تحقیقات علمی مورد استفاده قرار می گیرند. برای محاسبه خوشه ها، شاخص های قابل توجهی، عملکرد بالا پردازنده در عملیات بیش از تعداد نقطه شناور (FLOPS) و تاخیر کم شبکه ترکیبی و کمتر قابل توجه است - سرعت عملیات I / O، که برای پایگاه های داده و وب مهم تر است خدمات. خوشه های محاسباتی امکان کاهش زمان محاسبه را کاهش می دهند، در مقایسه با یک کامپیوتر واحد، شکستن وظیفه به شاخه های موازی که توسط داده های اتصال مبادله می شوند. یکی از پیکربندی های معمول مجموعه ای از رایانه های جمع آوری شده از اجزای عمومی موجود با نصب بر روی آنها است. سیستم عامل لینوکس، و اترنت مرتبط، Myrinet، Infiniband شبکه یا دیگر شبکه های نسبتا ارزان قیمت. این سیستم معمول است که به نام خوشه Beowulf نامیده می شود. به طور خاص خوشه های با کارایی بالا را تخصیص می دهد (انگلیسی با اختصار نشان داده شده است خوشه HPC. - خوشه کامپوننت با عملکرد بالا) فهرست رایانه های قدرتمند قدرتمند (همچنین می تواند توسط اختصار نشان داده شود HPC) شما می توانید در رتبه بندی جهانی TOP500 پیدا کنید. روسیه دارای رتبه بندی قدرتمندترین کمدرهای CIS است.

سیستم های محاسباتی توزیع شده (شبکه)

چنین سیستم هایی خوشه ای نیستند، اما اصول آنها عمدتا شبیه به تکنولوژی خوشه ای هستند. آنها همچنین سیستم های شبکه ای نامیده می شوند. تفاوت اصلی این است که دسترسی کم هر گره، یعنی عدم توانایی تضمین عملیات آن در یک نقطه مشخص در زمان (گره ها متصل و قطع شده در طول عملیات)، بنابراین وظیفه باید به تعدادی از فرآیندهای مستقل تقسیم شود از یکدیگر. چنین سیستم، در مقایسه با خوشه ها، شبیه به یک کامپیوتر واحد نیست و به عنوان یک ابزار ساده برای توزیع محاسبات عمل می کند. بی ثباتی پیکربندی، در این مورد، توسط تعداد زیادی از گره ها جبران می شود.

سرورهای خوشه ای برنامه ریزی را سازماندهی کردند

سیستم های خوشه ای یک مکان ارزشمند را در لیست سریعترین قرار می دهند، در حالی که به طور قابل توجهی برنده ابر رایانه ها در قیمت می شوند. برای ژوئیه 2008، رتبه هفتم امتیاز TOP500، خوشه ICE 8200 SGI Altix (Chippewa Falls، ویسکانسین، ایالات متحده آمریکا) است.

یک جایگزین نسبتا ارزان برای ابر رایانه ها، خوشه های مبتنی بر مفاهیم Beowulf، که از رایانه های معمولی ارزان قیمت بر اساس نرم افزار رایگان ساخته شده اند، خوشه هستند. یکی از نمونه های عملی این سیستم، SouperComputer Stone (UAC Ridge، تنسی، ایالات متحده آمریکا) است.

بزرگترین خوشه متعلق به شخص خصوصی (از 1000 پردازنده) توسط جان کوزا (جان کوزا) ساخته شد.

تاریخ

تاریخچه خلقت خوشه ای به طور جداگانه با پیشرفت های اولیه در زمینه شبکه های کامپیوتری ارتباط دارد. یکی از دلایل ظهور ارتباطات با سرعت بالا بین رایانه ها امیدوار است که ترکیب منابع محاسباتی را ترک کند. در اوایل دهه 1970 تیم توسعه پروتکل پروتکل TCP / IP و آزمایشگاه Xerox PARC استانداردهای تعامل شبکه را تعیین می کنند. سیستم عامل هیدرا ("Hydra") برای رایانه های PDP-11 ساخته شده توسط DEC ظاهر شد، که بر این اساس ایجاد شده بود، خوشه به نام C.MPP (پیتسبورگ، رایانه های شخصی Pennsylvania، USA) نامیده می شود. با این حال، تنها در نزدیکی شهر، مکانیزم ها ایجاد شده است، اجازه می دهد تا از توزیع وظایف و فایل ها از طریق شبکه استفاده شود، به طور عمده این در حال توسعه در Sunos (سیستم عامل مبتنی بر BSD از Sun Microsystems) بود.

اولین پروژه خوشه تجاری ARCNET بود که توسط Datapoint در سود ایجاد شده بود، او نتوانست، و بنابراین ساخت خوشه ها قبل از شهر توسعه نیافت، زمانی که DEC بر اساس سیستم عامل VMS / VMS ساخته شده است. ARCNET و VAXCLUSTER نه تنها برای محاسبات مشترک، بلکه به اشتراک گذاری سیستم فایل و حاشیه، با توجه به حفظ یکپارچگی و منحصر به فرد بودن داده ها طراحی شده بودند. Vaxcluster (به نام در حال حاضر vmscluster) - یک جزء یکپارچه از سیستم عامل OpenVMS با استفاده از پردازنده های آلفا و ایتانیوم است.

دو محصول دیگر خوشه ای که به رسمیت شناختن دریافت کرده اند عبارتند از: Tandem Hymalaya (، کلاس HA و IBM S / 390 موازی Sysplex (1994).

تاریخچه خوشه های رایانه های شخصی معمولی به طور عمده مورد نیاز است تا دستگاه مجازی موازی را طراحی کند. در این نرم افزار، برای ترکیب رایانه ها در یک ابر رایانه مجازی امکان ایجاد خوشه های فوری را باز کرد. در نتیجه، عملکرد کلی تمام خوشه های ارزان قیمت ایجاد شد و سپس مجموع ظرفیت های سیستم های تجاری جدی را از بین برد.

ایجاد خوشه ها بر اساس رایانه های شخصی ارزان قیمت توسط یک شبکه داده، در شهر آژانس هوافضا آمریکایی (ناسا) ادامه یافت، سپس توسعه خوشه های Beowulf به طور خاص بر اساس این اصل توسعه یافت. موفقیت های این سیستم ها، توسعه شبکه های شبکه را تحت فشار قرار داد که از زمان ایجاد یونیکس وجود داشت.

نرم افزار

یک ابزار به طور گسترده ای برای سازماندهی یک تعامل بیش از حد، کتابخانه MPI پشتیبانی از زبان ها و فورتان است. برای مثال، در برنامه مدل سازی آب و هوا MM5 استفاده می شود.

سیستم عامل Solaris نرم افزار Cluster Solaris را فراهم می کند که برای اطمینان از دسترسی بالا و شکستن کاربر سرورهای در حال اجرا Solaris استفاده می شود. برای opensolaris یک تحقق وجود دارد متن باز تحت عنوان OpenSolaris Ha Cluster..

برنامه های متعدد در میان کاربران گنو / لینوکس محبوب هستند:

distcc، Mpich، و غیره - ابزار تخصصی برای برنامه های مشابه. Distcc به تدوین موازی در مجموعه کامپایلر GNU اجازه می دهد.
سرور مجازی لینوکس، نرم افزار Linux-Ha - Node برای توزیع پرس و جو بین سرورهای محاسباتی.
Mosix، OpenMosix، Kerrisged، OpenSSI - محیط های خوشه ای کامل ساخته شده به هسته به طور خودکار توزیع وظایف بین گره های همگن. OpenSSI، OpenMosix و KERRISHED CREATE بین گره ها

مکانیزم های خوشه ای برنامه ریزی شده در هسته Dragonfly BSD، که در سال 2003 از FreeBSD 4.8 شاخه شده اند، جاسازی شده اند. در برنامه های دور نیز آن را تبدیل به چهارشنبه یک سیستم عامل واحد.

مایکروسافت توسط یک خوشه HA برای سیستم عامل ویندوز تولید می شود. اعتقاد بر این است که آن را بر اساس تکنولوژی شرکت تجهیزات دیجیتال، پشتیبانی از 16 (از سال 2010) گره ها در یک خوشه، و همچنین کار بر روی شبکه SAN (شبکه منطقه ذخیره سازی). مجموعه API برای پشتیبانی از برنامه های توزیع شده مورد استفاده قرار می گیرد، برای کار با برنامه هایی که برای کار در خوشه ارائه نمی شوند، وجود دارد.

Compute Windows Cluster Server 2003 (CCS) منتشر شده در ژوئن 2006 برای برنامه های کاربردی پیشرفته ای که نیاز به محاسبات خوشه ای دارند طراحی شده است. این نشریه برای استقرار در انواع کامپیوترهای مختلف طراحی شده است که در یک خوشه جمع آوری شده برای دستیابی به ظرفیت های ابر رایانه ای است. هر خوشه ای در سرور Compute Compute Compute Server شامل یک یا چند دستگاه کنترل است که وظایف را توزیع می کند و چندین ماشین زیرین که عملیات اصلی را انجام می دهند، توزیع می شود. در نوامبر 2008، ویندوز HPC Server 2008 برای جایگزینی سرور Cluster Cluster 2003 طراحی شده است.

بخش 29 "مدیریت سیستم های هوشمند"

خلاصه در موضوع:

سیستم های خوشه ای

انجام:

گروه دانشجویی K9-292.

popov i.a.

مسکو 2001.

1. مقدمه

2. کلاس های پایه کامپیوترهای موازی مدرن

3. معماری خوشه ای کامپیوترهای موازی

4. اهداف ایجاد سیستم های خوشه ای

5. خوشه های شکست خورده

6. خوشه های با کارایی بالا

7. پروژه Beowulf.

8. نتیجه گیری

9. ادبیات

معرفی

توسعه سیستم های محاسبات چند پردازنده

توسعه معماری های سنتی برای ساخت سیستم های محاسباتی مانند SMP، MPP، سیستم های موازی بردار به سرعت به سرعت می رسد. افزایش بهره وری افزایش می یابد، قابلیت اطمینان و تحمل خطا افزایش می یابد. با این حال، این معماری ها یک مزیت دارند - هزینه های سیستم های ایجاد شده، گاهی اوقات برای بسیاری از کاربران این سیستم ها - سازمان های آموزشی و تحقیقاتی غیرقابل دسترسی هستند. این به دلیل عوارض سختافزاری و نرم افزارهای نرم افزاری سیستم بسیار بالا است که مورد نیاز برای ارائه چنین میزان رشد بهره وری است. با این حال، نیاز به منابع محاسباتی در حال حاضر در بسیاری از زمینه های فعالیت های علمی و عملی بسیار زیاد است و منابع سیستم های Supercomputter سنتی را ندارند.

سیستم های خوشه ای به عنوان یک راه حل ارزان تر به مشکل کمبود منابع محاسباتی بوجود آمد و بر اساس استفاده از فن آوری های گسترده و نسبتا ارزان در معماری خود، سخت افزار و نرم افزار، مانند PC، اترنت، لینوکس، و غیره استفاده از تکنولوژی توده ای در سیستم های خوشه ای به دلیل پیشرفت قابل توجهی در توسعه اجزای سیستم های محاسباتی معمولی مانند پردازنده های مرکزی، سیستم عامل ها، رسانه های ارتباطی امکان پذیر است.

از آنجا که سیستم های خوشه ای معماری هستند، توسعه سیستم هایی با MPP موازی توده ای، نقش اصلی در توسعه آنها پیشرفت در زمینه فن آوری های شبکه است. تا به امروز، ارزان، اما راه حل های ارتباطی موثر ظاهر شد. این از پیش تعیین شده ظاهر سریع و توسعه سیستم های محاسبات خوشه ای است. عوامل دیگر نیز به پیشرفت توسعه سیستم های خوشه ای کمک می کنند.

عملکرد رایانه های شخصی بر اساس پردازنده های اینتل نیز در سال های اخیر به طور قابل توجهی افزایش یافته است. چنین رایانه ها شروع به ایجاد رقابت جدی به ایستگاه های کاری بر اساس پردازنده های گرانقیمت و قدرتمند RISC کردند. در عین حال، آن را به دست آوردن محبوبیت افزایش محبوبیت لینوکس - رایگان نسخه یونیکس توزیع شده است. در همان زمان، در سازمان های علمی و دانشگاه ها، که بیشتر سیستم های خوشه ای به عنوان یک قاعده توسعه یافته است، متخصصان در سیستم عامل لینوکس وجود دارد.

درجه بالایی از توسعه سیستم های خوشه ای بر اساس تاریخ نشان می دهد این واقعیت را نشان می دهد که در فهرست قدرتمندترین سوپر رایانه های جهان TOP500 - 11 تاسیسات خوشه ای فهرست شده است.

کلاس های پایه کامپیوترهای موازی مدرن

سیستم های خوشه ای توسعه سیستم های موازی هستند. برای ایجاد مکان های خوشه ای در میان سایر انواع معماری های موازی سیستم های محاسباتی، باید طبقه بندی خود را ارائه دهید. سیستم های موازی را می توان با معیارهای مختلف طبقه بندی کرد.

از نقطه نظر سخت افزاری، پارامتر اصلی طبقه بندی کامپیوترهای موازی، دسترسی عمومی (SMP) یا حافظه توزیع شده (MPP) است. چیزی که متوسط \u200b\u200bبین SMP و MPP معماری NUMA است، جایی که حافظه فیزیکی توزیع شده است، اما منطقی قابل دسترسی است.

سیستم های چند پردازنده متقارن

SMP سیستم شامل چندین پردازنده همگن و یک آرایه حافظه عمومی است. یکی از روش های SMP اغلب استفاده شده به شکل گیری یک سیستم حافظه قابل تقسیم، حافظه عمومی، شامل یک سازمان دسترسی به حافظه یکنواخت با سازماندهی یک کانال پردازنده حافظه مقیاس پذیر است:

هر عملیات دسترسی به حافظه به عنوان یک معامله بر روی اتوبوس حافظه پردازنده تفسیر می شود. انسجام کش با سخت افزار حفظ می شود.

در SMP، هر پردازنده دارای حداقل یک حافظه حافظه پنهان خود (و شاید چند).

می توان گفت که سیستم SMP یک کامپیوتر با چند پردازنده مساوی است. هر چیز دیگری در یک نمونه است: یک حافظه، یک زیر سیستم I / O، یک سیستم عامل. کلمه "برابر" به این معنی است که هر پردازنده می تواند همه چیز را انجام دهد. هر پردازنده دسترسی به تمام حافظه دارد، می تواند عملیات ورودی / خروجی را انجام دهد، پردازنده های دیگر را قطع کند، و غیره

ضرر این معماری نیاز به سازماندهی پردازنده های پردازنده کانال با پهنای باند بسیار بالا است.

سیستم های عظیم موازی

سیستم MPP موبایل عظیم شامل گره های محاسباتی همگن است، از جمله:

یکی یا بیشتر پردازنده های مرکزی (معمولا RISC)
حافظه محلی (دسترسی مستقیم به حافظه گره های دیگر غیر ممکن است)
پردازنده ارتباطات یا آداپتور شبکه
هارد دیسک هارد و / یا سایر دستگاه های موجود در /

اجزای ویژه I / O ویژه و گره های کنترل را می توان به سیستم اضافه کرد. گره ها از طریق برخی از محیط های ارتباطی (شبکه با سرعت بالا، سوئیچ، و غیره) مرتبط هستند

سیستم های دسترسی غیر یکنواخت به حافظه NUMA

NUMA (دسترسی به حافظه غیرمجاز) بر خلاف SMP معمول معماری حافظه مشترک چندین پردازنده جداگانه است که هر کدام علاوه بر حافظه پنهان خود نیز دارای حافظه محلی هستند:

در چنین معماری، ماژول های پردازنده و حافظه به شدت یکپارچه می شوند، بنابراین سرعت دسترسی به حافظه محلی بسیار بالاتر از حافظه پردازنده "مجاور" است. زیرسیستم های I / O می توانند بخشی از هر گره باشند یا بر روی گره های انتخاب شده I / O انتخاب شوند. اگر انسجام کش در سراسر سیستم حفظ شود، چنین معماری CC-NUMA نامیده می شود.

ساده ترین راه برای توصیف سیستم NUMA، ارائه یک سیستم بزرگ SMP، به چندین بخش تقسیم شده است، این قطعات با بزرگراه ارتباطات متصل به لاستیک های سیستم همراه است، و هر بخش شامل حافظه پایه خود و زیرسیستم ورودی / خروجی است. این NUMA: SMP بزرگ، شکسته به مجموعه ای از SMP های کوچکتر و ساده است. مشکل اصلی NUMA برای اطمینان از انسجام کش است. این تجهیزات به شما اجازه می دهد تا با تمام دستگاه های جداگانه ای از حافظه اصلی اجزای سیستم (معمولا گره ها نامیده می شود) به عنوان یک حافظه غول پیکر کار کنید.

معماری خوشه ای

محل معماری خوشه ای سیستم های محاسباتی را در این طبقه بندی در نظر بگیرید.

خوشه مجموعه ای گره خورده از رایانه های کامل است که به عنوان یک منبع واحد استفاده می شود. تحت مفهوم "کامپیوتر کامل کامل" یک سیستم کامپیوتری کامل است که برای عملیات آن مورد نیاز است، از جمله پردازنده ها، حافظه، سیستم های I / O، و همچنین سیستم عامل، زیر سیستم ها، برنامه ها و غیره مورد نیاز است. معمولا رایانه های شخصی یا سیستم های موازی که می توانند معماری SMP داشته باشند و حتی NUMA برای این مناسب باشند. خوشه ها سیستم های ضعیف از دست رفته هستند، لینک های گره توسط یکی از فن آوری های شبکه استاندارد (Fast / Gigabit Ethernet، Myrinet) بر اساس معماری اتوبوس یا سوئیچ استفاده می شود. بنابراین، آنها در ساخت و ساز اصلاح معماری MPP ارزان تر هستند.

معماری خوشه ای کامپیوترهای موازی

اصول کلی

همانطور که قبلا ذکر شد، خوشه محاسباتی مجموعه ای از رایانه هایی است که در یک شبکه خاص ترکیب شده اند تا یک کار را حل کنند (شکل 3)، که برای کاربر به عنوان یک منبع واحد ارسال می شود. چنین مفهوم خوشه ای برای اولین بار پیشنهاد شده و در اوایل دهه 80 شرکت های دیجیتال شرکت ارائه شده است، که تا به امروز این تکنولوژی را توسعه می دهد

مفهوم "منبع یکپارچه" به معنای دسترسی نرم افزاری است که به شما امکان می دهد کاربران، مدیران و برنامه های کاربردی را به شما می دهد تا فرض شود که تنها یک نهاد وجود دارد که آنها کار می کنند، خوشه ای است. به عنوان مثال، سیستم پردازش بسته بندی خوشه اجازه می دهد تا شما را به یک کار برای پردازش خوشه ارسال، و نه برخی از کامپیوتر جداگانه. یک مثال پیچیده تر سیستم های پایگاه داده است. تقریبا تمام تولید کنندگان سیستم های پایگاه داده دارای نسخه های عملیاتی در حالت موازی در چند ماشین خوشه ای هستند. به عنوان یک نتیجه از برنامه با استفاده از پایگاه داده، مراقبت از جایی که کار آنها انجام می شود. DBMS مسئول هماهنگ سازی عمل موازی و حفظ یکپارچگی پایگاه داده است.

کامپیوترهایی که خوشه را تشکیل می دهند، گره های خوشه ای به اصطلاح هستند - همیشه نسبتا مستقل هستند، که اجازه می دهد تا هر یک از آنها را متوقف کند یا هر یک از آنها را برای انجام کار پیشگیرانه یا نصب تجهیزات اضافی بدون اختلال عملکرد کل خوشه، متوقف کند.

به عنوان گره های محاسباتی در خوشه، رایانه های شخصی تک پردازنده معمولا استفاده می شود، سرورهای SMP دو یا چهار پردازنده. هر گره کپی خود را از سیستم عامل اجرا می کند، که اغلب توسط سیستم عامل های استاندارد استفاده می شود: لینوکس، NT، Solaris و غیره ترکیب و قدرت گره ها می تواند حتی در همان خوشه ای متفاوت باشد، که امکان ایجاد سیستم های غیرمستقیم را فراهم می کند. انتخاب یک محیط ارتباطی خاص توسط بسیاری از عوامل تعیین می شود: ویژگی های کلاس از وظایف حل شده، نیاز به گسترش خوشه های بعدی و غیره امکان پذیر است که رایانه های تخصصی را در پیکربندی، مانند یک سرور فایل فعال کنید، و به عنوان یک قانون، امکان دسترسی از راه دور به خوشه از طریق اینترنت ارائه شده است.

از تعریف معماری سیستم های خوشه ای این است که شامل طیف گسترده ای از سیستم ها می شود. با توجه به نقاط افراطی، خوشه را می توان به عنوان یک جفت کامپیوتر متصل شده توسط اترنت شبکه 10 مگابایتی محلی و سیستم محاسباتی ایجاد شده به عنوان بخشی از پروژه کولنت در آزمایشگاه ملی Sandia: 1400 ایستگاه کاری مبتنی بر پردازنده های آلفا مرتبط با یک شبکه با سرعت بالا myrinet.

بنابراین می توان دید که بسیاری از گزینه های ساخت خوشه ای مختلف وجود دارد. در عین حال، فن آوری ها و استانداردهای ارتباطی مورد استفاده در معماری خوشه ای اهمیت زیادی دارند. آنها تا حد زیادی تعیین طیف وسیعی از وظایف، که برای آن دسته از خوشه های ساخته شده بر اساس این فن آوری ها می تواند مورد استفاده قرار گیرد.

فن آوری های ارتباطی برای ساخت خوشه ها

خوشه ها می توانند بر اساس تایرهای انتقال داده های با سرعت بالا و بر اساس فن آوری های شبکه های توده ای ایستاده باشند. در میان استانداردهای ارتباطات جمعی در حال حاضر اغلب توسط شبکه اترنت یا بیشتر از گزینه تولید آن - اترنت سریع، به عنوان یک قاعده، بر اساس سوئیچ ها استفاده می شود. با این حال، گزارش های سربار بزرگ برای ارسال پیام ها در اترنت سریع، منجر به محدودیت های جدی در مورد طیف وسیعی از وظایف می شود که می تواند به طور موثر بر روی چنین خوشه ای حل شود. اگر یک خوشه نیاز به عملکرد عالی و قابلیت انعطاف پذیری داشته باشد، لازم است از سرعت و فن آوری های تخصصی استفاده کنید. این شامل SCI، Myrinet، Clan، ServerNet، و غیره ویژگی های مقایسه ای این فن آوری ها در داده می شود
میز 1.

			servernet	اترنت سریع
افتتاحیه (MPI)
پهنای باند (MPI)				180 مگابایت بر سی
پهنای باند (سخت افزار)	400 مگابایت بر سی	160 مگابایت بر سی	150 مگابایت بر سی		12.5 MB / c
پیاده سازی MPI		HPVM، MPICH-GM و غیره

میز 1.

عملکرد شبکه های ارتباطی در سیستم های خوشه ای توسط چندین ویژگی عددی تعیین می شود. ویژگی های اصلی این دو عبارتند از: تاخیر - زمان تأخیر اولیه هنگام ارسال پیام ها و پهنای باند شبکه، که سرعت انتقال اطلاعات را از طریق کانال های ارتباطی تعیین می کند. در عین حال، بسیاری از ویژگی های پیک وجود ندارد که در استاندارد به عنوان واقعی، به عنوان مثال در سطح برنامه های کاربردی MPI به دست آمده است. به طور خاص، پس از به چالش کشیدن توسط کاربر ارسال یک پیام ارسال ()، پیام به طور مداوم از طریق مجموعه ای از لایه های تعیین شده توسط ویژگی های سازمان نرم افزار و تجهیزات، قبل از خروج از پردازنده عبور می کند - بنابراین برنامه ریزی قابل توجهی وجود دارد استانداردهای ارزش تاخیر. حضور تأخیر منجر به این واقعیت می شود که حداکثر نرخ انتقال بیش از شبکه را نمی توان بر روی پیام ها با طول کوچک به دست آورد.

سرعت انتقال داده ها از طریق شبکه در فناوری سریع اترنت و مقیاس پذیری قابل انعطاف پذیر (SCI) بستگی به طول پیام دارد. برای اترنت سریع، انواع مختلفی از زمان تاخیر مشخص می شود - 160-180 میکروگرم، در حالی که زمان تأخیر برای SCI مقدار حدود 5.6 میکروتر است. حداکثر سرعت انتقال برای این فن آوری های مشابه 10 mb / c و 80 mb / s به ترتیب.

اهداف برای ایجاد سیستم های خوشه ای

توسعه دهندگان معماری سیستم خوشه ای هنگام ایجاد آنها اهداف مختلفی را بررسی کرده اند. اولین تجهیزات دیجیتال با خوشه های VMS / VMS بود. هدف از ایجاد این ماشین بهبود قابلیت اطمینان سیستم، اطمینان از دسترسی بالا و تحمل خطا از سیستم است. در حال حاضر، معماری سیستم مشابهی از سایر تولید کنندگان وجود دارد.

هدف دیگر ایجاد سیستم های خوشه ای، ایجاد سیستم های محاسباتی با کارایی ارزان قیمت است. یکی از اولین پروژه هایی که به یک کلاس کامل از سیستم های موازی نام داد - خوشه Beowulf - در مرکز مرکز پرواز فضایی ناسا گودارد برای حمایت از منابع محاسباتی لازم برای پروژه های علوم زمین و علوم فضایی آغاز شد. پروژه Beowulf در تابستان سال 1994 آغاز شد و به زودی یک خوشه 16 پردازش در پردازنده های اینتل 486DX4 / 100 MHz مونتاژ شد. هر گره 16 مگابایت رم و 3 آداپتور اترنت شبکه نصب شد. این سیستم در ارتباط با قیمت / عملکرد بسیار موفق بود، بنابراین چنین معماری شروع به توسعه و به طور گسترده ای در سایر سازمان های علمی و موسسات آغاز کرد.

برای هر کلاس خوشه ها، معماری ها و سخت افزار مورد استفاده قرار می گیرند. آنها را در جزئیات بیشتر در نظر بگیرید.

خوشه های شکست خورده

اصول ساخت و ساز

برای اطمینان از قابلیت اطمینان و تحمل خطا از سیستم های محاسباتی، بسیاری از راه حل های سخت افزاری و نرم افزاری مختلف اعمال می شود. به عنوان مثال، در سیستم، همه افراد تحت شکست قرار می گیرند - منبع تغذیه، پردازنده ها، حافظه عملیاتی و خارجی می تواند تکرار شود. چنین سیستم های تحمل خطا با رزرو اجزاء برای حل مشکلات مورد استفاده قرار می گیرند که در آن اعتبار کافی از سیستم های محاسباتی متعارف به اندازه کافی ارزیابی نمی شود در حال حاضر احتمال عملیات بدون دردسر 99٪ است. این وظایف نیاز به احتمال 99.999٪ و بالاتر دارد. چنین قابلیت اطمینان را می توان با استفاده از روش های مختلف افزایش تحمل خطا به دست آورد. بسته به سطح آمادگی سیستم محاسبات، چهار نوع قابلیت اطمینان برای استفاده اختصاص داده می شود:

سطح آمادگی،٪	حداکثر خرابی	نوع سیستم
	3.5 روز در سال	مرسوم)
	8.5 ساعت در سال	دقت بالا (در دسترس بودن بالا)
	1 ساعت در سال	گسل انعطاف پذیر)
	5 دقیقه در سال	خطاپذيري)

جدول 2

در مقایسه با سیستم های تحمل خطا با اجزای اضافی، و همچنین انواع مختلف چند پردازش، خوشه ها ماشین های نسبتا مستقل را ترکیب می کنند، هر کدام می توانند برای پیشگیری یا تنظیم مجدد متوقف شوند، بدون شکستن ظرفیت کاری خوشه به طور کلی. عملکرد خوشه ای بالا و به حداقل رساندن خرابی برنامه به دلیل این واقعیت است که:

در صورت خرابی قدرت در یکی از گره ها، این نرم افزار همچنان به کار می رود یا به طور خودکار در سایر گره های خوشه ای دوباره راه اندازی می شود؛
شکست یکی از گره ها (یا چند) منجر به فروپاشی کل سیستم خوشه نمی شود؛
پیشگیرانه I. تعمیر کار، تنظیم مجدد یا تغییر نسخه های نرم افزاری، به عنوان یک قاعده، می تواند در گره های خوشه به طور متناوب انجام شود، بدون وقفه عملیات گره های دیگر.

بخشی جدایی ناپذیر از خوشه یک نرم افزار ویژه است که در واقع، مشکل بازیابی گره را در صورت شکست حل می کند و همچنین وظایف دیگر را حل می کند. نرم افزار خوشه ای معمولا دارای چندین اسکریپت بازیابی سیستم پیش تعیین شده است و همچنین می تواند مدیر را با توانایی پیکربندی چنین سناریوها ارائه دهد. بازیابی پس از شکست می تواند هر دو برای گره به عنوان یک کل و برای اجزای فردی - برنامه های کاربردی، حجم دیسک، و غیره پشتیبانی می شود این ویژگی به طور خودکار در مورد یک شکست سیستم آغاز می شود، و همچنین می تواند توسط مدیر اجرا شود، اگر آن، برای مثال، لازم است که یکی از گره ها را برای تنظیم مجدد تغییر دهید.

خوشه ها ممکن است حافظه مشترک داشته باشند دیسک های خارجیمعمولا در آرایه دیسک RAID. آرایه دیسک RAID Serverstem سرور I / O برای ذخیره سازی داده های بزرگ است. که در آرایه های حمله تعداد قابل توجهی از دیسک ها نسبت به ظرفیت کم برای ذخیره مقادیر زیادی از داده ها و همچنین ارائه قابلیت اطمینان و افزونگی بالاتر استفاده می شود. یک آرایه مشابه توسط یک کامپیوتر به عنوان یک دستگاه منطقی درک می شود.

بازیابی پس از شکست می تواند هر دو برای گره به عنوان یک کل و برای اجزای فردی - برنامه های کاربردی، حجم دیسک، و غیره پشتیبانی می شود این ویژگی به طور خودکار در مورد یک شکست سیستم آغاز می شود، و همچنین می تواند توسط مدیر اجرا شود، اگر آن، برای مثال، لازم است که یکی از گره ها را برای تنظیم مجدد تغییر دهید.

گره های خوشه کنترل عملکرد یکدیگر و تبادل اطلاعات "خوشه" خاص، به عنوان مثال، یک پیکربندی خوشه ای، و همچنین داده های انتقال بین درایوهای مشترک و هماهنگی استفاده از آنها را کنترل می کنند. کنترل راهنما با استفاده از یک سیگنال ویژه انجام می شود که گره های خوشه ای یکدیگر را به منظور تایید عملکرد عادی خود انتقال می دهند. خاتمه سیگنال ها از یکی از خوشه های سیگنال گره ها نرم افزار در مورد تصادف و نیاز به توزیع بار در گره های باقی مانده. به عنوان مثال، یک Vax / VMS خوشه ای مقاوم به خطا را در نظر بگیرید.

خوشه VMS / VMS

اولین دسامبر، مفهوم یک سیستم خوشه ای را در سال 1983 اعلام کرد، تعیین آن به عنوان یک گروه از ماشین های کامپیوتری ترکیبی، که یک واحد پردازش اطلاعات واحد است. اساسا، خوشه VAX یک سیستم چند منظوره ضعیف همراه با یک حافظه خارجی معمولی است که مکانیسم مدیریت و مدیریت را فراهم می کند.

خوشه Vax دارای خواص زیر است:

جداسازی منابع کامپیوترهای VAX در یک خوشه می توانند دسترسی به نوار به اشتراک گذاشته شده و درایوهای دیسک را به اشتراک بگذارند. تمام کامپیوترهای VAX در خوشه می توانند فایل های داده جداگانه را به صورت محلی دسترسی پیدا کنند.

آمادگی بالا اگر یکی از رایانه های VAX نتواند، وظایف کاربران آن می تواند به طور خودکار به کامپیوتر خوشه ای دیگر منتقل شود. اگر چندین کنترل کننده HSC در سیستم وجود داشته باشد و یکی از آنها رد شود، دیگر کنترل کننده های HSC به طور خودکار عملیات خود را انتخاب می کنند.

کارایی بالا . تعدادی از سیستم های کاربردی می توانند از امکان اجرای موازی وظایف در رایانه های چند خوشه استفاده کنند.

راحتی تعمیر سیستم . پایگاه داده های مشترک را می توان از یک مکان واحد خدمت کرد. برنامه های کاربردی را می توان تنها یک بار در دیسک های خوشه ای رایج نصب کرد و بین تمام کامپیوترهای خوشه ای تقسیم می شود.

گسترش پذیری . افزایش قدرت محاسبات خوشه ای با اتصال کامپیوترهای اضافی VAX به آن به دست می آید. درایوهای اضافی در دیسک های مغناطیسی و نوار مغناطیسی در دسترس همه رایانه های موجود در خوشه قرار می گیرند.

عمل خوشه VAX توسط دو جزء اصلی تعیین می شود. مولفه اول یک مکانیسم ارتباطی با سرعت بالا است و دوم نرم افزار سیستم است که مشتریان را با دسترسی شفاف به سرویس سیستم فراهم می کند. از لحاظ جسمی در داخل خوشه استفاده می شود با استفاده از سه تکنولوژی مختلف تایر با ویژگی های مختلف کارایی.

روش های ارتباطی پایه در خوشه VAX در شکل. چهار.

شکل. 4 VAX / VMS خوشه

اتوبوس کامپیوتر CI (Interconnect کامپیوتر) با سرعت 70 مگابیت بر ثانیه اجرا می شود و برای اتصال کامپیوترهای VAX و کنترل کننده های HSC با استفاده از سوئیچ کوپلر ستاره استفاده می شود. هر اتصال CI دارای دو خط اضافی، دو برای انتقال و دو برای دریافت، استفاده از تکنولوژی CSMA Basic، که از تاخیر خاصی برای این گره استفاده می کند تا از بین برود. حداکثر طول ارتباط CI 45 متر است. سوئیچ ستاره ای ستاره کوپلر می تواند پشتیبانی از اتصال تا 32 تایر CI، که هر کدام از آنها برای اتصال کامپیوتر VAX یا کنترل کننده HSC طراحی شده است. کنترل کننده HSC یک دستگاه هوشمند است که عملکرد درایوهای دیسک و نوار را کنترل می کند.

کامپیوترهای VAX را می توان به یک خوشه نیز از طریق یک شبکه محلی ترکیب کرد.

اترنت با استفاده از اتصال Ni-network (به اصطلاح خوشه های محلی VAX)، اما عملکرد این سیستم ها نسبتا کم است به دلیل نیاز به به اشتراک گذاشتن پهنای باند شبکه اترنت بین رایانه های خوشه ای و سایر مشتریان شبکه.

همچنین خوشه ها می توانند هزینه های DSSI (سیستم ذخیره سازی دیجیتال اتصال) را هزینه کنند. در اتوبوس DSSI می تواند به چهار کامپیوتر VAX پایین و طبقه متوسط \u200b\u200bترکیب شود. هر کامپیوتر می تواند چندین آداپتور DSSI را پشتیبانی کند. یک اتوبوس DSSI جداگانه با سرعت 4 مگابایت بر ثانیه (32 مگابیت بر ثانیه) عمل می کند و به شما امکان اتصال به 8 دستگاه را می دهد. انواع دستگاه های زیر پشتیبانی می شوند: آداپتور سیستم DSSI، کنترل کننده دیسک سری RF و کنترل کننده روبان سری TF. DSSI فاصله بین گره ها را در خوشه 25 متر محدود می کند.

نرم افزار سیستم نرم افزار Vax

برای تضمین تعامل صحیح پردازنده ها با یکدیگر، هنگام دسترسی به منابع به اشتراک گذاشته شده، مانند دیسک ها، DEC از یک مدیر قفل DLM توزیع شده (مدیر قفل توزیع شده) استفاده می کند. بسیار یک تابع مهم DLM این است که یک حالت منسجم از حافظه های دیسک را برای عملیات I / O سیستم عامل و برنامه های کاربردی ارائه دهد. به عنوان مثال، برنامه های کاربردی ارتباطی DLM مسئول حفظ دولت توافق شده بین بافر های پایگاه داده بر روی کامپیوترهای مختلف خوشه ای هستند.

وظیفه حفظ انسجام حافظه پنهان I / O بین پردازنده ها در خوشه، شبیه به مشکل حفظ انسجام کش در یک سیستم چند پردازنده قوی متصل شده بر اساس یک تایر خاص است. بلوک های داده می توانند به طور همزمان در چند حافظه پنهان ظاهر شوند و اگر یک پردازنده یکی از این نسخه ها را تغییر دهد، سایر نسخه های موجود، وضعیت فعلی بلوک داده را منعکس نمی کنند. مفهوم گرفتن یک بلوک (مالکیت بلوک) یکی از راه های مدیریت چنین شرایطی است. قبل از اینکه واحد را می توان توسط مالکیت بلوک اصلاح کرد.

کار با DLM با هزینه های سربار قابل توجهی همراه است. سربار در محیط VMS / VMS می تواند بسیار زیاد باشد که نیاز به انتقال به شش پیام از طریق اتوبوس CI برای یک عملیات I / O انجام دهد. هزینه های سربار می تواند به مقادیر 20٪ برای هر پردازنده در خوشه برسد.

خوشه های با کارایی بالا

اصول ساخت و ساز

معماری خوشه های با کارایی بالا به عنوان توسعه اصول ساخت سیستم های MPP بر روی اجزای کمتری تولید شده و اجزای انبوه کنترل شده توسط استفاده کلی از هدف کلی به نظر می رسد. خوشه ها و همچنین سیستم های MPP شامل گره های ضعیف همراه هستند که می توانند همگن باشند و در مقایسه با MPP، متفاوت یا ناهمگن. توجه ویژه در طراحی یک قارچ خوشه ای با کارایی بالا به منظور اطمینان از کارایی بالا تایر ارتباطی اتصال گره های خوشه ای پرداخت می شود. از آنجایی که اغلب لاستیک های نسبتا کم عملکرد در خوشه ها وجود دارد، لازم است تعدادی از اقدامات لازم را برای حذف پهنای باند کم آنها بر عملکرد خوشه ای و سازماندهی موازی موثر در خوشه ای انجام دهیم. به عنوان مثال، پهنای باند یکی از فن آوری های اترنت با سرعت بالا به سفارشات، کمتر از ارتباطات در ابر رایانه های مدرن معماری MRR است.

برای حل مشکلات عملکرد پایین محصول، چندین روش استفاده می شود:

خوشه به چند بخش تقسیم می شود که در آن گره ها با یک تایر با کارایی بالا از نوع myrinet متصل می شوند و اتصال بین گره های بخش های مختلف توسط شبکه های کم عملکرد از نوع اترنت / اترنت سریع انجام می شود. این به شما این امکان را می دهد که هزینه های خوشه ها را کاهش دهید تا عملکرد چنین خوشه ها را به طور قابل توجهی افزایش دهید در حالی که حل وظایف با تبادل اطلاعات شدید بین فرآیندها را افزایش می دهد.

استفاده از به اصطلاح "trunking"، I.E. ترکیبی از کانال های چندگانه اترنت سریع به یک کانال معمولی با سرعت بالا اتصال سوئیچ های چندگانه. ضرر آشکار این رویکرد، "از دست دادن" بخش های پورت های مربوط به اتصال به سوئیچ ها است.

برای بهبود عملکرد، پروتکل های تبادل اطلاعات ویژه در چنین شبکه هایی ایجاد می شوند که به شما اجازه می دهد تا به طور موثر از پهنای باند کانال استفاده کنید و برخی از محدودیت ها را با پروتکل های استاندارد (TCP / IP، IPX) متصل کنید. این روش اغلب در سیستم های کلاس Beowulf استفاده می شود.

کیفیت اصلی که باید یک خوشه با کارایی بالا داشته باشد، مقیاس پذیری افقی خواهد بود، از آنجا که یکی از مزایای اصلی معماری خوشه ای توانایی افزایش قدرت را فراهم می کند سیستم موجود به سادگی اضافه کردن گره های جدید به سیستم. علاوه بر این، افزایش قدرت تقریبا به نسبت قدرت منابع افزوده می شود و می تواند بدون توقف سیستم در طول عملیات انجام شود. در سیستم های با معماری دیگری (به ویژه MPP)، تنها مقیاس پذیری عمودی معمولا ممکن است: اضافه کردن حافظه، افزایش تعداد پردازنده ها در سیستم های چند پردازنده یا اضافه کردن آداپتورهای جدید یا دیسک های جدید. این اجازه می دهد تا شما را به طور موقت بهبود عملکرد سیستم. با این حال، سیستم به حداکثر تعداد پشتیبانی شده از حافظه، پردازنده ها یا دیسک ها تنظیم می شود، منابع سیستم خسته می شوند و برای افزایش بهره وری، شما باید یک سیستم جدید ایجاد کنید یا به طور قابل توجهی پردازش قدیمی را ایجاد کنید. سیستم خوشه ای همچنین مقیاس پذیری عمودی را پذیرفته است. بنابراین، با مقیاس عمودی و افقی، مدل خوشه ای انعطاف پذیری بیشتری را فراهم می کند و سادگی افزایش عملکرد سیستم را افزایش می دهد.

پروژه Beowulf

Beowulf حماسه اسکاندیناوی است که در مورد وقایع VII می گوید - اولین سوم قرن ششم، که شرکت کننده آن قهرمان همان نام است، که خود را در جنگ ستایش کرد.

یک نمونه از پیاده سازی سیستم خوشه ای چنین ساختاری، خوشه های Beowulf است. پروژه Beowulf در ایالات متحده یک و نیم گروه (عمدتا دانشگاه ها) را در ایالات متحده متحد کرد. توسعه دهندگان پیشرو پروژه متخصصان آژانس ناسا هستند. در این نوع خوشه ها می توانید ویژگی های اصلی زیر را اختصاص دهید:

خوشه Beowulf شامل چندین گره جداگانه ای است که در آن قرار دارد شبکه عمومی، گره های خوشه کل منابع استفاده نمی شوند؛

بهینه سازی برای ساخت خوشه ها بر اساس سیستم های SMP دو پردازنده، در نظر گرفته می شود؛

برای کاهش سربار تعامل بین گره ها، اترنت سریع 100 مگابایتی کامل دوبلکس استفاده می شود (SCI کمتر رایج است)، بخش های چندگانه را ایجاد کنید یا گره های خوشه را از طریق سوئیچ متصل کنید.

به عنوان نرم افزار، لینوکس استفاده می شود، و کتابخانه های ارتباطی آزادانه توزیع شده (PVM و MPI)؛

تاریخچه پروژه Beowulf.

این پروژه در تابستان سال 1994 در مرکز فضایی ناسا آغاز شد - مرکز پرواز فضایی گودارد (GSFC)، دقیق تر در CESDIS ایجاد شده بر اساس آن (مرکز تعالی در فضا داده ها و علوم اطلاعاتی).

اولین خوشه Beowulf بر اساس آن ایجاد شد کامپیوترها اینتل معماری تحت سیستم عامل لینوکس. این یک سیستم شامل 16 گره بود (بر روی پردازنده 486DX4 / 100MHz، 16MB حافظه و 3 آداپتور شبکه در هر گره، 3 "موازی" کابل اترنت 10 مگابایت). این به عنوان یک منبع محاسباتی پروژه "پروژه علوم زمین و فضایی" (ESS) ایجاد شد.

بعد در GSFC و سایر بخش های ناسا، دیگر خوشه های قدرتمند جمع آوری شد. به عنوان مثال، محیط مجازی مجازی بسیار موازی) شامل 64 گره از 2 پردازنده های حافظه پنوموم Pro / 200MHz و 4GB در هر، 5 سوئیچ اترنت سریع است. کل هزینه این خوشه تقریبا 210 هزار دلار است. پروژه Beowulf تعدادی از کارایی بالا و تخصصی را توسعه داده است رانندگان شبکه (به ویژه، راننده برای استفاده از چندین کانال اترنت به طور همزمان).

معماری Beowulf.

گره خوشه.

این یک کامپیوتر تک پردازنده یا سرورهای SMP با تعداد کمی از پردازنده ها (2-4، احتمالا تا 6) است. به هر دلیلی، بهینه سازی بهینه سازی خوشه ها بر اساس سیستم های دو پردازنده در نظر گرفته می شود، علی رغم این واقعیت که در این مورد تنظیم خوشه ای تا حدودی پیچیده تر خواهد بود (عمدتا به این دلیل است که مادربردهای نسبتا ارزان برای پردازنده های پنوموم II / III مجاز نیست ) ارزش نصب برای هر گره 64-128 مگابایتی (برای سیستم های دو پردازنده 64-256 مگابایت) است.

یکی از اتومبیل ها باید به عنوان یک مرکز مرکزی (سر) برجسته شود تا یک هارد دیسک به اندازه کافی بزرگ را نصب کند، یک پردازنده قوی تر و حافظه بیشتر از گره های استراحت (کار) امکان پذیر است. این منطقی است که اتصال این دستگاه را با دنیای خارج ارائه دهیم (محافظت شده).

هنگامی که اجزای کار پیکربخشی می شوند، کاملا ممکن است برای رها کردن هارد دیسک ها را رها کنید - این گره ها سیستم عامل را از طریق شبکه از دستگاه مرکزی دانلود می کنند، که علاوه بر صرفه جویی در وجوه، به شما امکان پیکربندی سیستم عامل و همه چیز شما نیاز به 1 زمان (در ماشین مرکزی). اگر این گره ها به طور همزمان به عنوان مشاغل سفارشی استفاده نمی شوند، نیازی به نصب کارت های ویدئویی و نظارت بر آنها نیست. ممکن است گره ها را در قفسه نصب کنید (Rackmounting)، که محل اشغال شده توسط گره ها را کاهش می دهد، اما هزینه آن را گران تر می کند.

ممکن است دسته بندی خوشه ها بر اساس شبکه های موجود ایستگاه های کاری، I.E. ایستگاه های کاری کاربر را می توان به عنوان گره خوشه در شب و در تعطیلات آخر هفته استفاده کرد. سیستم های این نوع گاهی اوقات گاو نامیده می شود (خوشه ایستگاه های کاری).

تعداد گره ها باید بر اساس منابع محاسباتی لازم و مقرون به صرفه انتخاب شوند. معیارهای مالی. باید آن را درک کرد که با تعداد زیادی از گره ها، همچنین باید تجهیزات شبکه پیچیده تر و گران قیمت را ایجاد کند.

انواع اصلی شبکه های محلی درگیر در پروژه Beowulf گیگابیت اترنت، اترنت سریع و 100-VG Anylan است. در ساده ترین مورد، یک بخش اترنت استفاده می شود (10 مگابیت بر ثانیه در جفت پیچ خورده). با این حال، ارزان بودن چنین شبکه ای، به دلیل برخورد، به هزینه های سربار بزرگ برای مبادلات بین پردازنده تبدیل می شود؛ و عملکرد خوب چنین خوشه ای باید فقط در وظایف با ساختار موازی بسیار ساده و با تعاملات بسیار نادر بین فرآیندهای (به عنوان مثال، گزینه های انفجاری) انتظار می رود.

برای به دست آوردن عملکرد بورس بین المللی خوب، اترنت سریع کامل دوبلکس در هر 100mbit / sec استفاده می شود. در عین حال، برای کاهش تعداد برخورد ها و یا تنظیم چندین بخش اترنت "موازی"، یا گره های خوشه را از طریق سوئیچ (سوئیچ) متصل کنید.

گران تر است، اما همچنین یک گزینه محبوب استفاده از سوئیچ های نوع Myrinet (1.28gbit / sec، دوبلکس کامل) است.

کمتر محبوب، اما در واقع در واقع هنگام ساخت خوشه های با تکنولوژی های شبکه، فن آوری های CLAN، SCI و گیگابیت اترنت استفاده می شود.

گاهی اوقات برای ارتباط بین گره های خوشه، چندین کانال مخابراتی به صورت موازی استفاده می شود - به اصطلاح "پیوند کانال" (پیوند کانال) که معمولا برای تکنولوژی اترنت سریع استفاده می شود، استفاده می شود. در این مورد، هر گره به سوئیچ اترنت سریع با بیش از یک کانال متصل می شود. برای رسیدن به این هدف، گره ها با کارت های چندگانه چندگانه یا چند تابلوهای چندگانه اترنت سریع مجهز شده اند. استفاده از اتصال کانال در گره ها در حال اجرا نرم افزار لینوکس اجازه می دهد تا شما را به توزیع یک توزیع یکنواخت از بار پذیرش / انتقال بین کانال های مربوطه.

سیستم سیستم

سیستم عامل. سیستم لینوکس معمولا در نسخه های به طور خاص برای محاسبات موازی توزیع شده بهینه شده است. هسته لینوکس 2.0 تصفیه شد. در روند ساخت خوشه ها، معلوم شد رانندگان استاندارد دستگاه های شبکه در لینوکس بسیار بی اثر هستند. بنابراین، رانندگان جدید توسعه یافته اند، اول از همه برای شبکه های اترنت سریع و گیگابیت اترنت، و امکان ارتباط منطقی چند ارتباطات شبکه موازی بین کامپیوترهای شخصی (شبیه به اتصال سخت افزاری کانال ها)، که اجازه می دهد تا شبکه های محلی ارزان قیمت با پهنای باند کم، برای ساخت یک شبکه با پهنای باند کل بالا.

همانطور که در هر خوشه، یک کپی از هسته سیستم عامل در هر گره خوشه وجود دارد. با تشکر از نهایی شدن، منحصر به فرد از شناسایی فرایندها در کل خوشه، و نه گره های فردی، تضمین می شود.

کتابخانه های ارتباطی رایج ترین رابط برنامه نویسی موازی در مدل انتقال پیام MPI است. توصیه شده رایگان پیاده سازی MPI - بسته MPICH توسعه یافته در آزمایشگاه ملی آرگون. برای خوشه ها بر اساس سوئیچر Myrinet، یک سیستم HPVM توسعه یافته است، که همچنین شامل اجرای MPI است.

برای یک سازمان موثر از موازی در یک سیستم SMP، دو گزینه ممکن است:

برای هر پردازنده در دستگاه SMP یک فرآیند MPI جداگانه تولید می کند. MPI فرآیندهای داخل این سیستم مبادله را از طریق حافظه به اشتراک گذاشته (شما باید MPICH را پیکربندی کنید).
فقط یک فرآیند MPI در هر دستگاه شروع می شود. در داخل هر فرآیند MPI، موازی سازی در مدل "حافظه مشترک" ساخته شده است، به عنوان مثال، با استفاده از دستورالعمل OpenMP.

پس از نصب پیاده سازی MPI، منطقی است که عملکرد واقعی حمل و نقل شبکه را آزمایش کنیم.

علاوه بر MPI، کتابخانه های دیگر و سیستم های برنامه نویسی موازی وجود دارد که می تواند در خوشه ها مورد استفاده قرار گیرد.

مثال پیاده سازی خوشه Beowulf - Avalon

در سال 1998، در آزمایشگاه ملی Los Alamos Astrophysicik Michael Warren و دیگر دانشمندان از یک گروه از استروفی فیزیک نظری، یک ابر فیزیوتراپی Avalon ساخته شده است که Beowulf -Claster بر اساس پردازنده های آلفا / 533MHz دسامبر است. Avalon در ابتدا شامل 68 پردازنده بود، سپس آن را به 140 افزایش یافت. در هر گره، 256 مگابایت رم، یک هارد دیسک EIDE در 3.2 گیگابایت، یک آداپتور شبکه از کینگستون (کل هزینه گره 1700 دلار است). گره ها با استفاده از سوئیچ های 46-36 پورت از اترنت سریع و "در مرکز" 12 پورت سوئیچ گیگابیت گیگابیت از 3Com متصل می شوند.

هزینه کل Avalon 313 هزار دلار است و عملکرد LinPack آن (47.7 GFLOPS) به او اجازه می دهد تا 114 جایگاه را در نسخه 12 TOP500 (در کنار سیستم پردازنده 152 IBM SP2) قرار دهد. پیکربندی 70 پردازنده Avalon در بسیاری از آزمایشات عملکرد مشابهی را نشان داده است که هزینه سیستم پردازنده 64 پردازنده SGI2000 / 195MHZ بیش از 1 میلیون دلار است.

در حال حاضر، Avalon به طور فعال در محاسبات Astrophysical، مولکولی و دیگر علمی استفاده می شود. در کنفرانس SC "98، سازندگان Avalon گزارش دادند که" Avalon: یک خوشه آلفا / لینوکس 10 GFLOPS را برای 150K دلار به دست می آورد "و از لحاظ قیمت / عملکرد (" 1998 Gordon Bell Bell Price Price Price ").

نتیجه

تولید کنندگان پیشرو از ریزپردازنده ها: Sun Microsystems، دل و آی بی ام همان نقطه نظر را به آینده صنعت ابر رایانه ها نگه می دارند: برای جایگزینی فردی، سوپر کامپوزیت های مستقل باید یک گروه از سرورهای با کارایی بالا را به یک خوشه تقسیم کنند. در حال حاضر، سیستم های خوشه ای توزیع شده پیش از ابر رایانه های مدرن کلاسیک از نظر عملکرد هستند: قدرتمندترین رایانه در جهان - IBM ASCI WHITE - دارای ظرفیت 12 ترافلوپ، عملکرد شبکه است [ایمیل محافظت شده] این تخمین زده شده است در حدود 15 teraflops. در همان زمان، IBM ASCI WHITE برای 110 میلیون دلار فروخته شد و در کل سابقه وجود [ایمیل محافظت شده] این حدود 500 هزار دلار بود.

ادبیات

2. http://www.beowulf.com

3. http://newton.gsfc.nasa.gov/thehive/

4. لوبوس http://www.lobos.nih.gov.

5. http://parallel.ru/news/kentucky_klat2.html

6. http://parlell.ru/news/anl_chibacity.html.

7. http://parlell.ru/cluster/

8. http://www.ptc.spbu.ru.

MIMD Computers

MIMD COMPUTER دارد n. پردازنده ها به طور مستقل انجام می دهند n. جریان جریان و پردازش n. جریان داده ها. هر پردازنده تحت کنترل جریان خود از دستورات خود عمل می کند، یعنی کامپیوتر MIMD می تواند برنامه های کاملا متفاوت را به صورت موازی انجام دهد.

معماری MIMD بسته به سازمان حافظه فیزیکی طبقه بندی شده است، یعنی اینکه آیا پردازنده دارای حافظه محلی خود است و به سایر بلوک های حافظه با استفاده از شبکه سوئیچینگ اشاره می کند یا شبکه رفت و آمد، تمام پردازنده ها را به حافظه عمومی متصل می کند. بر اساس سازمان حافظه، انواع زیر از معماری های موازی متمایز می شوند:

کامپیوترها با حافظه توزیع شده (حافظه توزیع شده)
پردازنده می تواند به حافظه محلی دسترسی پیدا کند، می تواند پیام های ارسال شده را بر روی پردازنده های اتصال شبکه ارسال و دریافت کند. پیام ها برای برقراری ارتباط بین پردازنده ها یا معادل خواندن و نوشتن بلوک های حافظه از راه دور استفاده می شود. در یک شبکه ایده آل، هزینه ارسال پیام بین دو گره شبکه به محل هر دو گره و ترافیک شبکه بستگی ندارد، بلکه به طول پیام بستگی دارد.

کامپیوترها با حافظه عمومی (به اشتراک گذاشته شده) (حافظه به اشتراک گذاشته شده واقعی)
تمام پردازنده ها به طور مشترک به یک حافظه مشترک، معمولا از طریق یک تایر یا سلسله مراتب اشاره می شود. در یک PRAM ایده آل (دستگاه دسترسی تصادفی موازی - یک دستگاه موازی با دسترسی دلخواه)، یک مدل، که اغلب در مطالعات نظری الگوریتم های موازی مورد استفاده قرار می گیرد، هر پردازنده می تواند در همان زمان به هر سلول حافظه دسترسی پیدا کند. در عمل، مقیاس پذیری این معماری معمولا منجر به نوعی از یک سلسله مراتب حافظه می شود. فرکانس دسترسی به حافظه کلی را می توان با صرفه جویی در کپی داده های اغلب مورد استفاده در حافظه پنهان مرتبط با هر پردازنده کاهش داد. دسترسی به این حافظه نقدی بسیار سریعتر از دسترسی مستقیم به حافظه کلی است.

کامپیوترها با حافظه مجازی مشترک (به اشتراک گذاشته شده) (حافظه مشترک مجازی)
حافظه کلی گم شده است هر پردازنده دارای حافظه محلی خود است و می تواند به حافظه محلی پردازنده های دیگر با استفاده از "آدرس جهانی" دسترسی داشته باشد. اگر "آدرس جهانی" نشان دهنده حافظه محلی نیست، پس از آن دسترسی به حافظه با استفاده از پیام های ارسال شده توسط شبکه ارتباطی اجرا می شود.

یک نمونه از ماشین آلات با حافظه مشترک می تواند باشد:

Sun Microsystems (ایستگاه های کاری چند منظوره)
چالش گرافیک سیلیکون (ایستگاه های کاری چند منظوره)
تقارن متوالی.
محدب
Cray 6400

کامپیوترهای زیر متعلق به کلاس ماشین های توزیع شده هستند.

IBM-SP1 / SP2
Parsytec GC.
CM5 (شرکت تفکر ماشین)
Cray T3D
Paragon (Intel Corp.)
ncube
Meiko CS-2
AVX (الکس کامپیوترهای موازی)
IMS B008.

معماری MIMD با حافظه توزیع شده همچنین می تواند بر پهنای باند شبکه رفت و آمد طبقه بندی شود. به عنوان مثال، در معماری که در آن جفت ها از پردازنده و ماژول حافظه (عنصر پردازنده) توسط یک شبکه با توپولوژی متصل می شوند شوت هر پردازنده دارای تعداد مشابهی از اتصالات شبکه است، صرف نظر از تعداد پردازنده های کامپیوتری. پهنای باند کل چنین شبکه به طور خطی نسبت به تعداد پردازنده ها رشد می کند. از سوی دیگر در معماری داشتن یک شبکه با توپولوژی هر چیزی شبیه Hyperkub تعداد اتصالات پردازنده به شبکه یک تابع لگاریتمی از تعداد پردازنده ها است و پهنای باند شبکه سریعتر از خطی نسبت به تعداد پردازنده ها افزایش می یابد. در توپولوژی کلوچه هر پردازنده باید به تمام پردازنده های دیگر متصل شود.

شبکه با توپولوژی 2D شوت (تور)

شبکه با توپولوژی 2D تور

شبکه با توپولوژی کلوچه

مرکز ملی برنامه های ابر رایانه ای (دانشگاه ایلینوی، Urbana-Champaign)

MPI: پیام عبور پیام

نام "رابط انتقال پیام"، برای خود صحبت می کند. این یک مکانیسم استاندارد شده برای ساخت برنامه های موازی در مدل پیام رسانی است. MPI استاندارد "اتصال" به زبان های C / C ++، Fortran 77/90 وجود دارد. پیاده سازی های رایگان و تجاری برای تقریبا تمام سیستم عامل های ابر رایانه ای و همچنین شبکه های ایستگاه های Windows و Windows NT وجود دارد. در حال حاضر، MPI به طور گسترده ای استفاده می شود و به طور پویایی رابط توسعه از کلاس خود را.

Beowulf - خوشه های مبتنی بر سیستم عامل لینوکس

میخائیل Kuzminsky

"سیستم های باز"

در آستانه هزاره، ما هر فرصتی برای شاهد انحصار صنعت کامپیوتر، که می تواند هر دو میکروپروسسو و سیستم عامل را پوشش دهد. البته، ما در مورد ریزپردازنده ها از اینتل صحبت می کنیم (Merced تهدید به پردازش پردازنده های معماری RISC) و سیستم عامل از مایکروسافت.

در هر دو مورد، موفقیت به طور عمده توسط قدرت دستگاه بازاریابی تعیین می شود، و نه فقط خواص مصرف کننده محصولات تولید شده. به نظر من، جامعه کامپیوتر هنوز مقیاس پیامدهای احتمالی را متوجه نشده است.

بعضی از کارشناسان انحصار بالقوه بازار کامپیوتر را با سلطه انحصاری IBM در 70s مقایسه می کنند - هر دو در منطقه سیستم های اصلی و سیستم عامل ها. من برای مدت طولانی من با این تکنیک کار می کنم و همانطور که یونیکس در کشور ما توزیع می شود، به طور فزاینده ای از مزایای بسیاری از سیستم عامل IBM MVS آگاه است. با این وجود، من یک دیدگاه مشترک را به اشتراک می گذارم که چنین انحصاری به شتاب پیشرفت کمک نمی کند.

دانشگاه های غربی، که در یک زمان در میان اولین بار به استفاده از یونیکس منتقل شدند، هنوز هم در تحولات امیدوار کننده آنها بر این سیستم تکیه می کنند و لینوکس به عنوان یک پلت فرم به طور فزاینده ای انتخاب می شود. این مقاله به یکی از تحولات تحصیلی آموزنده اختصاص داده شده است.

لینوکس به عنوان یک پدیده اجتماعی

ما دیگر از این واقعیت شگفت زده نمی شویم که لینوکس پدیده قابل توجهی از زندگی کامپیوتر را نشان داده است. در ترکیب با ثروتمندترین مجموعه نرم افزار آزادانه توزیع شده GNU، این سیستم عامل به عنوان کاربران غیر تجاری بسیار محبوب شده است. محبوبیت آن افزایش می یابد. نسخه های لینوکس نه تنها برای پلت فرم اینتل X86، بلکه همچنین برای دیگران وجود دارد معماری پردازنده، از جمله دسامبر Alrha، و به طور گسترده ای برای برنامه های کاربردی اینترنت، و همچنین وظایف ماهیت تخمین زده می شود. به طور خلاصه، لینوکس به نوعی "سیستم عامل مردم" تبدیل شد. تقریبا، با این حال، می گویند که لینوکس هیچ مکان ضعیف ندارد یکی از آنها حمایت ناکافی برای معماری SMR است.

ارزان ترین راه برای ساخت منابع کامپیوتری، از جمله محاسبات قدرت، ساخت یک خوشه است. ابر رایانه های موازی عظیم با حافظه عملیاتی فیزیکی و منطقی توزیع شده نیز می تواند به عنوان خوشه های عجیب و غریب در نظر گرفته شود. نمونه واضح ترین چنین معماری رایانه ای معروف IBM SP2 است.

کل سوال این است که کامپیوترها (گره ها) در خوشه متصل می شوند. در ابر رایانه های "واقعی"، تجهیزات تخصصی و به همین ترتیب گران قیمت طراحی شده برای ارائه پهنای باند بالا. در خوشه ها، به عنوان یک قاعده، استانداردهای شبکه معمولی اعمال می شود - اترنت، FDDI، ATM یا HIRI.

فن آوری های خوشه ای با استفاده از سیستم عامل لینوکس چند سال پیش شروع به توسعه کرد و مدتها قبل از آنکه Wolfrack به نظر می رسد برای ویندوز NT ظاهر شد. بنابراین در اواسط دهه 1990، پروژه Beowulf آغاز شد.

قهرمان شعر حماسی

Beowulf یک حماسه اسکاندیناوی است که در مورد وقایع VII می گوید - اولین سوم قرن هفتم، شرکت کننده از آن قهرمان همان نام است که خود را در جنگ ستایش می کند. معلوم نیست که آیا نویسندگان این پروژه تصور می شد، که در حال حاضر با Beowulf مبارزه خواهد کرد (احتمالا با ویندوز NT؟)، تصویر قهرمانانه امکان ترکیب حدود یک و نیم ده ها سازمان در کنسرسیوم (به طور عمده دانشگاه ها) در ایالات متحده. نمی توان گفت که مراکز فوق العاده کامپیوتری در میان شرکت کنندگان پروژه غالب هستند، با این حال، خوشه های Loki و Megalon در مراکز محاسباتی معروف با کارایی بالا مانند Los Alamos و آزمایشگاه سندیا وزارت انرژی ایالات متحده نصب شده اند. توسعه دهندگان پیشرو پروژه متخصصان آژانس ناسا هستند. به طور کلی، بدون استثنا، خوشه های ایجاد شده توسط شرکت کنندگان پروژه نام های با صدای بلند دریافت می کنند.

علاوه بر Beowulf، یکی دیگر از فناوری خوشه ای نزدیک شناخته شده است - در حال حاضر. در حال حاضر، رایانه های شخصی معمولا حاوی اطلاعاتی درباره خود و وظایف خود هستند و وظایف مدیر سیستم چنین خوشه ای شامل تشکیل این اطلاعات می شود. خوشه های Beowulf در این زمینه (یعنی از نقطه نظر مدیر سیستم) ساده تر است: گره های فردی در مورد پیکربندی خوشه ای نمی دانند. فقط یک گره انتخاب شده شامل اطلاعات پیکربندی است؛ و تنها او ارتباط برقرار در شبکه با جهان خارج دارد. تمام گره های خوشه ای دیگر با یک شبکه محلی ترکیب شده اند و تنها "پل نازک" از واحد کنترل با دنیای بیرونی متصل است.

گره ها در فن آوری Beowulf مادربردهای کامپیوتر هستند. معمولا درایوهای محلی محلی نیز در گره ها دخیل هستند. انواع استاندارد شبکه های محلی برای اتصال گره ها استفاده می شود. ما این سوال را در زیر بررسی خواهیم کرد، ابتدا ما بر روی نرم افزار متوقف خواهیم شد.

بنیاد آن در Beowulf معمول سیستم عامل لینوکس تجاری معمولی است که می تواند در CD-ROM خریداری شود. در ابتدا، اکثریت شرکت کنندگان پروژه بر روی CDS منتشر شده توسط Slackware متمرکز شده اند، و در حال حاضر ترجیحات توسط نسخه RedHat ترجیح داده می شود.

در سیستم عامل لینوکس معمولی، شما می توانید ابزار شناخته شده موازی سازی را در مدل پیام رسانی نصب کنید (LAM MRI 6.1، PVM 3.3.11 و دیگران). شما همچنین می توانید از استاندارد R-Threads و ابزار استاندارد تعامل بین پردازنده استفاده کنید که در هر سیستم یونیکس V. به عنوان بخشی از پروژه Beowulf گنجانده شده است، تحولات جدی جدی انجام شده است.

اول از همه، باید آن را به پالایش هسته لینوکس 2.0 اشاره کرد. در روند ساخت خوشه ها، معلوم شد که رانندگان دستگاه استاندارد شبکه در لینوکس بسیار ناکارآمد هستند. بنابراین، رانندگان جدید توسعه یافتند (توسط اکثر تحولات - دونالد بکر)، اول از همه برای شبکه های اترنت سریع و گیگابیت Ethernet، و ممکن است منطقی ترکیب چندین اتصال شبکه موازی بین رایانه های شخصی، که اجازه می دهد تا از شبکه های ارزان قیمت محلی با بیش از سرعت متوسط، ساخت یک شبکه با پهنای باند تجمعی بالا.

همانطور که در هر خوشه، کپی خود را از هسته OS در هر گره زندگی می کند. با تشکر از نهایی شدن، منحصر به فرد از شناسایی فرآیندهای در کل خوشه، و نه گره های فردی، و همچنین "تحویل راه دور" سیگنال های سیستم عامل لینوکس تضمین شده است.

علاوه بر این، لازم است که بارگیری در شبکه (NetBooting) را در هنگام کار با آن نشان دهیم مادربرد اینتل PR 440FX، و آنها همچنین می توانند برای کار با مادربردهای دیگر مجهز به BIOS AMI استفاده شوند.

ویژگی های بسیار جالب ارائه مکانیسم های حافظه مجازی شبکه یا حافظه توزیع شده DSM (حافظه توزیع شده توزیع شده) را ارائه می دهد، به شما این امکان را می دهد که یک "توهم" خاصی از حافظه کلی گره ایجاد کنید.

شبکه - ماده حساس

از آنجایی که به طور کلی برنامه های کاربردی ابر رایانه را به طور کلی، و خوشه به طور خاص، پهنای باند بالا و تاخیر های پایین در پیام های بین گره ها مورد نیاز است، ویژگی های شبکه تبدیل به پارامترهایی می شود که عملکرد خوشه را تعریف می کنند. انتخاب ریزپردازنده ها برای گره ها واضح است - این پردازنده های تولید استاندارد اینتل هستند؛ اما با توپولوژی خوشه، نوع شبکه و تخته مدار شبکه، شما می توانید آزمایش کنید. این در این زمینه است که تحقیقات اصلی انجام شده است.

هنگام تجزیه و تحلیل کارت های مختلف شبکه های کامپیوتری که امروزه در بازار ارائه شده است، توجه ویژه ای به ویژگی های مختلفی به عنوان پشتیبانی گسترده پخش (چند منظوره)، پشتیبانی از کار با بسته های بزرگ اندازه بزرگ و غیره. انواع اصلی شبکه های محلی درگیر در پروژه Beowulf، این گیگابیت اترنت، اترنت سریع و 100-VG Anylan است. (قابلیت های تکنولوژی ATM نیز به طور فعال مورد مطالعه قرار گرفت، اما تا آنجا که نویسنده شناخته شده بود، در خارج از چارچوب این پروژه انجام شد.)

نحوه جمع آوری ابر رایانه

پس از تجزیه و تحلیل نتایج کار انجام شده در پروژه Beowulf، شما می توانید به نتیجه زیر آمده است: راه حل های یافت می شود به شما اجازه می دهد به طور مستقل جمع آوری یک خوشه با کارایی بالا بر اساس اجزای استاندارد برای اجزای کامپیوتر و استفاده از نرم افزار معمول. در میان بزرگترین نمونه ها، غیرممکن است که خوشه 50 گره را در CESDIS علامت گذاری نکنید، که شامل 40 گره پردازش داده (بر اساس تک و دو پردازنده Rentium ro / 200 مگاهرتز) و 10 گره پوسته پوسته شدن (هیئت مدیره دو پردازنده Rentium Р / 166 مگاهرتز). نسبت عملکرد هزینه / پیک در چنین خوشه بسیار موفق است. سوال این است که چقدر کارآمد ممکن است برنامه های کاربردی را انجام دهد - به عبارت دیگر، چه چیزی واقعی خواهد بود، و نه عملکرد اوج. شرکت کنندگان پروژه در حال حاضر در راه حل این مشکل کار می کنند.

لازم به ذکر است که ساخت خوشه های رایانه های معمولی امروز در یک محیط علمی کاملا مد روز است. برخی از نهادهای دانشگاهی در کشور ما نیز قصد دارند خوشه های مشابه را ایجاد کنند.

هنگام ترکیب کامپیوترها در یک خوشه از قدرت های مختلف یا معماری متفاوت، آنها می گویند خوشه های ناهمگن (ناهمگن). گره های خوشه ای می توانند به طور همزمان به عنوان ایستگاه های کاری سفارشی استفاده شوند. در مورد زمانی که لازم نیست، گره ها را می توان به طور قابل توجهی تسهیل و / یا نصب شده در قفسه.

ایستگاه های ایستگاه های استاندارد سیستم عامل، اغلب، آزادانه توزیع می شوند - لینوکس / FreeBSD، همراه با ابزار ویژه ای برای حمایت از برنامه نویسی موازی و توزیع بار. برنامه نویسی، به عنوان یک قاعده، در چارچوب مدل انتقال پیام (اغلب - MPI). این جزئیات بیشتر در پاراگراف بعدی مورد بحث قرار گرفته است.

تاریخ توسعه معماری خوشه ای.

اولین دسامبر، مفهوم یک سیستم خوشه ای را در سال 1983 اعلام کرد، تعیین آن به عنوان یک گروه از ماشین های کامپیوتری ترکیبی، که یک واحد پردازش اطلاعات واحد است.

یکی از اولین پروژه هایی که به کل کلاس سیستم های موازی نامیده می شود - خوشه های Beowulf - در مرکز مرکز پرواز فضایی ناسا گودارد برای حمایت از منابع محاسباتی لازم برای پروژه های علوم زمین و علوم فضایی آغاز شده است. پروژه Beowulf در تابستان سال 1994 آغاز شد و یک خوشه 16 پردازش به زودی بر روی پردازنده های اینتل 486DX4 / 100 MHz جمع آوری شد. هر گره 16 مگابایت رم و 3 آداپتور اترنت شبکه نصب شد. برای کار در چنین پیکربندی، رانندگان ویژه توزیع ترافیک بین کارت های شبکه موجود توسعه یافته اند.

بعدها در GSFC، یک خوشه ای از محیط مجازی مجتمع بسیار موازی، ساختار آن در شکل نشان داده شده است. 2. این خوشه شامل چهار sublusters E، B، G و DL، ترکیب 332 پردازنده و دو میزبان انتخاب شده است. تمام گره های این خوشه در حال اجرا Redhat Linux هستند.

در سال 1998، در آزمایشگاه ملی Los Alamos از Astrophysicik Michael Warren و سایر دانشمندان گروهی از استروفیزیک نظری، یک ابرروفیزیک Supercomputer را ساخته اند که یک خوشه لینوکس بر اساس پردازنده های آلفا 21164A با فرکانس ساعت 533 مگاهرتز است. در ابتدا، Avalon شامل 68 پردازنده بود، سپس به 140 سالگی گسترش یافت. در هر گره، 256 مگابایت رم، یک هارد دیسک بر روی 3 گیگابایت و یک آداپتور شبکه اترنت سریع نصب شد. هزینه کل پروژه Avalon 313 هزار دلار بود و عملکرد نشان داده شده در آزمون Linpack - 47.7 GFLOPS، به او اجازه داد تا 114 جایگاه 114 در نسخه 12 TOP500 در کنار سیستم پردازنده 152 IBM RS / 6000 SP را بگیرد. در همان سال 1998، در کنفرانس معتبر ترین در زمینه ابر رایانه های با کارایی بالا، Avalon یک گزارش "Avalon: یک خوشه آلفا / لینوکس به 10 GFLOPS برای 150K دلار به دست آورد"، که اولین جایزه را در نامزدی دریافت کرد "بهترین قیمت / عملکرد" \u200b\u200bنامزدی.

در ماه آوریل سال جاری، یک خوشه از سرعت +، شامل 64 گره با دو پردازنده پنتیوم III / 733 MHz و 2 گیگابایت رم هر کدام و 2 گیگابایت رم هر کدام و با یک دیسک کامل 27 گیگابایت برای مطالعات زیست پزشکی نصب شد دانشگاه کرنل. گره ها زیر کار می کنند کنترل ویندوز 2000 و توسط Giganet Clan ترکیب شده است.

تعداد زیادی جعبه در پروژه های قفسه بندی در موسسه ملی بهداشت ایالات متحده در آوریل 1997 اجرا می شود و جالب است که از Gigabit Ethernet به عنوان یک محیط ارتباطی استفاده شود. اول، خوشه شامل 47 گره با دو پردازنده پنتیوم Pro / 200 MHz، 128 مگابایت رم و دیسک 1.2 گیگابایت بر روی هر گره بود. در سال 1998 اجرا شد

مرحله بعدی پروژه Lobos2 است که طی آن گره ها به رایانه های رومیزی تبدیل شده اند و در حالی که ترکیبی را به یک خوشه تبدیل می کنند. در حال حاضر Lobos2 شامل 100 گره محاسباتی حاوی دو پردازنده پنتیوم II / 450 MHz، 256 مگابایت عملیات و 9 گیگابایت حافظه دیسک است. علاوه بر خوشه، 4 کامپیوتر کنترل با ظرفیت کل RAID-ARRAY 1.2 TB متصل هستند.

یکی از آخرین تحولات خوشه، Supercomputer AMD Presto III بود که یک خوشه Beowulf از 78 پردازنده های آتلون است. کامپیوتر در موسسه تکنولوژیکی توکیو نصب شده است. تا به امروز، AMD 8 ابر رایانه ای را در خوشه ساخته شده است با استفاده از روش Beowulf در حال اجرا سیستم عامل لینوکس.

خوشه های آی بی ام

Rs / 6000.

IBM چندین نوع سیستم های مرتبط با آن را بر اساس Rs / 6000 ارائه می دهد، به خوشه ها متصل می شود و نرم افزار چند منظوره Multiprocessor / 6000 (HACMP / 6000) را اجرا می کند.

گره های خوشه ای به صورت موازی عمل می کنند، دسترسی به منابع منطقی و فیزیکی را با استفاده از قابلیت های مدیریت قفل در HACMP / 6000 به اشتراک می گذارند.

با شروع آگهی در سال 1991، محصول HACMP / 6000 به طور مداوم در حال تکامل بود. این شامل یک مدیر منبع موازی، مدیر قفل توزیع شده و یک مدیر حجم منطقی منطقی است و دومی امکان تعادل بار در سطح کل خوشه را فراهم می کند. بیشترین مقدار گره ها در خوشه به هشت نفر افزایش یافته است. در حال حاضر، گره ها با پردازش چند پردازنده متقارن، با استفاده از سوئیچ CrossBar داده ساخته شده، که باعث افزایش عملکرد خطی با افزایش تعداد پردازنده ها بر روی خوشه می شود.

خوشه های Rs / 6000 بر اساس اترنت، حلقه نشانه یا شبکه های محلی FDDI ساخته شده اند و می توانند به روش های مختلفی از نظر بهبود قابلیت اطمینان پیکربندی شوند:

ذخیره داغ یا سوئیچینگ آسان در صورت شکست. در این حالت، گره فعال انجام وظایف برنامه را انجام می دهد، و پشتیبان می تواند وظایف غیر بحرانی را انجام دهد که می تواند در صورت لزوم زمانی که مجمع فعال مورد نیاز است، متوقف شود.
ذخایر متقارن شبیه به ذخیره داغ، اما نقش گره های اصلی و پشتیبان ثابت نشده است.
وانت متقابل یا حالت با توزیع بار. در این حالت، هر گره در خوشه می تواند وظایفی را انتخاب کند که بر روی هر گره خوشه ای دیگر انجام می شود.

IBM SP2.

IBM SP2 در فهرست بزرگترین TOP500 ابر رایانه های برتر از لحاظ شماره نصب (141 نصب، و در مجموع، 8275 نفر از این رایانه ها با تعداد کل گره های بالای 86 هزار نفر عمل می کنند. اساس این ابر رایانه ها بر اساس معماری است به عنوان یک رویکرد خوشه ای با استفاده از یک سوئیچ مرکزی قدرتمند. IBM از این رویکرد برای سالهای زیادی استفاده می کند.

معماری عمومی SP2.

دیدگاه کلی معماری SP2 برنج را می دهد. 1. ویژگی اصلی آن معماری، استفاده از سوئیچ با سرعت بالا با تاخیرهای کم برای اتصال گره ها در میان خود است. این طرح خارجی بسیار ساده، به عنوان تجربه نشان داد، بسیار انعطاف پذیر بود. اول، گره های SP2 تک پردازنده بودند، سپس گره های معماری SMP ظاهر شدند.

در واقع، تمام جزئیات در ساختار گره ها پنهان شده اند. علاوه بر این، گره ها هستند انواع متفاوتعلاوه بر این، حتی پردازنده ها در گره های همسایه می توانند متفاوت باشند. این فراهم می کند

انعطاف پذیری انتخاب پیکربندی عالی. تعداد کل گره ها در سیستم محاسبات می تواند به 512 برسد. گره های SP2 در واقع هستند کامپیوترهای مستقلو دقت آنها به IBM تحت نام های مستقل فروخته می شود. قابل توجه ترین نمونه این، چهار پردازنده SMP SMP Rs / 6000 44P-270 با میکروپروسسورهای Power3-II است که به خودی خود می تواند به کلاس کامپیوترهای طبقه متوسط \u200b\u200bیا حتی به سوپر کامپوزیت های مینی نسبت داده شود.

ریزپردازنده های ایجاد شده در گره های SP2 که در دو خط معماری ایجاد شده اند: Power - Power2 - Power3 - Power3-II و PowerPC خط تا مدل 604E با فرکانس ساعت 332 مگاهرتز.

سنتی برای SP2 "نازک" (گره گسترده ای) و "گره های گسترده" (گره های گسترده ای) با معماری SMP است. آنها می توانند هر دو PowerPC 604E (از دو تا چهار پردازنده) و Power3-II (تا چهار) نصب شوند. ظرفیت باتری گره ها از 256 مگابایت تا 3 گیگابایت است (هنگام استفاده از Power3-II - تا 8 گیگابایت). تفاوت های اصلی بین گره های نازک و گسترده ای مربوط به زیرسیستم I / O است. گره های گسترده ای برای وظایفی طراحی شده اند که نیازمند توانایی های قوی I / O هستند: ده نفر در آنها وجود دارد اسلات PCI (از جمله سه 64 بیتی) در برابر دو اسلات در گره های نازک. بر این اساس، تعداد محفظه های نصب شده برای دستگاه های دیسک در گره های گسترده ای بیشتر است.

سرعت سوئیچ با مقادیر تاخیر پایین مشخص می شود: 1.2 MS (حداکثر 2 میلی ثانیه با تعداد گره های بالای 80). این یک مرتبه از اندازه بهتر از آنچه می تواند در بوویل خوشه های مدرن لینوکس بدست آید. پهنای باند پیک از هر پورت: 150 مگابایت بر ثانیه در یک جهت (یعنی 300 مگابایت بر ثانیه در هر دوپلکس انتقال) است. همان پهنای باند دارای آداپتورهای Switcher واقع در گره های SP2 است. آی بی ام همچنین تاخیر عالی و نتایج پهنای باند را فراهم می کند.

قدرتمندترین گره های SP2 "بالا" (گره بالا) هستند. گره بالا پیچیده ای است که شامل یک گره محاسباتی با دستگاه های ورودی / خروجی / خروجی متصل شده در مقدار تا شش قطعه است. چنین گره نیز دارای یک معماری SMP است و شامل 8 پردازنده Power3 با فرکانس ساعت 222 یا 375 مگاهرتز است.

علاوه بر این، گره این نوع شامل هزینه ورودی / خروجی است که همچنین به آن متصل است هیئت مدیره. هیئت مدیره I / O شامل دو بلوک منطقی متقارن Saber است که از طریق آن داده ها به دستگاه های خارجی منتقل می شود

مانند دیسک ها و تجهیزات مخابراتی. در هیئت مدیره I / O چهار اسلات PCI 64 بیتی و یک اسلات 32 بیتی (فرکانس 33 مگاهرتز)، و همچنین کنترل کننده های Ultrascsi یکپارچه، اترنت 10/100 مگابیت در ثانیه، سه پورت متوالی و یک موازی وجود دارد.

با ظهور گره های بالا و ریزپردازنده های Power3-II / 375 مگاهرتز در آزمایش های Parlell Linpack از سیستم IBM SP2 به عملکرد 723.4 GFLOPS رسید. این نتیجه در هنگام استفاده از 176 گره (704 پردازنده) به دست می آید. با توجه به اینکه گره ها را می توان تا 512 تنظیم کرد، این نتیجه نشان می دهد که سری IBM SP2 به طور کامل به 1 TFLOPS نزدیک می شود.

Cluster Sun Solutions Sun Microsystems

Sun Microsystems ارائه می دهد راه حل های خوشه ای بر اساس SPARCClaster PDB سرور، که در آن سرور SMP چند پردازنده SPARCSERVER 1000 و SpARCCENTER 2000 به عنوان گره استفاده می شود، و SPARCSERVER 1000 می تواند تا هشت پردازنده وارد شده و در SPARCCENTER 2000 تا 20 پردازنده های SuperSparc وارد شده است. اجزای زیر شامل اجزای زیر عبارتند از: دو گره خوشه بر اساس Sparcserver 1000 / 1000E یا SparcCenter 2000 / 2000E، دو آرایه دیسک آرایه Sparcstorage، و همچنین یک بسته برای ساخت یک خوشه، از جمله تجهیزات ارتباطات تکراری، مدیریت کلاس کنسول کنسول کنسول مدیریت کلاس کنسول، Sparcclaster نرم افزار PDB نرم افزار و بسته خدمات خوشه ای.

برای اطمینان از عملکرد بالا و در دسترس بودن ارتباطات، خوشه پشتیبانی کامل از تکثیر کامل تمام داده ها را پشتیبانی می کند. گره های خوشه ای با کانال های SunFasteThernet با پهنای باند 100 مگابیت بر ثانیه ترکیب می شوند. برای اتصال زیر سیستم های دیسک، رابط کانال فیبر فیبر فیبر نوری با پهنای باند 25 مگابیت در ثانیه، که حذف درایو ها و گره ها از یکدیگر به فاصله تا 2 کیلومتر. تمام پیوندهای بین گره ها، گره ها و زیرسیستم های دیسک در سطح سخت افزاری تکرار می شوند. سخت افزار، نرم افزار و شبکه خوشه ای به معنای عدم وجود چنین مکان در سیستم، یک شکست تک یا شکست آن کل سیستم است.

پروژه های دانشگاهی

توسعه جالب دانشگاه کنتاکی - KLAT2 خوشه (Kentucky لینوکس Athlon Testbed 2). سیستم KLAT2 شامل 64 گره بدون دیسک با پردازنده های AMD Athlon / 700 مگاهرتز و 128 مگابایت RAM در هر یک است. نرم افزار، کامپایلر و کتابخانه های ریاضی (Sclapack، Blacs و Atlas) به طور موثر از تکنولوژی 3DNow استفاده می شود! پردازنده های AMDچه چیزی باعث افزایش بهره وری شد. علاقه قابل توجهی از تصمیم گیری شبکه مورد استفاده قرار گرفته است، به نام "شبکه همسایه تخت" (FNN). هر گره دارای چهار آداپتور شبکه اترنت سریع از SmartLink است و گره ها با استفاده از نه سوئیچ های 32 پورت متصل می شوند. در عین حال، برای هر دو گره همیشه یک اتصال مستقیم از طریق یکی از سوئیچ ها وجود دارد، اما نیازی به اتصال تمام گره ها از طریق یک سوئیچ تک وجود ندارد. با تشکر از بهینه سازی نرم افزار تحت معماری AMD و توپولوژی FNN، امکان دستیابی به قیمت قیمت / عملکرد رکورد - 650 دلار به ازای هر GFLOPS.

ایده تقسیم خوشه به بخش ها، یک تجسم جالب در پروژه شهر Chiba را که در آزمایشگاه ملی آرگون انجام شد، دریافت کرد. بخش اصلی شامل 256 گره محاسباتی، در هر یک

از آنها دو پردازنده پنتیم III / 500 MHz، 512 مگابایت رم و یک دیسک محلی با ظرفیت 9 گیگابایت وجود دارد. علاوه بر پارتیشن محاسبات، بخش تجسم شامل (32 IBM رایانه های شخصی IBM با گرافیک Matrox Millenium G400، 512 مگابایت رم و 300 گیگابایت درایو)، بخش ذخیره سازی داده ها (8 سرورهای IBM Netfinity 7000 با پردازنده های Xeon / 500 مگاهرتز و 300 گیگابایت درایو) و پارتیشن کنترل (12 رایانه IBM Netfinity 500). همه آنها توسط یک شبکه myrinet که برای پشتیبانی استفاده می شود ترکیب شده است برنامه های موازی، و همچنین اترنت گیگابیت و اترنت سریع برای مدیران و خدمات خدمات. همه بخش ها به 32 رایانه به "شهرها" (شهر) تقسیم می شوند. هر یک از آنها "شهردار" خود را، که به صورت محلی "شهر" خود را خدمت می کند، کاهش بار در شبکه خدمات و ارائه دسترسی سریع به منابع محلی

پروژه های خوشه ای در روسیه

در روسیه، همیشه نیازی به منابع محاسباتی با کارایی بالا بود و هزینه های نسبتا کم پروژه های خوشه ای به عنوان یک انگیزه جدی به انتشار گسترده ای از راه حل های این راه حل ها در کشور ما خدمت می کرد. یکی از اولین ها به نظر می رسد "زوج" خوشه ای، مونتاژ شده در Yvvibd و متشکل از هشت پردازنده پنتیوم II مرتبط با شبکه Myrinet. در سال 1999، محلول خوشه ای بر اساس شبکه SCI در NICEW مورد آزمایش قرار گرفت، که اساسا پیشگام با استفاده از تکنولوژی SCI برای ساخت سیستم های موازی در روسیه است.

یک خوشه با کارایی بالا بر اساس شبکه ارتباطی SCI در مرکز تحقیقات علمی دانشگاه ایالتی مسکو نصب شده است. خوشه NIVC شامل 12 سرور دوگانه پردازنده "Eximer" بر اساس اینتل پنتیوم III / 500 مگاهرتز، مجموع 24 پردازنده با عملکرد کلی پیک 12 میلیارد عملیات در هر ثانیه. کل هزینه سیستم حدود 40 هزار دلار یا حدود 3.33 هزار در هر 1 گرم است.

گره های محاسباتی خوشه ای توسط کانال های شبکه ی یکپارچه SCI در یک Tor 3x4 دو بعدی متصل می شوند و به طور همزمان به سرور مرکزی متصل می شوند از طریق شبکه کمکی اترنت سریع و سوئیچ سوپرمارکت 3COM. شبکه SCI یک هسته خوشه ای است این سیستم یک محاسبات منحصر به فرد محاسبات یک کلاس فوق العاده کامپیوتر به یک کلاس گسترده از وظایف. حداکثر نرخ مبادله داده ها بر روی شبکه SCI در برنامه های کاربردی کاربر بیش از 80 مگابایت بر ثانیه است و زمان تأخیر حدود 5.6 میکروتر است. هنگام ساخت این خوشه محاسباتی، راه حل یکپارچه Wulfkit توسط راه حل های اتصال دلفین و رایانه Scali (نروژ) استفاده شد.

ابزار اصلی برنامه ریزی موازی بر روی خوشه، MPI (رابط رمز عبور پیام) Scampi 1.9.1 است. در آزمون LinPack، هنگام حل یک سیستم معادلات خطی با ماتریس اندازه 16000x16000، عملکرد واقعی بیش از 5.7 GFLOPS بود. در آزمون های بسته NPB، عملکرد خوشه ای قابل مقایسه است، و گاهی اوقات بیش از عملکرد ابر رایانه های خانواده Cray T3E با همان تعداد پردازنده ها است.

منطقه اصلی استفاده از خوشه محاسبات NIVZ MSU NIVC پشتیبانی از تحقیقات علمی اساسی و آموزشی است.

از دیگر پروژه های جالب توجه، باید این تصمیم را که در دانشگاه سنت پترزبورگ بر اساس تکنولوژی اترنت سریع انجام شد اشاره کرد: خوشه های جمع آوری شده می توانند مورد استفاده قرار گیرند و به عنوان کلاس های آموزش مستقل کامل، و به عنوان یک نصب محاسباتی کامل که یک تک را حل می کنند وظیفه. در مرکز علمی سامرا

آنها در طول راه برای ایجاد یک خوشه محاسباتی غیر انسانی، که شامل کامپیوترهای مبتنی بر پردازنده های آلفا و پنتیوم III بودند، رفتند. در دانشگاه فنی سنت پترزبورگ، نصب بر اساس پردازنده های آلفا و شبکه Myrinet بدون استفاده از دیسک های محلی در محاسبات گره. در دانشگاه فنی حمل و نقل هوایی UFA، یک خوشه بر اساس دوازده ایستگاه آلفا، یک شبکه اترنت سریع و سیستم عامل لینوکس طراحی شده است.

2. دستگاه های منطق محاسباتی. ساختار، رویکرد به طراحی، معادلات اصلی آلو

3. سازمان مدار انتقال در بخش اتحادیه. فرمت کمی، طرح انتقال سریع

4. ثبت نام Allu ساختار اساسی ریزپردازنده است. گزینه هایی برای ساخت سازه های ثبت نام. مدیریت وظیفه و هماهنگ سازی

7. دستگاه مدیریت سیستم عامل. ساختار، راه هایی برای تشکیل سیگنال های کنترل، Microcomand آدرس

8. سیستم دستورات و راه های مربوط به اپراتورها. اصل نوار نقاله اجرای دستورات

9. اختلافات ساختاری و راه های به حداقل رساندن آنها. مناقشات بر اساس داده ها، متوقف کردن نوار نقاله و اجرای مکانیسم جداسازی

10. کاهش تلفات برای انجام دستورات انتقال و به حداقل رساندن درگیری های مدیریت

11. طبقه بندی سیستم های حافظه. سازمان سیستم های حافظه در سیستم های ریزپردازنده

12. اصول حافظه نقدی. راه های نمایش داده ها از RAM به حافظه نقدی

13. حالت های دسترسی مستقیم حافظه. سازه های کنترل کننده PDP

14. اصول حافظه مجازی

15. ساختارهای معمول و اصول عملکرد سیستم های ریزپردازنده

16. حالت های اصلی عملکرد سیستم ریزپردازنده. پیاده سازی برنامه اصلی، فراموشی های فراخوانی

17. حالت های اصلی عملکرد سیستم ریزپردازنده. پردازش وقفه ها و استثنائات

18. سیستم ها با یک نظرسنجی چرخه ای. بلوک وقفه اولویت

19. تبادل اطلاعات بین عناصر در سیستم های ریزپردازنده. داور بزرگراه

قسمت 2

20. طبقه بندی معماری های ریزپردازنده مدرن. معماری با مجموعه فرمان کامل و اختصار، معماری Supercalar

21. طبقه بندی معماری های ریزپردازنده مدرن. پرینستون (سابقه نایمان) و معماری هاروارد

22. ساختار مدرن 8 بیتی میکروکنترلر CRISC-ARCHITECTURE

22 (؟). ساختار مدرن 32 بیتی Microcontrollers Crisc-Architecture

23. پردازنده های پردازش دیجیتال: اصول سازمان، ساختار عمومی

24. پردازنده های هدف کلی در مثال ArchitectureIntelp6

25. طبقه بندی معماری سیستم های محاسبات موازی. سیستم های با حافظه مشترک مشترک

26. طبقه بندی معماری سیستم های محاسباتی موازی. سیستم های حافظه توزیع شده

27. سیستم های محاسبات نوار نقاله بردار. حافظه با بسته نرم افزاری ویژگی های STRIGURCRAY-1

28. سیستم های محاسبات ماتریس. ویژگی های ساخت سیستم های حافظه و سوئیچ ها

29. دستگاه های کنترل داده ها. اصول عملیات و ویژگی های ساخت و ساز آنها. روش ارائه برنامه گرافیکی

30. سیستم ها با ساختار قابل برنامه ریزی. محیط محاسبات یکنواخت

31. سیستم های کامپیوتری سیستولیک

32. سیستم های محاسبات خوشه ای: تعریف، طبقه بندی، توپولوژی

سیستم های محاسبات خوشه ای همچنان ادامه توسعه ایده هایی که در معماری سیستم های MPA قرار دارند، تبدیل شده است. اگر یک ماژول پردازنده به عنوان یک گره کامل محاسباتی در سیستم MPA انجام شود، کامپیوترهای سریال به عنوان گره های محاسباتی استفاده می شوند.

خوشه- این یک مجموعه متصل از رایانه های کامل است که به عنوان یک منبع محاسبات استفاده می شود. به عنوان گره خوشه ای، هر دو (خوشه های همگن) و ماشین های محاسباتی مختلف (خوشه های ناهمگن) می توانند مورد استفاده قرار گیرند. توسط معماری آن، سیستم محاسبات خوشه ای ضعیف است. برای ایجاد خوشه ها، رایانه های شخصی ساده تک پردازنده معمولا از سرورهای SMP دو یا چهار پردازنده استفاده می شود. این هیچ محدودیتی بر ترکیب و معماری گره ها اعمال نمی کند.

در سطح سخت افزاری خوشه- ترکیبی از سیستم های محاسباتی مستقل توسط شبکه متحد شده است.

ساده ترین طبقه بندی سیستم های خوشه ای بر اساس روش استفاده از آرایه های دیسک است: با هم یا جداگانه.

پیکربندی خوشه ای بدون دیسک های مشترک:

پیکربندی خوشه ای با دیسک های مشترک:

ساختارهای خوشه های دو گره نشان داده شده است، هماهنگی آن توسط خط با سرعت بالا مورد استفاده برای تبادل پیام ها تضمین شده است. این می تواند یک شبکه محلی مورد استفاده قرار گیرد و همچنین در رایانه های خوشه ای یا یک خط اختصاصی گنجانده نشده است. در مورد یک خط اختصاصی، یک یا چند گره خوشه ای به یک شبکه محلی یا جهانی دسترسی خواهد داشت، در نتیجه اتصال بین خوشه سرور و سیستم های مشتری از راه دور.

تفاوت بین خوشه های نماینده این است که در مورد یک شبکه محلی، گره ها از آرایه های دیسک محلی استفاده می کنند و در مورد یک خط گره انتخاب شده، یک آرایه بیش از حد از درایوهای سخت مستقل و یا به اصطلاح RAID (RedundantArrayOfIndeptiveks) است به اشتراک گذاشته شده RAID شامل چندین دیسک کنترل شده توسط کنترلر، متصل شده توسط کانال های با سرعت بالا و درک شده توسط سیستم خارجی به عنوان یک کل. بسته به نوع آرایه مورد استفاده، درجه های مختلف تحمل خطا و سرعت می تواند ارائه شود.

طبقه بندی خوشه ها برای روش های خوشه بندی استفاده شده، که ویژگی های اصلی عملکردی سیستم را تعیین می کند:

∙ خوشه بندی با رزرو منفعل؛

∙ خوشه بندی با رزرو فعال؛

∙ سرورهای مستقل؛

∙ سرورها با اتصال به تمام دیسک ها؛

∙ سرورها با دیسک های مشترک.

خوشه بندی رزرو قدیمی ترین و جهانی است. یکی از سرورها کل بار محاسبات را فرض می کند، در حالی که دیگر غیر فعال است، اما آماده پذیرش محاسبات زمانی که سرور اصلی شکست می خورد. سرور فعال (یا اولیه) به صورت دوره ای یک پیام پشتیبان را با یک سرور پشتیبان (Secondary) ارسال می کند. در غیاب پیام های تاکتیکی، که به عنوان یک شکست اولیه سرور محسوب می شود، سرور ثانویه کنترل می کند.

رزرو منفعل برای خوشه ها غیرقابل برگشت است. اصطلاح "خوشه" به انواع گره های مرتبط متصل به طور فعال در فرایند محاسبات مربوط می شود و به طور مشترک باعث توهم یک دستگاه محاسباتی قدرتمند می شود. این پیکربندی معمولا از مفهوم یک سیستم با یک سرور ثانویه فعال استفاده می کند و سه روش خوشه بندی وجود دارد: سرورهای مستقل، سرورها بدون به اشتراک گذاری دیسک ها و سرورهای به اشتراک گذاری سرور.

در روش اول، هر گره خوشه به عنوان یک سرور مستقل با دیسک های خود محسوب می شود و هیچ یک از دیسک های موجود در سیستم به اشتراک گذاشته نمی شود.

برای کاهش هزینه های ارتباطی، اکثر خوشه ها در حال حاضر از سرورهای متصل به دیسک های مشترک متصل می شوند، معمولا توسط آرایه دیسک RAID نشان داده می شود. یکی از گزینه های این رویکرد نشان می دهد که به اشتراک گذاری دیسک ها اعمال نمی شود. دیسک های معمولی به پارتیشن تقسیم می شوند و هر گره خوشه ای اختصاص داده می شود. اگر یکی از گره ها رد شود، خوشه را می توان به گونه ای بازسازی کرد که حقوق دسترسی به بخش آن از دیسک معمولی به یک گره دیگر منتقل می شود. با نسخه های مختلف، سرورهای متعدد در زمان دسترسی به دیسک های مشترک جدا شده اند، به طوری که هر گره به تمام بخش های تمام دیسک های رایج دسترسی داشته باشد. این رویکرد نیاز به ابزارهای مسدود کننده ای دارد که تضمین می کند که تنها یکی از سرورها در هر زمان به داده ها دسترسی داشته باشد.

توپولوژی جفت خوشه ای:

توپولوژی خوشه ای در سازماندهی خوشه های دو یا چهار عددی استفاده می شود. گره ها در جفت دسته بندی می شوند، آرایه های دیسک به هر دو گره متصل می شوند که بخشی از جفت هستند و هر گره جفت دسترسی به تمام آرایه های دیسک این جفت دارد. یکی از گره های این جفت به عنوان یک پشتیبان برای دیگری استفاده می شود.

Steam Cluster چهار Chosl یک گسترش ساده از توپولوژی دو منطقه است. هر دو جفت خوشه ای از نقطه نظر مدیریت و تنظیمات به عنوان یک عدد صحیح محسوب می شوند.

توپولوژی n.+ 1:

توپولوژی n. + 1 به شما اجازه می دهد تا خوشه های دو، سه و چهار گره را ایجاد کنید. هر آرایه دیسک تنها به دو گره خوشه متصل است. آرایه های دیسک بر اساس طرح RAID1 (آینه) سازماندهی می شوند. یک سرور دارای ارتباط با تمام آرایه های دیسک است و به عنوان یک پشتیبان برای سایر گره های دیگر (پایه یا فعال) عمل می کند. سرور پشتیبان را می توان برای اطمینان از درجه بالایی از آمادگی در یک جفت با هر یک از گره های فعال استفاده کرد.

توپولوژی n. × n. شبیه به توپولوژی n. + 1 به شما اجازه می دهد خوشه های دو، سه و چهار گره را ایجاد کنید، اما بر خلاف انعطاف پذیری و مقیاس پذیری بیشتر است. فقط در این توپولوژی، تمام گره های خوشه ای به تمام آرایه های دیسک دسترسی دارند که به نوبه خود بر اساس طرح RAID1 (آینه) ساخته می شوند. مقیاس پذیری توپولوژی در سادگی اضافه کردن گره های اضافی به آرایه های خوشه ای و دیسک بدون تغییر اتصالات در سیستم ظاهر می شود.

توپولوژی اجازه می دهد تا شما را به سازماندهی یک سیستم تحمل گسل آبشار، که در آن پردازش از یک گره معیوب به پشتیبان گیری منتقل می شود، و در صورت عدم شکست آن در مجمع بعدی، و غیره، توپولوژی عمومی دارای تحمل و انعطاف پذیری بهتر است در مقایسه با سایر توپولوژی ها.

توپولوژی n.× n.:

توپولوژی با دسترسی به طور کامل جدا شده:

توپولوژی با دسترسی به طور کامل جدا شده است به اتصال هر آرایه دیسک تنها با یک گره خوشه اجازه می دهد. این فقط برای آن برنامه های کاربردی توصیه می شود که معماری دسترسی به طور کامل جداگانه مشخصه است.

خانواده آبی / L و SGI Altix خانواده.

به عنوان یک نرم افزار اساسی برای سازماندهی محاسبات در سیستم های خوشه ای، سرور Compute Cluster Cluster (CCS) 2003 در نظر گرفته شده است. این ویژگی کلی آن و ترکیب خدمات موجود بر گره های خوشه ای است.

هنگام ورود به این بخش، قوانین برای کار با شروع و مدیریت COM COMS CCS داده می شود. جزئیات برنامه زمانبندی CCS را در اجرای وظایف بر روی خوشه توصیف می کند.

1.1. معماری پردازنده های با کارایی بالا و سیستم های خوشه ای

در تاریخ توسعه معماری پردازنده کامپیوتر، دو مرحله عمده را می توان تشخیص داد:

مرحله اول - افزایش فرکانس ساعت پردازنده ها (تا سال 2000)
مرحله دوم - ظهور پردازنده های چند هسته ای (پس از سال 2000)

بنابراین، یک رویکرد مبتنی بر SMP (چند پردازنده متقارن)، که در هنگام ساخت سرورهای با کارایی بالا توسعه یافته است، که در آن چندین پردازنده منابع سیستم را به اشتراک می گذارند، و ابتدا RAM (شکل 1.1 را ببینید)، به سطح حرکت می کند از هسته هسته در داخل پردازنده.

شکل. 1.1.

در راه به پردازنده های چند هسته ای، اولین تکنولوژی فوق العاده Threading، اولین بار در سال 2002 در پردازنده های اینتل پنتیوم 4 استفاده شد:

شکل. 1.2

در این فناوری، دو پردازنده مجازی تمام منابع یک پردازنده فیزیکی را به اشتراک می گذارند، یعنی انبارها، نقاله اعدام و محرک های فردی. در عین حال، اگر یک پردازنده مجازی یک منبع مشترک را دریافت کرد، دوم انتظار انتشار آن را خواهد داشت. بنابراین، پردازنده Hyper-Threading را می توان با یک سیستم عامل چند کاره مقایسه کرد که هر فرایند را که کامپیوتر مجازی خود را با طیف گسترده ای از وجوه و برنامه ریزی روش و زمان این فرآیندها در تجهیزات فیزیکی تضمین می کند، مقایسه می شود. فقط در مورد Hyper-Threading، این همه در سطح سخت افزاری قابل ملاحظه ای اتفاق می افتد. با این حال، دو جریان از دستورات به شما اجازه می دهد تا کارآمدتر از محرک های پردازنده را بارگیری کنید. افزایش واقعی عملکرد پردازنده از استفاده از تکنولوژی Hyper-Threading از 10 تا 20 درصد تخمین زده می شود.

یک پردازنده دو هسته ای کامل (نگاه کنید به شکل 1.3)، در وظایف فردی، رشد عملکرد را از 80 تا 100 درصد نشان می دهد.

شکل. 1.3.

بنابراین، دو هسته ای و در مورد کلی، پردازنده چند هسته ای ، می توان آن را به عنوان SMP در یک مینیاتوری مورد توجه قرار داد، که نیاز به استفاده از مادربردهای چندگانه پیچیده و گران قیمت ندارد.

علاوه بر این، هر هسته ممکن است (به عنوان مثال، در پردازنده Intel Pentium Extreme 840) پشتیبانی از تکنولوژی Hyper-Threading، و بنابراین چنین پردازنده دو هسته ای می تواند به طور همزمان چهار جریان نرم افزار را انجام دهد.

در اوایل سال 2007، اینتل پردازنده ی 80 هسته تک تراشه را معرفی کرد، به نام تراشه تحقیق Teraflops (http://www.intel.com/research/platform/terascale/teraflops.htm). این پردازنده می تواند به عملکرد 1.01 Teraflops با حداقل نرخ ساعت هسته 3.16 گیگاهرتز و ولتاژ 0.95 V برسد. در این مورد، کل مصرف انرژی تراشه تنها 62 W است.

با توجه به پیش بینی های اینتل، نسخه های تجاری پردازنده ها با تعداد زیادی از هسته ها در 5 سال آینده ظاهر می شوند، و تا سال 2010 یک چهارم از تمام سرورهای عرضه شده دارای Terafop هستند کارایی.

سیستم های محاسباتی خوشه ای و معماری آنها

خوشه - این یک سیستم محاسباتی محلی (واقع شده در یک مکان) است که شامل انواع کامپیوترهای مستقل و شبکه های متصل به آنها می شود. علاوه بر این، خوشه یک سیستم محلی است، زیرا در یک دامنه اداری جداگانه به عنوان یک سیستم کامپیوتری واحد مدیریت می شود.

گره های کامپیوتر از آن شامل، رایانه های استاندارد، جهانی (شخصی) مورد استفاده در زمینه های مختلف و برای انواع برنامه های کاربردی است. گره محاسباتی ممکن است شامل یک ریزپردازنده یا چندین شکل گیری، در مورد دوم، پیکربندی متقارن (SMP) باشد.

جزء شبکه خوشه می تواند یک شبکه محلی معمولی باشد یا بر اساس فن آوری های شبکه خاص ساخته شود که انتقال داده های فوق العاده قدرت بین گره های خوشه را فراهم می کند. شبکه خوشه ای برای ادغام گره های خوشه ای طراحی شده است و معمولا از یک شبکه خارجی جدا شده است که از طریق آن کاربران به خوشه دسترسی پیدا می کنند.

نرم افزار خوشه ای شامل دو جزء است:

ابزارهای توسعه / برنامه نویسی و
ابزار مدیریت منابع.

ابزارهای توسعه شامل کامپایلر برای زبان، کتابخانه است مقصد مختلف، ابزار اندازه گیری بهره وری، و همچنین debuggers، که، همه با هم، به شما اجازه می دهد تا برنامه های موازی را بسازید.

نرم افزار مدیریت منابع شامل تاسیسات، مدیریت مدیریت و برنامه ریزی کار است.

اگر چه مدل های برنامه نویسی زیادی برای پردازش موازی وجود دارد، اما در حال حاضر رویکرد غالب مدل مبتنی بر "پیام پیام" (پیام عبور پیام) است. MPI یک کتابخانه از توابع است که در برنامه های موجود در زبان های C یا FORTRAN می تواند پیام های بین فرآیندهای موازی را منتقل کند، و همچنین کنترل این فرآیندها.

جایگزینی برای این رویکرد، زبان های مبتنی بر "فضای آدرس توزیع شده جهانی" (GPAS - فضای آدرس پارتیشن جهانی) است که نمایندگان معمولی آنها زبان HPF (یکپارچه موازی C) هستند.