فرمت : Word
تعداد صفحات : 96
سیستم پایگاهی توزیع شده
تعاریف
پایگاه داده: مجموعه ای است از داده های ذخیره شده و پایا، بصورت مجتمع (یکپارچه) (نه لزوماً همیشه بطور فیزیکی، بلکه حداقل بطورمنطقی)، بهم مرتبط، حتی الامکان با کمترین افزونگی، (دارای یک ساختار منطقی مبتنی بر یک مدل داده ای و توصیف شده بویژه در محیط انتزاعی یعنی در چارچوب همان مدل داده ای )، تحت مدیریت یک سیستم کنترل متمرکز، مورد استفاده یک یا چند کاربر از یک(یا بیش از یک)«سیستم کاربردی»،بطور همزمان و اشتراکی.]روحا83[
شبکه کامپیوتری: مجموعه ای از کامپیوتر ها، مسیر یاب ها، ماهواره ها،اتصالات ارتباطی، که از طریق آن می توان به اطلاعات موجود در کامپیوترهای مختلف عضو این سیستم دسترسی پیدا کرد.
به زبان ساده سیستم پایگاه داده توزیع شده ، مزایای تکنولوژی پایگاه داده و تکنولوژی شبکه را در خود جمع کرده است.البته این یکپارچه سازی[2] ، با تمرکز[3] تفاوت دارد.شکل زیر گویای این مطلب است:
شکل 1- معماری توزیع شده پایگاهی،ترکیبی از تکنولوژی های شبکه و پایگاه داده ها[TAMER99]
- تعریف اول:
یک سیستم توزیع شده پایگاهی، شامل مجموعه ای از مانه هاست[4] که از طریق برخی المانهای اتصال، بهم متصل می باشد بطوریکه :
- هر مانه خود یک سیستم پایگاه داده ها به معنای کامل می باشد.
- مانه ها به نحوی بهم متصل هستند که کاربر هر مانه می تواند به داده های هر مانه دیگر طوری دسترسی یابد که منطقاً با حالتی که تمام داده ها در مانه کاربر مربوطه قرار دارند، فرقی نداشته باشد.
با تعریف ارائه شده فوق از سیستم های پایگاه داده های توزیع شده ،می توان فهمید که سیستم پایگاه داده های توزیع شده، در واقع نوعی شیء مجازی[5] می باشد که مولفه[6]های آن بطور فیزیکی در تعدادی پایگاه داده های واقعی[7] مختلف در تعدادی مانه مجزا قرار دارد . ( در اصل DDB[8] ، اجتماع منطقی این چند پایگاه داده واقعی می باشد ).] [DATE2000
- تعریف دوم:
سیستم توزیع شده پایگاهی، مجموعه ای از داده های ذخیره شده ( با ویژگی های بر شمرده در تعریف پایگاه داده ها)، که منطقاً به یک سیستم تعلق دارند ، ولی در مانه ها ی مختلف یک یا بیش از یک شبکه توزیع شده اند. به عبارتی دیگر، می توان گفت که تعدادی پایگاه داده های ذخیره شده روی کامپیوتر های مختلف داریم که از نظر کابران، پایگاه واحدی هستند. به بیان دیگر، مجموعه ای است از چند پایگاه داده منطقاً یکپارچه(مجتمع)،ولی بطور فیزیکی توزیع شده روی یک شبکه کامپیوتری.]روحا83[
- تعریف سوم:
یک سیستم پایگاهی توزیع شده(DDB) ،مجموعه ای است از چندین پایگاه داده های منطقاً بهم مرتبط از طریق یک شبکه کامپیوتری. سیستم مدیریت پایگاه داده های توزیع شده(DDBMS)،نرم افزاری که مدیریت پایگاه داده های توزیع شده را فراهم می آورد و«توزیع شدگی» را از دید کاربران پنهان می
سازد.[TAMER99]
طبق تعریف فوق، سیستم پایگاه داده های توزیع شده، از مجموعه ای مانه در خواست کننده[9] ( با صفر یا بیشتر عضو فعال ) و یک مجموعه ناتهی از مانه داده[10] ها تشکیل شده است.
مانه های داده ای، قابلیت نگهداری فیزیکی داده های سیستم را دارند در حالیکه مانه های درخواست کننده فاقد این امکان هستند. در مانه های درخواست کننده تنها واسط[11] هایی وجود دارد که با اجرای آنها، داده های ذخیره شده در مانه های داده ها بهتر و راحتتر بدست می آیند.
همانطور که از شکل بالا مشخص است، بجز مانه1 که از نوع مانه درخواست کننده است، بقیه از نوع داده هستند.
اما حالت فوق، تنها حالت ممکن برای پایگاه داده های توزیع شده نیست. در نوع دیگری از معماری توزیع شده پایگاه داده ها، فرض می شود هر مانه(مانه های «درخواست کننده» و «داده ها») بطور منطقی حاوی ]حداقل[یک ماشین مستقل است. بنابراین هر کدام از مانه ها دارای مخزن ذخیره سازی اولیه و ثانویه مستقل خود می باشند. مانه ها، سیستم عامل های مستقل خود را (که می توانند همگن یا ناهمگن باشند)دارند و هر یک قادر خواهند بود برنامه های کاربردی خود را بطور محلی احرا نمایند. مانه ها بوسیله یک شبکه کامپیوتری بهم متصل شده اند. تاکید می شود که اتصال بین مانه ها در این نوع سیستم های توزیع شده، از نوع «اتصال ضعیف»[13] بین پردازنده ها است. منظور از اتصال ضعیف بین پردازنده آن است که هر پردازنده کلاک اختصاصی ، حافظه اولیه و ثانویه و سیستم عامل خود را دارد. در مقابل این نوع اتصال، «اتصال قوی» بین پردازنده ها وجود دارد که در آن پردازنده ها از یک حافظه مشترک[14] و یک کلاک همگام استفاده می کنند. سیستم عامل واحدی پردازنده ها و حافظه را مدیریت می کند. اتصال بین پردازنده از نوع مستقیم است نه از طریق یک شبکه ارتباطی.
گونه دیگری از سیستم های پایگاه داده ها وجود دارد که از جهاتی شبیه سیستم های پایگاه داده های موازی است. این نوع DBMS ها DBMS های موازی کاملاً مستقل[15] نامیده می شوند. در از DBMS های موازی، با بکارگیری معماری چند پردازنده ای، کارایی بالاتر و دسترس پذیری بیشتر را همراه با هزینه کمتر در مقایسه با ابر کامپیوترها خواهیم داشت.
معماری سیستم های پایگاه داده های موازی، جزئیات خاص خود را دارد که در محدوده این نوشتار نمی گنجد.
- تعریف چهارم:
یک سیستم محاسبات توزیع شده[16]،شامل تعدادی عناصر پردازشگر- نه لزوماً همگن- است که از طریق یک شبکه کامپیوتری با هم در ارتباطند. یک سیستم توزیع شده پایگاه داده را می توان منطقاً مجموعه ای چندگانه از پایگاه داده ها دانست که روی یک شبکه کامپیوتری توزیع شده اند و DDBMS نرم افزار مدیریت این پایگاه داده توزیع شده است به نحوی که توزیع شدگی سیستم را از دید کاربر پنهان می سازد.[CONN2002]
- تعریف پنجم:
برخلاف سیستم های پایگاهی موازی[17] که در آنها پردازشگرها کاملاً بهم متصل شده و یک پایگاه داده واحد را تحت کنترل دارند، سیستم های پایگاهی توزیع شده از اتصال نسبتاً ضعیف مانه هایی که هرکدام بطور انحصاری میتوانند عمل کنند تشکیل شده است.
هر مانه ممکن است در پردازش یک تراکنشی که داده مورد نیاز خود را از مانه(های) دیگر دریافت می کند، شرکت کند.
تفاوت اصلی معماری سیستم پایگاهی متمرکز با معماری سیستم پایگاهی توزیع شده در محل استقرار داده ها است. در معماری متمرکز، داده ها بطور فیزیکی در یک رسانه ذخیره سازی قرار دارند در حالیکه داده های معماری توزیع شده در مانه های مختلف توزیع شده اند. همین توزیع داده ها در مانه های مختلف ، باعث تفاوت های زیادی در پردازش تراکنش ها و درخواست ها با معماری متمرکز ایجاد نموده است.[SILB2002]
منظور از اینکه هر مانه دارای سیستم پایگاه داده کامل و مستقلی است این است که : هر مانه پایگاه- داده های واقعیِ محلی[18] خود، کاربران، DBMS و نرم افزارها ی مدیریت تراکنش ها[19] و مدیریت ارتباط داده های[20] خود را دارد. خصوصاً، یک کاربر می تواند عملیات روی داده های مانه خود را مانند حالتی که مانه آن اصلاً عضو یک شبکه توزیع شده پایگاه داده ها نباشد، به همان شکل محلی و متمرکز انجام دهد. ( حداقل مطلوب این است. )] DATE2000 [ .
مولفه نرم افزاری [21] جدید در هر مانه (بطور منطقی)،گسترده ای از همان DBMS محلی و سیستم جدید که ترکیبی از مولفه های نرم افزاری و DBMS موجود است،همان سیستم مدیریت پایگاه داده توزیع شده به حساب می آید] DATE2000 [.
درتعریف سیستم پایگاه داده های توزیع شده،فرض می شود که مانه های سازنده سیستم، بطور فیزیکی از هم مجزا هستند، گرچه در اساس، مجزا بودن از نظر منطقی نیز کافی است(معمولا ًدر دنیای واقع چنین است که مانه ها از نظر جغرافیایی از هم جدا هستند).
مثلاً ممکن است دو مانه، کنار هم بر روی یک ماشین فیزیکی[22] قرار گرفته باشند.
در بیشتر تحقیقات اولیه فرض بر توزیع جغرافیایی مانه ها بود، درحالی که بیشتر سازمانهای تجاری اخیر در راستای توزیع محلی[23] فعالیت می کنند که در آن تعدادی مانه همگی در یک ساختمان و از طریق شبکه محلی بهم متصل شده اند.
- مزایا و معایب سیستم پایگاهی توزیع شده
پیشرفت تکنولوژی سیستم های مدیریت پایگاه داده ها، با توسعه تکنولوژی محاسبات توزیع شده و پردازش های موازی همگام شده است. نتیجه نهایی این دو سیستم های مدیریت پایگاه داده های توزیع شده و موازی است. سازمانها بطور معمول، دارای ماهیت توزیع شده[24] هستند. این توزیع بطور منطقی و بصورت زیر بخش ها، دپارتمان ها[25] و گروه های کاری[26] و در اکثر مواقع بطور فیزیکی می باشد. در نتیجه سیستم توزیع شده ، ما را قادر می سازد تا ساختار پایگاه داده های مورد نیاز سازمانها را شبیه ساختار واقعی آنها ایجاد کنیم. بدین صورت که، داده محلی را می توان همانطور محلی نگه داری کرد در حالیکه در صورت نیاز امکان دسترسی به داده های دور[27] بطور همزمان نیز وجود داشته باشد .
طراحی و پیاده سازی پایگاه داده های توزیع شده همگن