تاریخچه
پایگاه دادهها در اولین روزهای پیدایش محاسبات الکترونیک به کار گرفته شدند. اما اکثر آنها برنامههای سفارشیای بودند که برای دستیبابی به پایگاه دادههای سفارشی نوشته میشدند . این سیستمها بر خلاف سیستمهای مدرنی که میتوانند در پایگاه دادههای مختلف به کار گرفته شوند، ارتباط تنگاتنگی با پایگاه دادهها دارند. انواع پایگاه دادهها عبارتند از:
تعریف پایگاه داده
سیستم بانک اطلاعاتی یک سیستم ک مپیوتری نگهداری رکوردهاست در وا قع آن را می توان بعنوان یک قضیه الکترونیکی برای نگهداری دادها رکوردها در نظرگرفت.
تعریف دیگری از پایگاه داده:مجموعهای از دادهای پایدار که توسط سیستم های کاربردی موجود در موسسات مورد استفاده قرار می گیرد.
انواع پایگاه داده
1-پایگاه داده پیمایشی
2-پایگاه داده رابطه ای
3-پایگاه داده چند بعدی(سلسله مراتبی)
4-پایگاه داده شی گرائی
5- پایگاه داده شبکه های
پایگاه دادههای پیمایشی
رشد کاربری کامپیوتر، پیدایش سیستمهای پایگاه دادههای همه منظوره را موجب گردید. و در اواسط 1960 چنین سیستمهایی در بخش تجاری به کار گرفته شد. چارلز بچ من، نویسنده یکی از چنین محصولاتی با نام IDS، گروه Database Task Group را بنیان نهاد که این گروه مسوول ایجاد و استاندارد سازی COBOL شد. آنها در سال 1971 استاندارد خود را عرضه نمودند. این استاندارد Codasyle approach نام داشت. این شیوه مبتنی بر پیمایش دستی مجموعه دادهها بود. هنگامی که پایگاه دادهها برای اولین بار برنامه را باز میکرد، به اولین رکورد در پایگاه دادهها و به همین ترتیب نیز به سایر بخشهای داده نیز اشاره میشد. برنامه نویس برای دسترسی به یک رکورد خاص مجبور بود تا این اشارهگرها رابه ترتیب دنبال کند تا به رکورد موردنظر برسد. در query های ساده مانند " یافتن تمام افرادی که در سوئد زندگی میکنند " باید برای جستجو در کل مجموعه دادهها برنامه نویسی میشد و دستوری به نام find وجود نداشت. شرکت IBM سیستم مدیریت پایگاه دادههایی به نام IMS داشت. این سیستم از نظر مفهوم مشابه codasyle بود، اما برخلاف آن که از مدل شبکهای استفاده مینمود، IMS مدل سلسله مراتبی را به کار میبرد.
پایگاه دادههای رابطهای
ادگار کاد که در شرکت آیبیام کار میکرد در سال 1970 مقالاتی در زمینه شیوه جدیدی برای ساخت پایگاه دادهها نوشت. یکی از مقالات وی که Relational Model of Data for Shared Data Bank نام داشت، به بررسی سیستم جدیدی برای ذخیره سازی و کار با پایگاه دادههای بزرگ پرداخته بود. در این شیوه به جای اینکه رکورد به صورت رکوردهای free-form همانگونه که در روش codasyle آمده بود، ذخیره شوند، از جدولی با رکوردهایی با طول ثابت استفاده میشد.
چنین سیستمی برای ذخیره سازی پایگاه دادههای پراکنده و در جاییکه بعضی از دادههای رکورد خالی هستند، کارآیی ندارد. مدل رابطهای این مشکل را حل کرده است. بدین صورت که دادهها به یکسری جدول تقسیم میشوند و عناصر اختیاری از جدول اصلی خارج میگردند و در صورت نیاز در جدول قرار میگیرند. چنین سیستمی برای ردیابی اطلاعات کاربران، اسامی و نشانی آنان و غیره به کار میرود. دادهها در روش پیمایشی در یک رکورد جای میگیرند و آیتمهایی که مورد استفاده قرار نگیرند، در پایگاه دادهها نیز نخواهند بود. دادهها در شیوه رابطهای در جداول جداگانهای، مثلا جدول اسامی، جدول نشانیها و غیره جای میگیرند. برقراری ارتباط بین اطلاعات نکته مهم در این سیستم است. درمدل رابطهای بعضی از بیتهای اطلاعات به عنوان کلید معرفی میشوند و منحصرا بیانگر رکورد خاصی هستند. هنگامی که اطلاعات کاربر جمع آوری میشود، میتوان این اطلاعات را که در جداول اختیاری ذخیره میشوند، با جستجوی کلید مربوطه یافت.
پایگاه دادههای چند بعدی
پایگاه دادههای رابطهای توانست به سرعت بازار را تسخیر کند، هرچند کارهایی نیز وجود داشت که این پایگاه دادهها نمیتوانست به خوبی انجام دهد. به ویژه به کارگیری کلیدها در چند رکورد مرتبط به هم و در چند پایگاه داده مشترک، کندی سیستم را موجب میشد. برای نمونه برای یافتن نشانی کاربری با نام دیوید، سیستم رابطهای باید نام وی را در جدول کاربر جستجو کند و کلید اصلی (primary key ) را بیابد و سپس در جدول نشانیها، دنبال آن کلید بگردد. اگر چه این وضعیت
از نظر کاربر، فقط یک عملیات محسوب، اما به جستجو درجداول نیازمند است که این کار پیچیده و زمان بر خواهد بود. راه کار این مشکل این است که پایگاه دادهها اطلاعات صریح درباره ارتباط بین دادهها را ذخیره نماید. میتوان به جای یافتن نشانی دیوید با جستجو ی کلید در جدول نشانی، اشارهگر به دادهها را ذخیره نمود. در واقع، اگر رکورد اصلی، مالک داده باشد، در همان مکان فیزیکی ذخیره خواهد شد و از سوی دیگر سرعت دسترسی افزایش خواهد یافت.
چنین سیستمی را پایگاه دادههای چند بعدی مینامند. این سیستم در هنگامی که از مجموعه دادههای بزرگ استفاده میشود، بسیار سودمند خواهد بود. از آنجاییکه این سیستم برای مجموعه دادههای بزرگ به کار میرود، هیچگاه در بازار به طور مستقیم عمومیت نخواهد یافت.
پایگاه دادههای شیء
اگر چه سیستمهای چند بعدی نتوانستند بازار را تسخیر نمایند، اما به توسعه سیستمهای شیء منجر شدند. این سیستمها که مبتنی بر ساختار و مفاهیم سیستمهای چند بعدی هستند، به کاربر امکان میدهند تا اشیاء را به طور مستقیم در پایگاه دادهها ذخیره نماید. بدین ترتیب ساختار برنامه نویسی شیء گرا (object oriented ) را میتوان به طور مستقیم و بدون تبدیل نمودن به سایر فرمتها، در پایگاه دادهها مورد استفاده قرار داد. این وضعیت به دلیل مفاهیم مالکیت (ownership) در سیستم چند بعدی، رخ میدهد. در برنامه شیء گرا (OO)، یک شیء خاص "مالک " سایر اشیاء در حافظه است، مثلا دیوید مالک نشانی خود میباشد. در صورتی که مفهوم مالکیت در پایگاه دادههای رابطهای وجود ندارد.
ویژگیهای سیستم مدیریت پایگاه دادهها
پس از این مقدمه به توصیف سیستم مدیریت پایگاه دادهها میپردازیم. سیستم مدیریت پایگاه دادهها، مجموعهای پیچیده از برنامههای نرمافزاری است که ذخیره سازی و بازیابی دادههای (فیلدها، رکوردها و فایلها) سازمان را در پایگاه دادهها، کنترل میکند. این سیستم، کنترل امنیت و صحت پایگاه دادهها را نیز بر عهده دارد. سیستم مدیریت پایگاه دادهها، درخواستهای داده را از برنامه میپذیرد و به سیستم عامل دستور میدهد تا دادهها ی مناسب را انتقال دهد. هنگامی که چنین سیستمی مورد استفاده قرار میگیرد، اگر نیازمندیهای اطلاعاتی سازمانی تغییر یابد، سیستمهای اطلاعاتی نیز آسانتر تغییر خواهند یافت. سیستم مذکور از صحت پایگاه دادهها پشتیبانی میکند. بدین ترتیب که اجازه نمیدهد بیش از یک کاربر در هر لحظه، یک رکورد را به روز رسانی کند. این سیستم رکوردهای تکراری را در خارج پایگاه دادهها نگاه میدارد. برای مثال، هیچ دو مشترک با یک شماره مشتری، نمیتوانند در پایگاه دادهها وارد شوند. این سیستم روشی برای ورود و به روز رسانی تعاملی پایگاه دادهها فراهم میآورد. یک سیستم اطلاعات کسب و کار از موضوعاتی نظیر (مشتریان، کارمندان، فروشندگان و غیره) و فعالیتهایی چون (سفارشات، پرداختها، خریدها و غیره) تشکیل شده است. طراحی پایگاه دادهها، فرایند تصمیم گیری درباره نحوه سازماندهی این دادهها در انواع رکوردها و برقراری ارتباط بین رکوردهاست.سیستم مدیریت پایگاه دادهها میتواند ساختار دادهها و ارتباط آنها را در سازمان به طور اثر بخش نشان دهد. سه نوع مدل متداول سازمانی عبارتند از: سلسله مراتبی، شبکهای و رابطهای. یک سیستم مدیریت پایگاه دادهها ممکن است یک، دو یا هر سه روش را فراهم آورد.
سرورهای پایگاه دادهها، کامپیوترهایی هستند که پایگاه دادههای واقعی را نگاه میدارند و فقط سیستم مدیریت پایگاه دادهها و نرمافزار مربوطه را اجرا میکنند. معمولا این سرورها کامپیوترهای چند پردازندهای با آرایههای دیسک RAID برای ذخیره سازی میباشند.
فهرست سیستمهای متداول مدیریت پایگاه دادهها
Closed source :
• IBM (DB2)
• FileMaker, Inc (FileMaker Pro)
• IBM (IMS)
• Informix
• Computer Associates (Ingres)
• Borland (InterBase)
• Micosoft (Microsoft SQL Server)
• Microsoft (Microsoft Access)
• Mimer AB (Mimer SQL)
• Oracle
• Sybase
• NCR Corporation (Teradata)
Open Source :
• Sleepycat software (Berkeley DB )
• IBPhoenix (Firebird)
• My SQL AB (My SQL)
• PostgreSQL
• MaxDB
• SQLite
- Data warehousing
انبار دادهها
تکنولوژی انبار دادهها شامل مجموعهای مفاهیم و ابزارهای جدیدی است که با فراهم آوردن اطلاعات از دانشگران (افراد اجرایی، مدیر و تحلیلگر) در تصمیم گیری پشتیبانی مینماید. دلیل اصلی ساخت انبار داده ها، بهبود کیفیت اطلاعات در سازمان است، در واقع دسترسی به دادهها از هر جا درون سازمان دادهها از منابع داخلی و خارجی تهیه میشوند و به اشکال گوناگون از دادههای ساختاری گرفته تا دادههای ساخت نیافته مانند فایلهای متنی یا چند رسانهای، در مخزنی مجتمع میشوند. انبار دادهها یا DWH مخزنی از این دادههاست که به صورتی قابل درک در دسترس کاربران نهایی کسب و کار قرار میگیرد.
از اواسط سالهای 1980 نیاز به انبار دادهها به وجود آمد و دریافتند که سیستم های اطلاعاتی باید به صورت سیستمهای عملیاتی و اطلاعاتی مشخص شوند. سیستمهای عملیاتی از فعالیتهای روزانه کسب و کار پشتیبانی مینمایند و برای پاسخگویی سریع به ارتباطات از پیش تعریف شده مناسب هستند. دادههای عملیاتی ارائه بیدرنگ و فعلی وضعیت کسب و کار میباشند. اما سیستمهای اطلاعاتی برای مدیریت و کنترل کسب وکار به کار میروند. این سیستمها از تجزیه و تحلیل دادهها برای اتخاذ تصمیم درباره عملکرد آنی و آتی سازمان پشتیبانی میکنند و برای در خواستهای موردی، پیچیده و به طور عمده فقط خواندنی طراحی شدهاند.دادههای اطلاعاتی تاریخی هستند، به عبارتی بیانگر دیدگاه ثابتی از کسب وکار در یک دوره زمانی میباشند.
ویژگیهای اصلی دادههای انبار دادهها
دادههای موجود در انبار دادهها از سیستمهای عملیاتی متنوع (نظیر سیستمهای پایگاه دادهها) و منابع دادهای خارجی (نظیر پایگاه دادههای آماری و WWW )یکپارچه میشوند. تفاوتهای ساختاری ومعنایی دادهها باید پیش از یکپارچه سازی انسجام یابند. برای مثال دادهها باید مطابق با مدل دادهای یکپارچه "همگن" شوند. بعلاوه، مقادیر دادهای سیستمهای عملیاتی باید پاک شوند تا دادههای صحیحی در انبار دادهها وارد شوند. نیاز به دادههای تاریخی یکی از موارد مهم درشیوه انبار دادههاست. دادههای تاریخی برای تحلیل روند کسب وکارضروری هستند. البته هزینه نگهداری این گونه دادهها نیز باید مورد توجه قرار گیرد. بعلاوه، دادههای انبار دادهها ثابت هستند، برای مثال دسترسی به DWH از نوع خواندنی است. انجام اصلاحات در این دادهها فقط هنگامی صورت میگیرد که اصلاحات دادههای منبع در انبار انتشار یابند. DWH دادههای دیگری به نام دادههای اشتقاق یافته (derived data) دارد. این دادهها به طور صریح در منابع عملیاتی ذخیره نمیشوند، بلکه در حین بعضی از فرایندها از دادههای عملیاتی، اشتقاق مییابند. برای مثال دادههای فروش را میتوان در سطوح مختلف (هفتگی، ماهانه، فصلی) در انبار ذخیره نمود.
سیستمهای انبار دادهها
سیستم انبار دادهها (DWS) شامل انبار دادهها و همه مولفههایی است که برای ساخت، دستیابی و نگهداری DWH به کار میروند. انبار دادهها بخش مرکزی سیستم انبار دادهها را تشکیل میدهد. گاهی اوقات انبار دادهها حجم عظیمی از اطلاعات را در واحدهای منطقی کوچکتر به نام Data Mart نگهداری میکند. مولفه آماده سازی، مسوولیت کسب یا دریافت دادهها را بر عهده دارد. این مولفه شامل همه برنامهها وبرنامههای کاربردیای است که مسوول استخراج دادهها از منابع عملیاتی هستند. مولفه دستیابی شامل برنامههای کاربردی مختلف (OLAP یا برنامههای کاربردی داده کاوی) است که امکان استفاده از اطلاعات ذخیره شده در انبار دادهها را فراهم میآورند.
مولفه مدیریت Metadata، وظیفه مدیریت، تعریف و دستیبابی به انواع مختلف Metadata را بر عهده دارد. در اصل ،Metadata "دادههایی درباره دادهها" یا "دادههایی است که مفهوم دادهها را توصیف میکنند". انواع مختلف Metadata در انبار دادهها وجود دارند. مثلا اطلاعاتی درباره منابع عملیاتی، ساختار دادههای DWH و کارهایی که در حین ساخت، نگهداری و دستیبابی به DWH انجام میشوند. نیاز به Metadata شناخته شده است. پیاده سازی یک DWS منسجم ،کار پیچیده و دشواری است و شامل دو فاز می باشد. درفاز اول که پیکربندی DWS نام دارد، دیدگاه مفهومی انبار دادهها مطابق با نیازمندیهای کاربر مشخص میشود. سپس منابع دادهای دخیل و روش استخراج و بار گذاری در انبار دادهها تعیین میگردد. سرانجام، درباره پایگاه دادههای مورد نظر و روشهای دستیبابی دادهها تصمیم گیری خواهد شد. پس از بار گذاری اولیه، در فاز عملیات DWS باید دادههای انبار دادهها به منظور منظم refresh شوند.
طراحی انباردادهها
روشهای طراحی انباردادهها امکان پردازش کارآمد query را برروی حجم عظیمی از دادهها فراهم میآورند. نوع ویژهای از الگوی پایگاه دادهها به نام star برای مدل سازی انباردادههای چند بعدی به کار میرود. در این حالت، پایگاه دادهها از یک جدول مرکزی واقعیت یا fact و جداول چند بعدی تشکیل شده است. جدول واقعیت حاوی tuple هایی است که بیانگر واقعیتهای کسب و کار مانند فروش یا عرضه هستند. هر tuple جدول واقعیت به tupleهای جدول چند بعدی اشاره دارد. هرtuple جدول چند بعدی مواردی نظیر محصولات، مشتریان، زمان و فروشنده را نشان میدهد.
فرمت این مقاله به صورت Word و با قابلیت ویرایش میباشد
تعداد صفحات این مقاله 22 صفحه
پس از پرداخت ، میتوانید مقاله را به صورت انلاین دانلود کنید
دانلود مقاله مدیریت پایگاه داده