دانلود با لینک مستقیم و پر سرعت .
لینک پرداخت و دانلود *پایین مطلب*
فرمت فایل:Word (قابل ویرایش و آماده پرینت)
تعداد صفحه39
بخشی از فهرست مطالب
فصل 1 مقدمه.................................... 9
- 1 مقدمه..................................... 10
فصل 2 مفاهیم داده کاوی........................ 12
- 1 فرایند داده کاوی.......................... 13
- 2 دو مفهوم اساسی در داده کاوی............... 14
- 3 اساس داده کاوی............................ 15
- 4 عوامل ایجاد داده کاوی..................... 16
- 5 زیر بنای داده کاوی........................ 16
- 6 عناصر داده کاوی........................... 17
- 7 مراحل داده کاوی........................... 18
- 8 وظایف داده کاوی........................... 21
- 9 فنون داده کاوی............................ 22
- 10............................ معماری داده کاوی 25
- 11................... تکنیک های مختلف داده کاوی 26
فصل 3 کاربرد های داده کاوی.................... 28
- 1 معرفی..................................... 29
- 2 کاربرد داده کاوی در کتابخانه ها و محیط های دانشگاهی 30
- 3 کاربرد داده کاوی در فعالیت شرکت ها........ 32
- 4 کاربرد داده کاوی در مدیریت و کشف فریب..... 32
- 5 کاربرد داده کاوی در صنعت خورده فروشی...... 33
- 6 داده کاوی در مدیریت ارتباط با مشتری....... 33
- 7 کاربرد داده کاوی در پزشکی................. 35
- 8 وب کاوی................................... 35
- 9 تصویر کاوی................................ 37
فهرست مطالب
فصل 4 مثال تفهیمی در مورد داده کاوی........... 38 مثال تفهیمی در مورد داده کاوی................................ 39
فهرست اشکال
شکل 2.1 فنون داده کاوی....................... 22
شکل 2.2 نمونه ای از یک درخت تصمیم............ 24
شکل 2.3 طبقه بندی در داده کاوی............... 27
شکل 3.1 داده کاوی در مدیریت ارتباط با مشتری.. 34
فهرست جداول
جدول 3.1 کاربردهای داده کاوی درکتابخانه ها.... 31
فصل اول
مقدمه
1.1 مقدمه :
درطول دهه گذشته باپیشرفت روزافزون کاربرد پایگاه داده ها،حجم داده های ثبت شده به طور متوسط هر5سال 2برابرمی شود. دراین میان سازمان هایی موفقند که بتوانند حداقل 7٪داده هایشان راتحلیل کنند. تحقیقات انجام یافته نشان داده است که سازمانها کمترازیک درصد داده هایشان رابرای تحلیل استفاده می کنند.
به عبارت دیگردرحالی که غرق درداده ها هستند تشنه دانش می باشند.
بنابراعلام دانشگاه MIT دانش نوین داده کاوی (Data mining) یکی ازده دانش درحال توسعه ای است که دهه آینده راباانقلاب تکنولوژی مواجه می سازد.این تکنولوژی امروزه دارای کاربرد بسیاروسیعی درحوزه های مختلف است به گونه ای که امروزه حدومرزی برای کاربرد این دانش درنظرنگرفته وزمینه های کاری این دانش راازذرات کف اقیانوس ها تااعماق فضامی دانند.
امروزه بیشترین کاربرد داده کاوی دربانکها، مراکزصنعتی وکارخانجات بزرگ، مراکزدرمانی وبیمارستانها ،مراکز تحقیقاتی ،بازاریابی هوشمند وبسیاری ازموارددیگرمی باشد.
داده کاوی پل ارتباطی میان علم وآمار،علم کامپیوتر، هوش مصنوعی ،الگو شناسی،فراگیری ماشین وبازنمایی بصری داده می باشد.داده کاوی فرآیندی پیچیده جهت شناسایی الگوها ومدل های صحیح، جدید وبه صورت بالقوه مفید، درحجم وسیعی ازداده می باشد، به طریقی که این الگوها ومدلها برای انسانها قابل درک باشد.داده کاوی به صورت یک محصول قابل خریداری نمی باشد،بلکه یک رشته علمی وفرآیندی است که بایستی به صورت یک پروژه پیاده سازی شود.
کاوش داده ها به معنی کنکاش داده های موجود درپایگاه داده وانجام تحلیل های مختلف برروی آن به منظوراستخراج اطلاعات می باشد.
داده کاوی فرآیندی تحلیلی است که برای کاوش داده ها( معمولاً حجم عظیمی ازداده ها) صورت می گیرد ویافته هابا به کارگیری الگوهایی ،احرازاعتبارمی شوند.هدف اصلی داده کاوی پیش بینی است.وبه صورت دقیق ترمی توان گفت:
" کاوش داده ها شناسایی الگوهای صحیح ،بدیع، سودمند وقابل درک ازداده های موجود دریک پایگاه داده است که بااستفاده ازپردازش های معمول قابل دستیابی نیستند."
فصل دوم
مفاهیم داده کاوی
2.1 فرایند داده کاوی
فرآیند داده کاوی شامل سه مرحله می باشد:
1- کاوش اولیه
2- ساخت مدل یاشناسایی الگو باکمک احرازاعتبار/ تایید
3- بهره برداری
مرحله 1: کاوش
معمولاً این مرحله باآماده سازی داده ها صورت می گیرد که ممکن است شامل پاک سازی داده ها، تبدیل داده ها وانتخاب زیرمجموعه هایی ازرکوردها با حجم عظیمی ازمتغییرها( فیلدها) باشد.
سپس باتوجه به ماهیت مساله تحلیلی، این مرحله به مدل های پیش بینی ساده یا مدل های آماری وگرافیکی برای شناسایی متغییرهای مورد نظروتعیین پیچیدگی مدل ها برای استفاده درمرحله بعدی نیازدارد.
مرحله 2: ساخت واحرازاعتبارمدل
این مرحله به بررسی مدل های مختلف وگزینش بهترین مدل باتوجه به کارایی پیش بینی آن می پردازد.شاید این مرحله ساده به نظربرسد.اما این طورنیست.تکنیک های متعددی برای رسیدن به این هدف توسعه یافتند.و" ارزیابی رقابتی مدل ها" نام گرفتند. بدین منظورمدل های مختلف برای مجموعه داده های یکسان به کارمی روند تاکارایی شان باهم مقاسیه شود. سپس مدلی که بهترین کارایی راداشته باشد انتخاب می شود. این تکنیک ها عبارتندازStacking، Boosting،Bagging و Meta- Learning
مرحله 3: بهره برداری
آخرین مرحله مدلی راکه درمرحله قبل انتخاب شده است، درداده های جدید به کارمی گیرد تا پیش بینی های خروجی های موردانتظار راتولیدنماید.داده کاوی به عنوان ابزارمدیریت اطلاعات برای تصمیم گیری، عمومیت یافته است. اخیراً توسعه تکنیک های تحلیلی جدید دراین زمینه مورد توجه قرارگرفته است.(مثلاً Classification Tree) اما هنوزداده کاوی مبتنی براصول آماری نظیر(EDA: Exploratory Data Analysis)می باشد.
بااین وجود تفاوت عمده ای بین داده کاوی وEDA وجود دارد. داده کاوی بیشتربه برنامه های کاربردی گرایش داردتا ماهیت اصلی پدیده، به عبارتی داده کاوی کمترباشناسایی روابط بین متغییرها سروکاردارد.
2.2 دو مفهوم اساسی در داده کاوی
Bagging:
این مفهوم برای ترکیب رده بندی های پیش بینی شده ازچند مدل به کارمی رود.فرض کنید که قصددارید مدلی برای رده بندی پیش بینی بسازید ومجموعه داده ها مورد نظرتان کوچک است.شمامی توانید نمونه هایی (باجایگزینی ) راازمجموعه داده ها انتخاب وبرای نمونه های اصلی ازدرخت رده بندی استفاده نمایید.به طورکلی برای نمونه های مختلف به درخت های متفاوتی خواهیدرسید.سپس برای پیش بینی باکمک درخت های متفاوت به دست آمده ازنمونه ها یک رای گیری ساده انجام دهید.رده بندی نهایی رده بندی ای خواهدبود که درخت های مختلف آن راپیش بینی کرده اند.
Boosting:
این مفهوم برای تولید مدل های چند گانه (برای پیش بینی یارده بندی ) به کارمی رود.Boosting ترکیبی از classifierها راتولید خواهدکرد.
2.3 اساس داده کاوی
اساس داده کاوی برمبنای سه فعالیت اصلی ذیلاً به آنها اشاره می شود:
1- هدف داده کاوی: داده های بی ارزش وعوامل بیرونی حذف می شوند.
2- فشرده سازی دادها : این عمل به وسیله کد گذاری داده ها صورت می گیرد.
3- کشف الگوها: الگوهای موجود درپایگاه داده ها ازقبیل طبقه بندی ،الگوهای زنجیری و..... کشف می شوند.
انتخاب یک سیستم داده کاوی
سیستم های داده کاوی درروش وعملکرد متفاوتند وحتی ممکن است باانواع کاملا متفاوتی ازمجموعه داده ها مطابق باشند.برای انتخاب یک سیستم داده کاوی باید شرایط زیردرنظرگرفته شوند:
- نوع داده ها: که می تواند متنی، رابطه ای، زنجیری، فضایی و....باشد.
- ساختار وویژگی های سرور ومشتری
- منبع داده ها
- روش وعملکرد سیستم
- قابلیت اندازه گیری
- استفاده ازابزارهای دیداری
- زبان سیستم
- گرافیکی بودن محیط سیستم
- 4 عوامل ایجاد داده کاوی
- سیل اطلاعات
- معاملات کامپیوتری،اطلاعات علمی،اطلاعات پزشکی اشخاص، بازیها،شبکه جهانی وب
- کاربرداطلاعات به عنوان کالا
- رشدانبارهای داده ونیازبه استخراج اطلاعات مفید
- راهکارهای فناوری جدید اطلاعات
- تحقیقات وپیشرفت درعلوم ازجمله هوش مصنوعی
- 5 زیربنای داده کاوی
تکنیک های داده کاوی نتیجه ی تحقیقات گسترده وبلندمدتی است که درطول سالها برای افزایش بازدهی تجاری موسسات بکاربرده می شدند.تحقیقات دراین زمینه اززمانی آغازشدکه برای نخستین باراطلاعات تجاری هرسازمان،برروی سیستم های ذخیره سازی آن زمان که ازنوع مغناطیسی بودند،ذخیره شدند. این رشته تحقیقات باتوسعه وپیشرفت سیستم های اطلاعات که قابلیت ذخیره حجم بیشتری ازداده ها رافراهم می کردندوهمچنین ازسرعت بسیاربالاتری درذخیره سازی وبازیابی اطلاعات برخورداربودند، اهمیت بیشتری یافت. روش های دسترسی تصادفی یارندم به اطلاعات وپیدایش روشهای حرکت درمیان داده ها،خصوصاً به صورت بلادرنگ، فناوری داده کاوی رامتحول ساخت.
روش های داده کاوی برپایه های زیر استوار هستند:
- گردآوری حجم عظیمی داده
- کامپیوترهای چند پردازنده ی قدرتمند
- الگوریتمهای داده کاوی
- 6 عناصرداده کاوی
توصیف وکمک به پیش بینی دوکارکرد اصلی داده کاوی هستند.تحلیل داده مربوط به مشخصه های انتخابی متغییرها؛ ازگذشته وحال،ودرک الگوهای مثالی ازتحلیل توصیفی است.برآورد ارزش آینده یک متغییر وطرح ریزی کردن روندمثالی پیشگویانه داده کاوی است.
برای عملی شدن هریک ازدوکارکرد فوق الذکرداده کاوی، چند گام ابتدایی اما مهم باید اجراشوند که ازاین قرارند:
- انتخاب دادها
- پاک سازی داده ها
- غنی سازی داده ها
کدگذ