15 سمینار کامل داده کاوی
به همراه منابع و اسلاید
بیش از 400 صفحه دکیومنت یا فرمت ورد
کاربردهای داده کاوی
درسالهای اخیر در صنعت اطلاعات شاهد توجه زیادی به داده کاوی بوده ایم که می توان دلیل این توجه روز افزون را دسترسی به حجم بسیار زیادی از داده ها و نیاز به کشف و استخراج اطلاعات و دانش مفید از آنها دانست، و می توان از این اطلاعات و دانش کسب شده در قسمت های مختلفی همچون مدیریت کسب و کار ،کنترل تولید، تحلیل بازار و اکتشافاتی در زمینه دانش و مهندسی استفاده نمود.
با توجه با اهمیت این مبحث و کاربردهای آن ، در این فصل سعی بر آن شده تا خلاصه ای از کاربردهای داده کاوی در برخی از صنایع بزرگ مورد بررسی قرار گیرد و از آنجا که تکنیک های بصری سازی داده ها در کاربردهای داده کاوی کاملا مشهود است و در مباحث پیشین در این زمینه بحثی صورت نگرفته ، لذا در ائامه سعی بر آن شده تا با نگاهی گذرا به این مبحث آشنایی بیشتری با آن پیدا کنیم. و در پایان نیز اشاره ای به روندهای داده کاوی خواهیم کرد.
داده کاوی در زمینه علوم زیست شناسی[1] و تحلیل داده های DNA
در دهه های گذشته شاهد رشد سریع در تحقیقات زیست شناسی بوده ایم، از توسعه داروهای جدید و درمانهای پیشرفته سرطان گرفته تا شناخت و بررسی human genome بوسیله کشف الگوهای متوالی در مقیاس های بزرگ و عملکردهای ژنی.
علم تعامل زیادی با تحقیقات زیست شناسی که بر تحلیل داده هایDNA متمرکز است ،دارد.تحقیقات اخیر در زمینه تحلیل DNA ما را به سمت کشف علل ژنتیک بسیاری از امراض و ناتوانایی ها و همچنین کشف داروها و رویکردهای جدید برای تشخیص بیماریها وجلوگیری و درمان آنها هدایت می کند.تمرکز اصلی تحقیقات genome بر مطالعه توالی های DNA است.تمام توالی های DNA در بر دارنده چهار چوبی هستند که نوکلئوتیدهانامیده می شوند ، که عبارتند از:
enine(A),cytosine(C),guanine(G),thymine(T) .
هر انسان حدود 100000 ژن دارد و هر ژن شامل 100 نوکلئوتید است که با ترتیب خاصی قرار گرفته اند.تقریبا تعداد نامحدودی راههای مختلف برای ترتیب قرار گرفتن و توالی نوکلئوتیدها برای تشکیل ژنها وجود داردو این چالشی است برای شناسایی توالی قرارگرفتن ژن های خاص که نقش اصلی در بیماریهای مختلف را بازی میکنند.از زمانی که تحلیل الگوهای sequential و تکنیک های مشابه در داده کاوی توسعه و گسترش یافت ، داده کاوی تبدیل به ابزار قدرتمندی شد که سهم قابل توجهی در تحلیل های DNA دارد.
[1] Biomedical
استخراج قوانین وابستگی از پایگاههای داده
Mining Association Rules From Databases
1- مقدمه
تحلیل وابستگیها یک حالت غیر نظارتی[1] داده کاوی می باشد که به جستجو برای یافتن ارتباط در مجموعه داده ها می پردازد. یکی از کاربردیترین حالات تحلیل وابستگیها “تجزیه تحلیل سبد بازار[2]” می باشد.
پیشرفت تکنولوژی فروشگاههای خرده فروشی را قادرساخته است حجم زیادی از داده های مربوط به خرید هر یک از مشتریان که از آن به عنوان سبد بازار یاد میشود را جمعآوری و ذخیره نمایند. دادههای موجود در سبد بازارنشاندهنده خرید مشتری دریک زمان خاص هستند. هر مشتری خرید مجزایی را درکمیتهای مختلف وزمانهای متفاوت انجام میدهد. با تجزیه و تحلیل سبد بازاربینشی برای خردهفروشان ازاینکه چه محصولاتی با هم خریداری میشوند فراهم می گردد و بنابراین میتوانند رفتارخرید مشتریان را پیشبینی کنند این کار به آنها کمک می کند که بهتر بتوانند کالاهای خود را سازماندهی کرده و چیدمان بهتری ازمحصولات خود داشته باشند و بنابراین سودآوری خود را افزایش دهند.
Association rule ها ماهیتاً قوانین احتمالی هستند. بعبارت دیگر قانون XÞAلزوماً قانون X+YÞA رانتیجه نمیدهد زیرا این قانون ممکن است از شرط حداقل Support برخوردار نباشد.
15 سمینار کامل داده کاوی