مقالات

data mining

داده­ کاوی

به طور کلی، داده­ کاوی فرایند تجزیه و تحلیل داده ­ها از نگاه متفاوت و خلاصه کردن آن­ها در اطلاعات قابل استفاده است. اطلاعاتی که می ­تواند در افزایش درآمد، کاهش هزینه ­ها و یا هردو مورد به شما کمک کند. یک نرم ­افزار داده­ کاوی، یکی از چندین ابزار تحلیلی برای آنالیز داده­ ها می باشد. به کاربران این اجازه را می ­دهد که داده ­ها را از بعد های گوناگون تجزیه و تحلیل، آن­ها را دسته­ بندی کنند و سپس روابط شناسایی شده بین آن­ها را خلاصه کنند. از نظر فنی، داده­ کاوی، فرایند یافتن روابط یا الگوها میان چندین زمینه در  data baseهای بسیار بزرگ است.

 

داده ­کاوی چه کاری می ­تواند انجام دهد؟

متداول ترین کارایی داده­ کاوی این است که توسط شرکت ­هایی با تمرکز بالا بر مشتری استفاده می ­گردد مانند سازمان­ های مالی، ارتباطی و بازاریابی. داده ­کاوی این شرکت ­ها را قادر می ­سازد تا روابط میان عوامل "داخلی" مانند قیمت، تعیین موقعیت محصول یا مهارت ­های کارکنان و عوامل "خارجی" مانند شاخص ­های اقتصادی، رقابت و ویژگی­ های جمعیت ­شناختی مشتری را مشخص کنند. همچنین به آن­ها کمک میکند تا  تأثیر بر فروش،درصد رضایت مشتری و سود شرکت را تعیین نمایند و یا حتی افزایش دهد. در نهایت، این اجازه را به آن­ها می ­دهد تا به منظور مشاهده داده­ های تراکنشی جزئی، در اطلاعات خلاصه شده Drill Down کنند.

داده­ کاوی چگونه کار می­ کند؟

هنگامی که  ITدر سطح وسیع، سیستم ­های تحلیلی و تراکنشی را جداگانه زیر و رو می­ کند، داده کاوی ارتباط بین این ­دو سیستم را فراهم می ­آورد. نرم ­افزار داده­ کاوی، ارتباطات و الگوهای موجود در داده­ های تراکنشی ذخیره شده بر اساس درخواست ­های کاربر Open-ended را تحلیل می­ کند.

انواع مختلف نرم ­افزارهای تحلیلی موجود هستند: آماری، یادگیری ماشینی، و شبکه ­های عصبی. در کل، به دنبال هر 4 نوع از روابط می­ گردیم:

کلاس ها:به مجموعه‌ای از فیلدها و متدها (پروسیجر ها و توابع) که برای انجام وظیفه خاصی یا یکدیگر کارمیکنند کلاس گفته میشود . به طور خلاصه این که از کلاس برای کپسوله کردن وظایف استفاده میشود.

خوشه ­ها: داده ­ها بر اساس روابط منطقی بین آن­ها یا سلیقه ی مشتری دسته ­بندی می ­شوند. به طور مثال، داده­ ها می ­توانند برای شناسایی بخش ­های بازار و یا شباهت مشتریان، داده کاوی شوند.

وابستگی ­ها: داده­ کاوی به منظور شناسایی وابستگی­ ها انجام می ­شود.

الگوهای زنجیره ­ای: داده­ کاوی به منظور پیش ­بینی الگوهای رفتاری و روندها صورت می­ گیرد. برای مثال، یک صندوقدار فرو، می ­تواند احتمال خرید مواد پودر لباس شویی را بر اساس خرید مشتریان از مواد شوینده پیش ­بینی کند.

داده ­کاوی شامل پنج عنصر عمده می ­شود:

استخراج، تبدیل و بارگزاری داده به یک سیستم انبار داده

ذخیره و مدیریت داده در یک سیستم پایگاه داده چند­بعدی

فراهم ­آوری دسترسی به داده برای تحلیلگران کسب ­و­کار و متخصصان فناوری اطلاعات

تحلیل داده با نرم ­افزارهای کاربردی

نمایش داده به شکلی قابل استفاده، مانند گراف یا جدول

سطوح متفاوتی از تحلیل، موجود هستند:

شبکه ­های عصبی مجازی: مدل ­های غیرخطی پیش ­بینی که از طریق آموزش یاد گرفته و از نظر ساختار مانند شبکه ­های عصبی هستند.

الگوریتم ­های ژنتیک: تکنیک­ های بهینه ­سازی که از فرایندهایی مانند ترکیب ژنتیکی و انتخاب طبیعی را به شکلی بر اساس مفاهیم تکامل طبیعی استفاده می­ کنند.

درخت­ های تصمیم ­گیری: درخت تصمیم گیری یکی از ابزارهای قوی و متداول برای دسته بندی و پیش بینی می باشد درخت تصمیم گیری برخلاف شبکه های عصبی به تولید قانون می پردازد یعنی درخت تصمیم گیریپیش بینی خود را در قالب یکسری قوانین توضیح می دهد در حالیکه در شبکه های عصبی تنها پیش بینی بیان می شود و چگونگی آن در خود شبکه پنهان باقی می ماند

متد نزدیک ­ترین همسایگی: تکنیکی که هر رکورد در ست داده را بر اساس ترکیبی از دسته ­های متشکل از kرکورد متشابه به آن در یک ست داده تاریخی، دسته ­بندی می ­کند (جایی که k 1). گاهی تکنیک k-نزدیک­ترین همسایه هم نامیده می ­شود.

استنتاج قوانین: استخراج قوانین اگر آن­گاه مفید از داده ­ها بر اساس سطح اهمیت آماری

تصویرسازی داده ­ها: تصویر سازی داده و خرجی حاصل از داده کاوی در بسیاری از موارد حیاتی است زیرا ممکن است شما با استفاده از داده کاوی به نتایج ارزشمند برای صاحبان صنایع و تجارت برسید ولی نتوانید آن ها را به خوبی تصویر سازی کنید و درک این نتایج در این صورت به سختی امکان پذیر خواهد شد.

دوست دارید به اشتراک بذارید از طریق:

برچسب ها: سئو, طراحی سایت, برندسازی

نظرات
نظر خود را وارد نمایید