داده ها تا زمانی که پردازشی بر روی آن ها صورت نگیرد، به صورت خام باقی خواهند ماندو Data Mining (دیتا ماینینگ یا داده کاوی) علمی است که اطلاعات ارزشمند را از دل داده های خام استخراج می کند و این در حالی است که دیتا ماینینگ در حوزه های متفاوتی از درس های دانشگاهی گرفته تا صنایع مختلف مورد استفاده قرار می گیرد. در واقع، داده ها حقایقی هستند که معنای خاصی را منتقل نمی کنند و عملا هیچ معنا و مفهومی ندارند اما با استفاده از داده کاوی می توان آن ها را به اطلاعات معنا داری تبدیل کرد.
به عنوان مثال سن افرادی که یک محصول را در زمانی خاص خریداری کرده اند شاید به ظاهر هیچ اهمیتی ندارد اما کسی که داده کاو است نتایجی را از این قضیه می گیرد: برای بهبود فروش آن محصول باید به مغازه های اطراف مدرسه، باکس ها را ارسال بکند نه این که کنار بیمارستان و خانه سالمندان محصول را برای فروش بگذارند و محصول باید توی یک زمان خاص در فروشگاه ها وجود داشته باشد. این یک نمونه خیلی خیلی ساده شده از کار یک داده کاو است.
حوزه دیتا ماینینگ استفاده و کاربرد های بسیار زیادی دارد که ما در زیر به چند نمونه از این مورد ها اشاره خواهیم کرد.
یکی از موارد استفاده زیاد از علم داده کاوی در حیطه کسب و کار است که برایتان با دو مثال این کاربرد را بیشتر توضیح می دهیم.
یکی از جاهایی که بسیار از علم دیتا ماینینگ استفاده می شود، می توان به فروشگاه های زنجیره ای بزرگ اشاره کرد. در این فروشگاه ها تلاش بر این است که با استفاده از دیتا ماینینگ ارتباط های میان محصولات خریداری شده توسط مشتریان، معلوم و مشخص گردد. اغلب فروشگاه های زنجیره ای دوست دارند تا بدانند که چه محصولاتی با یکدیگر معمولاً به فروش می رسند.
به عنوان مثال در یک عملیات داده کاوی بسیار بزرگ در یکی از فروشگاه های زنجیره ای در آمریکای شمالی که بر روی حجم بزرگی از اطلاعات فروش صورت گرفت، معلوم شد که اکثر مشتریانی که تلویزیون خریداری می کنند، گلدان کریستالی هم می خرند.
مثال دیگری از کاربرد داده کاوی در تجارت را می توان برای یک شرکت بزرگ تولید و عرضه پوشاک در اروپا بیان نمود، نتایج و آثار داده کاوی در این شرکت بزرگ تعیین کرد که افرادی که کراوات های ابریشمی خریداری کرده اند، در همان روز یا روز های آینده گیره کراوات مشکی رنگ نیز خریداری می کنند.
همان طور که می بینید به وضوح از این مثال ها برداشت می شود که این طرز استفاده از علم داده کاوی می تواند به فروشگاه ها در برگزاری هوشمندانه نمایشگاه های فروش و چگونگی ارائه اجناس به مشتریان بسیار کمک کند.
بیمارستان ها و کارخانه های داروسازی از دیگر عنوان های استفاده کننده، از داده کاوی هستند. این مراکز و کارخانه ها برای پیدا کردن الگو های پیدا نشده و ناشناخته تاثیر دارو ها بر بیماری های مختلف و گروه های مختلف سنی از این علم را به کار می گیرند.
با استفاده از علم داده کاوی می توان در زمینه های مالی و بانکی، مشتریان پر خطر و سودجو را بر اساس معیار های مختلفی مانند: سن، میزان درآمد، وضعیت محل سکونت و نوع شغل و … را شناسایی کرد.
همانطور که مستحضر هستید، وظیفه علم دیتا ماینینگ استخراج دانش از منابع با ارزشی است که در لا به لای حجم گسترده و زیادی از اطلاعات پنهان شده و احتیاج به کشف دارند.
دیتا ماینینگ اطلاعات سال های گذشته شرکت شما را مرور می کند و نتایج بازخورد های تصمیماتی که در سال های گذشته گرفته اید را به شما نشان می دهد. به این ترتیب به شما می گوید که کدام یک از تصمیمات اجرا شده به سود بیشتر دست یافته و کدام تصمیمات شما باعث زیان در کسب و کارتان شده است.
خوب است بدانید که در شروع فرایند دیتا ماینینگ معمولا مشکلات سازمان یا شرکت شما پیدا خواهد شد، اما در پایان به وسیله هوش مصنوعی راهکار هایی برای حل این مشکلات به شما ارائه می شود.
در این بخش شما را با قدم های کلی در یک فرایند Data Mining آشنا می کنیم. به طور خلاصه می توان گفت:
داده ایی که جهت پردازش و تحلیل جمع آوری می گردد ممکن است دارای داده های روزانه در تبادلات مردم، داده منطقی ذخیره شده در پایگاه داده ها و یا پیش بینی ها و احتمالات باشد. فراموش نکنید که داده ها مراحل پیش پردازش و پس پردازش نیز نیاز دارند. قدم بعدی انتخاب یک الگوریتم مناسب برای پیاده سازی مدل داده کاوی مورد نظر است. الگوریتم های کلاس بندی (Classification)، خوشه بندی (Clustring) و یادگیری تقویتی (Reinforcement Learning) کارایی های زیادی در این زمینه دارند و برای یافتن ارتباط بین دیتا ها استفاده می شوند.
با استفاده از راهکار های دیتا ماینینگ، سرعت انجام محاسبات و فضای مورد نیاز در حافظه (RAM) بسیار بهبود پیدا خواهد کرد. تقریباً در هر جایی که مقداری دیتا وجود داشته باشد روش های داده کاوی نیز کاربرد بسیار دارند. از نمونه مثال های کاربردی در حوزه ی داده کاوی پیشنهاد یک محصول به خریداران یک فروشگاه اینترنتی است به طوری که احتمال بدهیم آن ها این محصول را بیشتر از بقیه ی محصولات دوست دارند و ممکن است آن را بخرند. در مجموع راهکار های دیتا ماینینگ را می توان در یکی از این سه دسته و یا ترکیبی از آن ها قرار داد که در ادامه به بررسی آن ها می پردازیم.
در این الگو دیتا ها بر اساس ویژگی های تعریف شده برچسب زده می شوند و در کلاس های مختلف قرار می گیرند. این الگو می تواند مدل برچسب گذاری را یاد بگیرد و با استفاده از همین یادگیری هوشمند، نمونه های جدید را برچسب بزند.
برای مثال، مدیر یک بانک را در نظر بگیرید که تعداد 1000 مشتری را در دو دسته مشتری خوب و مشتری بد قرار می دهد. حالا الگو با استفاده از این داده ها و روش های داده کاوی، ویژگی های مشتری خوب را درک کرده و می تواند آن را از مشتریان بد جدا کند. این تفکیک نوعی یادگیری است که این الگو بعد از این یادگیری، می تواند مدل خود را بر روی دیتا های جدید اعمال کرده و از این به بعد، به طور خودکار مشتری خوب و بد را از هم تشخیص دهد.
در این طرز یادگیری، الگو توسط ذات دیتا ها به گروه بندی آن ها می پردازد. برای مثال مشتریان یک فروشگاه اینترنتی را به دسته های مختلف تقسیم می کند که هر گروه، ویژگی های شبیه به هم دارند. مثلاً ممکن است یک گروه، گروهی باشد که خرید های کم ولی گران قیمتی را انجام بدهد و یا گروه دیگری را پیدا کند که خرید های کوچک و پشت سر هم را در بازه های زمانی کمی انجام می دهند.
در این یادگیری، الگو با تبادل اطلاعات و عملیات با محیط پیرامون، به کشف اطلاعات و یادگیری پیوسته اقدام می کند. برای مثال یک اتومبیل خودران را در نظر داشته باشید که می خواهد از یک اتوبان به سلامتی عبور کند. این اتومبیل می تواند با شبیه سازی حرکت ماشین های دیگر، با محیط تعامل برقرار کرده و یادگیری هایی را انجام دهد. این یادگیری ها به مرور زمان بهبود پیدا می کنند تا اتومبیل یاد بگیرد با کمترین خطا، بتواند به سلامت از یک اتوبان عبور کند.
به همین صورت، الگو ایی را در نظر بگیرید که به صورت هوشمند و با تعامل با محیط و شبیه سازی آن، به طراحی فرم های مختلف سبد خرید می پردازد تا بهترین طراحی را برای کاربر ایجاد کرده و در نتیجه، سود را تا حد امکان برای یک فروشگاه آنلاین اینترنتی بیشینه کند.
برای بهبود در کسب و کارتان نیاز هست که از دیتا ماینینگ استفاده کنید و بتوانید کسب و کار خود را گسترش دهید.