امروزه با اطمینان کامل میتوان ادعا کرد که استفاده از راهحل BI میتواند قدرت رقابتپذیری یک سازمان را افزایش دهد و از دیگر سازمانها متمایز نماید. این راهحل این امکان را به سازمانها میدهد تا با بکارگیری اطلاعات موجود از مزایای رقابتی و پیشرو بودن بهرهبرداری نمایند. این راه امکان درک بهتر تقاضاها و نیازمندیهای مشتریان و مدیریت ارتباط با آنان را میسر میسازد. امروزه دیگر سازمانهای پیشتاز صحبت ازERP و CRM نمیکنند، رویکرد سازمانها به سمت BI است. آنها به دنبال بهینهسازی فرآیندها از طریق ارزیابی و بهبود عملکرد خود و زیرمجموعههای وابسته به خود میباشند.
در یک دهه گذشته بسیاری از سازمانها سرمایهگذاریهای بسیاری را روی تکنولوژی اطلاعات اعم از نرمافزار و سختافزار کردهاند. در اقتصاد امروزه که هزینهها باید کاهش یابد، سازمانها و شرکتها از خود میپرسند: «چه مقدار تا کنون برای تکنولوژی سرمایهگذاری کردهایم؟» و اینکه «از این سرمایهگذاری چه سودی بردهایم؟» امروزه در کشورهای پیشرو و توسعه یافته سرمایهگذاری در BI در حال افزایش است. تحقیقات فارستر در سال 2003 از 877 سازمان (کوچک و بزرگ) و تصمیمگیرندگان در حوزه IT نشان میدهد که از رشد سرمایهگذاری 9/1% در زمینه IT برخوردارند ولی 45% آنها نیاز به خرید ابزارهای BI را دریافتهاند و برای آن اقدام میکنند. چرا؟ دو دلیل عمده وجود دارد که چرا صنایع و سازمانها به BI علاقهمند شدهاند. اول عصر اطلاعات، دوم مسائل اقتصادی.
در عصر اطلاعات، کسی که اطلاعات دارد، دارای قدرت است. هر سازمان و شرکتی که از این قدرت برخوردار باشد در صنعت و حرفه خود در مقایسه با رقبای خود ممتاز میشود. سازمانها و شرکتها، امروزه با سرعت حرکت و تغییر میکنند. اخذ اطلاعات صحیح در زمان صحیح اساس و پایه این سازمانها است. دلیل دیگر استفاده از BI اقتصاد است. بقای سازمانها و شرکتها در توفان اقتصاد رقابتی امروز بر دو محدوده کاهش هزینهها و افزایش درآمدها متمرکز شده است.
در سازمانی که BI در آن بکار گرفته میشود، مدیران میتوانند اطلاعات هزینهها را از داخل سازمان استخراج نمایند و بدانند که هزینهها چه هستند و تصمیمهایی برای کاهش و حذف آنها بگیرند. تغییرات آینده را پیشبینی کنند و برای مسائل خود راهحلی مناسب داشته باشند. بمنظور افزایش درآمد، شرکتها باید علاوه بر افزایش فروش خود، مثلا مشتریان فعلی خود را حفظ کنند. اما باید بدانیم اغلب کدام مشتری سود بیشتری عاید میکند. معمولا 20% از مشتریان 80% سود شرکت را تامین میکنند. شرکتها باید ابتدا مشتریانی که سود بیشتری را عاید میسازند، حفظ نمایند. باید بدانید BI کاربرد بسیاری در این بخش نیز دارد. گام بعدی تجزیه و تحلیل رفتار بازار، فروش و مشتریان پرسودده هستند. این دانش به مدیران کمک میکند تا چگونه مشتریان خود را مدیریت نمایند. برای جلب نظر مشتریان ممکن است پارامترهای کانالهای هزینهای، فروش عمده به مشتریان و یا تغییر در حاشیه سود مدنظر قرار گیرد.
سرانجام، اینکه علاوه بر مشخصههای اطلاعاتی فوق سایر اطلاعات مدیریتی برای تصمیمگیری در سازمانها نیز وجود دارد که نیاز به تحلیل برای تصمیمگیری دارد، مثل اطلاعاتی در حوزه ماموریت اصلی سازمان و یا شرکت، اطلاعات منابع انسانی، اطلاعات تولید و ساخت، اطلاعات خدمات ارائه شده و ... تکنولوژی BI راهحلی برای بکارگیری این اطلاعات و ایجاد هوشمندی در مدیران میباشد که آگاهانه تصمیمگیری نمایند و تصمیم آنان مبنی بر واقعیات و درک آگاهانه آنان از تغییرات فعلی و آتی و استفاده از سوابق در سازمان باشد.
وظیفه اصلی سیستمهای پایگاه داده، پشتیبانی از تراکنشهای آنلاین و پردازش پرس و جو است. این سیستمها، سیستم پردازش تراکنش آنلاین (OLTP) نامیده میشوند و بیشتر عملیات روزمره یک سازمان را پوشش میدهند. از سوی دیگر انبار داده که به عنوان نوع خاصی از پایگاه های داده معرفی می شود به کاربران یا knowledge workers خدماتی در نقش تحلیلگر داده و تصمیم گیرنده ارائه میدهند. چنین سیستمهایی قادر هستند دادهها را در قالبهای گوناگون برای هماهنگی با نیازهای مختلف کاربران، سازماندهی کرده و ارائه دهند. این سیستمها با نام سیستمهای پردازش تحلیلی آنلاین نیز (OLAP) شناخته میشوند.
از لحاظ مدلهای دادهای؛ پایگاههای داده برای مدل OLTP بهینه سازی شده که بر اساس مدل داده رابطهای امکان پردازش تعداد زیادی تراکنش همروند، که اغلب حاوی رکوردهای اندکی هستند را دارد. اما در انبارهای داده که برای پردازش تحلیلی آنلاین طراحی شدهاند امکان پردازش تعداد کمی پرس و جو پیچیده بر روی تعداد بسیار زیادی رکورد داده فراهم میشود. سرورهای OLAP هم میتوانند رابطهای باشند ( ROLAP ) وهم میتوانند چندبعدی باشند (MOLAP ).
از لحاظ کاربران؛ کاربران پایگاه داده کارمندان دفتری و مسئولان می باشند در حالی که کاربران انبار داده مدیران و تصمیمگیرندهها هستند.
از لحاظ عملیات قابل اجرا بر روی آنها؛ عملیاتی که بر روی پایگاه دادها صورت میگیرد، عموماً شامل عملیات به هنگام سازی است در حالی که عمل خواندن از انبار، عمده عملیات قابل اجرا بر روی انبار داده را تشکیل میدهد.
از لحاظ مقدار دادهها؛ مقدار دادههای یک پایگاه داده در حدود چند مگابایت تا چند گیگابایت است در حالی که این مقدار در انبار داده در حدود چند گیگابایت تا چند ترابایت است.
داده کاوی دارای چندین الگوریتم است، از این الگوریتم ها هم به صورت جداگانه و هم به صورت ترکیبی میتوان استفاده نمود. بر همین اساس در حوزه های مختلف به راحتی میتوان از داده کاوی استفاده کرد. برخی از کاربردهای داده کاوی عبارتند از:
کاربردهای معمول تجاری: از قبیل تحلیل و مدیریت بازار، تحلیل سبد خرید کالا، بازاریابی هدف، فهم رفتار مشتری، تحلیل و مدیریت ریسک.
بانکداری :مدیریت و کشف فریب، کشف تراکنشهای مشکوک مالی (پولشویی)، تشخیص مشتریان ثابت و همیشگی. استفاده از دادهکاوی در زمینههای مالی و بانکداری به شناخت مشتریان پر خطر و سودجو بر اساس معیارهایی از جمله سن، درآمد، وضعیت سکونت، تحصیلات، شغل و غیره میانجامد.
متن کاوی (پالایش متن) : نامههای الکترونیکی، گروههای خبری و غیره.
پزشکی: کشف ارتباط علائم و بیماری، تحلیل آرایههای DNA. در زمینه پزشکی استفاده بیمارستانها و کارخانههای داروسازی جهت کشف الگوها و مدلهای ناشناخته تأثیر داروها بر بیماریهای مختلف و نیز بیماران گروههای سنی مختلف را میتوان نام برد.
ورزش: آمارهای ورزشی.
وب کاوی: پیشنهاد صفحات مرتبط، بهبود ماشینهای جستجوگر یا شخصی سازی حرکت در وب سایت.
بیمه: پیشبینی میزان استقبال از بیمه نامههای جدید، تشخیص کلاه برداریها و مشخص کردن رفتارهای نامناسب، تشخیص نیازها و خواستههای مشتریان.
برای استفاده از ابزارهای هوشمندی کسب و کار به انبارداده نیاز داریم. انبار داده، دادهها را از یک یا چند منبع جمع آوری کرده و آنها را به گروههای اطلاعاتی تبدیل میکند، سپس دادهها را به همراه اطلاعات زمان و تاریخ برای پشتیبانی بهتر از تصمیم گیریها ذخیره میکند. به طور کلی اطلاعات توسط ETL (در یک پست جداگانه به شرح ETL خواهم پرداخت) از سیستمهای عملیاتی متعدد جمع آوری، پاکسازی و به یک بانکاطلاعاتی انتقال داده میشود. این بانک اطلاعاتی اطلاعات حاصل را برای استفاده از ابزارهای هوش تجاری جهت تحلیل و گزارش گیری کاربران نهایی فراهم میکند و در نتیجه به کاربران اجازه تحلیل و ایجاد پرس و جوهای گوناگون بر روی دادهها را میدهد که پیش از این هیچ ارتباطی با هم نداشتند.
این اطلاعات در جهت آنالیز کردن داده های موجود در سیستم های عملیاتی مورد استفاده قرار می گیرد. فلسفه بکارگیری انبارداده در سازمان این است که اطلاعات مورد نیاز مدیران از درون داده های سیستم های عملیاتی موجود استخراج گردد. معمولا انبار داده به دلیل وجود حجم انبوهی از داده ها، کندتر از سیستم های عملیاتی است و از طرفی محیطی جهت تولید گزارشات تحلیلی و آماری برای مدیران و تصمیم گیرندگان سازمانها فراهم میکند.
تکنیکهای بسیاری جهت جمع آوری ، پالایش و آنالیز داده ها نظیر OLAP و Data Mining با هدف استخراج اطلاعات از رکوردهای عملیاتی سازمان و نظم دهی آن به منظور انجام تحلیل های مختلف وجود دارد.
یکی از متداولترین سوالات در حوزه پردازش دادهها به صورت حرفهای در مورد تفاوت داده کاوی و OLAP میباشد. این دو ابزار در عین حال که تفاوتهایی با هم دارند مکمل یکدیگر نیز میباشند.
کاربر در مورد یک رابطه و تائید آن با مجموعهای از پرس و جوها در مقابل دادهها، به شکل یک فرضیه روبرو است. به عنوان مثال ممکن است تحلیلگر بخواهد تا عواملی که سبب ناتوانی در بازپرداخت بدهی وام منجر میگردد را تجزیه و تحلیل نماید.
در تجزیه و تحلیل پایگاه داده OLAP ابتدا ممکن است این گونه فرض شود که افرادی که در اعتبارات مالی درآمد پایین و ریسک بالا دارند، نتوانند بدهی خود را پرداخت کنند و فرضیه افراد کم درآمد و کم اعتبار تائید (و یا رد) شود.
اگر فرضیه توسط دادهها تصدیق نشد تحلیلگر ممکن است به بدهی بالا به عنوان عامل منجر به ریسک نگاه کند. اگر این مطلب را دادهها نیز تایید نکنند او ممکن است بدهی و درآمد را با هم به عنوان بهترین نمایانگر ریسک اعتبار مالی بد در نظر بگیرد.
به عبارت دیگر OLAP یک تجزیه و تحلیلی از مجموعهای از فرضیهها تولید کرده و پارامترها و ارتباطات را برای استفاده به سمت کوئری های پایگاه داده برای تائید یا رد آنها ارسال میکند. تجزیه و تحلیلهای OLAP برای پردازشهای استنتاجی یک ضرورت است.
داده کاوی با OLAP تفاوت دارد زیرا الگوهای فرضیهها را سریعتر تائید میکند، با استفاده از همان دادهها به کشف الگوهای همانند میپردازد و همچنین برای پردازشهای استنتاجی ضروری میباشد. برای مثال فرض کنید شخصی قصد داشته باشد تا فاکتورهای همراه با ریسک جهت وام گرفتن را با استفاده از داده کاوی تجزیه و تحلیل و شناسایی کند. ممکن است ابزارهای داده کاوی اشخاص با بدهی بالا، درآمد پایین و اعتبار مالی بد را کشف کنند. این نوع تجزیه و تحلیل ممکن است از موارد تاثیرگذار دیگری چشم پوشی کند. بعنوان مثال سن می تواند یک عامل تعیین کننده در بازپرداخت وام باشد.
اینجا جایی است که داده کاوی و OLAP میتوانند یکدیگر را کامل کنند. قبل از کار بر روی الگو و تجزیه و تحلیل بر روی اطلاعات، نیاز به دانستن پیامدهای مالی و همچنین خواستار کشف الگوهایی برای کنترل اعتبار کافی اشخاص میباشیم. تکنولوژی OLAP میتواند به این قسمت از سوال پاسخ دهد. در OLAP با استفاده از MDX و با دقت و تمرکز خود بر روی مقادیر مهم میتواند استثناها را شناسایی و یا تعاملات را کشف کند.