پایگاه داده تحلیلی (Data Warehouse) چیست؟

DWH يک سيستم کامپيوتري از اطلاعات است که به گونه­اي مناسب براي انجام عمليات گزارش­گيري و تحليلي داده­ها بر اساس زمان، طراحي شده است. اين سيستم اغلب به صورت جداگانه­اي از سيستم­هاي عملياتي روزانه قرار مي­گيرد. Bill Inmon که از او به عنوان پدر DWH ياد مي شود آن را به اين ترتيب تعريف مي­کند:

" DWH متشکل از يک پايگاه داده و تعدادي جز (component) متصل است با ويژگي هاي زیر:

  • موضوع­گرا (Subject Oriented): پايگاه­داده به گونه­اي سازماندهي شده است که تمامي اطلاعاتي که به یک موضوع يا موجوديت خاص مربوط هستند با يکديگر مرتبط هستند.
  • متغير با زمان: تغييرات ايجاد شده در پايگاه­داده اوليه در آن اعمال مي­شوند.
  • Non-volatile: داده­هاي اطلاعاتي هرگز حذف نشده، با داده­هاي جديد جايگزين نمي­شوند.
  • يکپارچه: اطلاعات موجود در پايگاه­داده از سراسر سازمان جمع­آوري شده­اند و با هم سازگاري دارند".

هدف اصلي DWH ايجاد بستري مناسب براي توليد اطلاعاتي است که به  Knowledg worker هاي سازمان (مديران، عوامل اجرايي و تحليلگران) براي اتخاذ تصميم­هاي درست کمک مي­کند. براي اين منظور از DWH در تهيه گزارش­ها، اطلاعات تحليلي، تعامل بلادرنگ با سيستم­هاي عملياتي و Profiling استفاده مي­شود.

با DWH مي­توان در سازمان سيستم تصميم­يار (Decision support) ايجاد کرد. اطلاعاتي که در  DWH نگهداري مي­شود از آنچه در پايگاه­هاي داده نگهداري مي­شود (که شامل اطلاعات جزيي و روزمره است) به مراتب مهم­تر و ارزشمندتر است. در DWH تمامي اطلاعات موجود در سازمان از ابتدا تاکنون به صورت يکپارچه و سازماندهي شده نگهداري مي­شود. در اين مخزن اطلاعاتي، اطلاعات از تمامي منابع اطلاعاتي و در يک بازه زماني طولاني جمع­آوري مي­شوند و به اين دليل حجم اطلاعات بسيار زياد است.

در DWH نياز به سازماندهي مناسب اطلاعات و استفاده از روش­هاي مناسب دسترسي به اطلاعات وجود دارد. DWH با طراحي متفاوت خود به صورت چندبعدي (Multi dimensional) قادر است تمامي این موارد را در نظر بگيرد. براي مثال در اطلاعات نگهداري شده براي فروش، زمان فروش، ناحيه فروش، فروشنده و محصول به فروش رفته به عنوان ابعاد مختلف در نظر گرفته مي­شوند. اغلب اين بعدها حالت سلسله مراتبي (Hierarchical) دارند. مثلا ممکن است زمان فروش شامل تاريخ و ساعت فروش محصول باشد. طراحي مدل داده چند بعدي با استفاده از تکنيک­هاي مرسوم در محيط­هاي OLTP مانند ERD و نرمال­سازي مناسب نيست. زيرا آنچه در DWH مهم است ايجاد امکان پرس­و­جو و بارگذاري سريع اطلاعات است.

در بيشتر DWH از star schema براي ايجاد مدل داده چندبعدي استفاده مي­شود. در اين مدل، پايگاه­داده شامل يک جدول fact و تعدادي جدول مجزا براي ابعاد است. در جدول fact رکورد اطلاعاتي شامل تعدادي اشاره­گر (کليد خارجي) به جداول ابعاد و مقادير مربوط به معيارهاي عددي است. Attribute ها به همراه کليدها در جداول ابعاد قرار مي­گيرند.

برخي از سازمان­ها تمايل دارند DWH به صورت سراسري طراحي شود به طوريکه تمامي اطلاعات موجود در سازمان در آن قرار گيرند. طراحي و استفاده از DWH به اين صورت کاري پيچيده و زمان­بر است. به همين علت در بسياري از سازمان ها از Data Mart استفاده مي­شود.

نوشتن دیدگاه


تصویر امنیتی
تصویر امنیتی جدید

شما اینجا هستید:   معرفی BIپایگاه داده تحلیلی (Data Warehouse) چیست؟