در علم محاسبات یا رایانش، یک انبار داده (DW یا DWH) که به نام انبار داده سازمانی (EDW) نیز نامیده میشود، سیستمی است که برای گزارشدهی و تحلیل داده استفاده میشود و به عنوان جزء اصلی هوش تجاری محسوب میشود. انبارهای داده، مخازن مرکزی دادههای یکپارچه از یک یا چند منبع پراکنده هستند. انبارهای داده، دادههای کنونی و سابق را در یک محل گرد هم میآورند که متعاقباً برای ایجاد گزارشهای تحلیلی برای کارمندان بخشهای مختلف سازمان مورد استفاده قرار میگیرد.
دادههای ذخیره شده در انبار داده از سیستمهای عملیاتی مختلف مانند بازاریابی یا فروش بارگذاری میشوند. این دادهها ممکن است از یک data store عملیاتی بگذرند و ممکن است نیازمند پاکسازی دادهای برای عملیاتهای اضافی باشند. بدین ترتیب مطمئن شویم که پیش از استفاده در انبار دادهای یا گزارشگیری، کیفیت مورد نظر را دارند.
data warehouse
انبارهای داده معمولی مبتنی بر استخراج (Extract)، تبدیل (Transform) و بارگذاری (Load) هستند که به اختصار (ETL) نامیده میشوند و از سه لایه staging، یکپارچهسازی داده و دسترسی برای ایفای کارکردهای اصلی خود تشکیل مییابند. لایه staging یا در واقع پایگاههای داده staging، دادههای جدید استخراج شده از هر سیستم داده منبع جداگانه را ذخیره میکند. لایه یکپارچهسازی مجموعه دادههای پراکنده را با تبدیل دادهها از لایه staging مسنجم میسازد و غالباً دادههای تبدیل یافته را در یک پایگاه داده data store عملیاتی (ODS) ذخیره میکند. سپس دادههای یکپارچهسازی شده به یک پایگاه داده دیگر انتقال مییابند و در آن جا دادهها به گروههای سلسله مراتبی که غالباً بُعد، واقعیت و واقعیتهای تجمیعی (aggregate facts) نام دارند، تقسیم میشوند. ترکیب واقعیتها و ابعاد گاهی اوقات شِمای ستارهای نامیده میشود. لایه دسترسی به کاربران به بازیابی دادهها کمک میکند.
درباره این سایت