دوشنبه 2 مرداد 1396 | Monday 24 th of July 2017 صفحه اصلی گروه الکترونیکی کامپیوتر
2-3-1- معماری مدل‌سازی داده

معماری مدل‌سازی داده انتخاب شما از ابزارهایی است که قصد دارید برای تهیه گزارش از ان استفاده کنید. می‌توان از مدل‌های نرمال‌سازی‌شده، شی‌گرا و چند‌بعدی استفاده کرد.

معماری انباره داده از سه لایه تشکیل شده است:

  • در اولینلایه این معماری، سرویس‌دهنده انباره داده‌ای است که یک سیستم پایگاه داده رابطه‌ایمی‌باشد. این لایه داده‌های مورد نیاز خود را از داده‌های عملیاتی و منابع خارجیو فایل‌های مسطح و غیره برای ایجاد انباره داده استخراج می‌کند.
  • در لایه میانییک سرویس‌دهنده پردازش تحلیلی برخط وجود دارد که به وسیله ان می‌توان مکعب‌های چند‌بعدیساخت. پردازش تحلیلی برخط یک ابزار قدرتمند، سریع و مناسب برای گزارش‌گیریمی‌باشد.
  • در اخرین لایه ابزارهای گزارش‌گیری و تحلیل و داده‌کاوی راداریم.

برای پیاده‌سازی یک انباره داده باید هریک از این لایه‌ها به درستیپیاده‌سازی شوند.

  • اخذ داده

اخذ داده از منابع مربوطه (پایگاه داده منبع) انجام می‌گیرد. این مرحله بخش استخراج اطلاعات[1]از سری عملیاتETL است. برای انجام عملیات اخذ داده، باید منبع اخذ داده، نحوه اخذ داده، فرمت داده‌‌های اخذشده و مقاطع زمانی اخذ داده‌ها، همچنین نحوه دسترسی به این داده‌‌ها معلوم و مشخصباشد.

  • بررسی و پاکسازی داده‌ها

این مرحله بخش تغییر شکل[2]از عملیاتETL است. بررسی و پاکسازی داده‌های استخراج شده جهت ورود بهانباره داده در این مرحله انجام می‌گیرد. پس از بررسی جداول موجود، فیلدهای موجوددر جداول و محتویات فیلدهای مذکور و کلیه مشکلات داده‌ای در قالب لیستی ارائهمی‌گردند. سپس عملیات پاکسازی برای انها انجام می‌گیرد. این عملیات غالبا در زمرهیکی از موارد زیر هستند:

  • حذف مقادیر Null
  • هم مقدار‌سازی فیلدهای مشابهاز نظر معنا
  • ایجاد فیلدهای کمی جدید قابل استخراج از روی داده‌‌های جدول مورد نیاز
  • یکی‌کردن داده‌ها از منابع مختلف
  • خلاصه‌سازی سطرهای هم‌معنی کهایجاد افزونگی می‌کنند.
  • ایجاد کلید جانشین برای جداول
  • تبدیلچند ستون به چند سطر یا بالعکس
  • تقسیم یک ستون جدول به چند ستون
  • طراحی انباره داده موضوعی

از انجا کهکاربران مختلف با نیازهای متفاوتی وجود دارند که می‌توانند از داده‌های درون انبارهداده استفاده کنند، براوردن نیازهای تمام کاربران به وسیله یک سیستم مرکزی همیشهامکان پذیر نیست. از طرفی یک سیستم مرکزی، متمرکز بر داده و سیستم می‌باشد وکاربر نهایی ممکن است بخواهد کنترل بیشتری روی محیط اطلاعاتی خود داشته باشد.

راه حل این مشکلات مرکز داده‌ای است که به ان انباره داده‌ای سازمانی نیز گفتهمی‌شود. مرکز‌داده‌ای، انباره داده خاصی است که داده‌های مورد نیاز برای یک بخش ازسازمان یا کاربرهای مرتبط به ان را جمع‌اوری می‌کند.

طراحی مراکز داده‌ایمربوطه بنا به صلاح‌دید فرد خبره در قالب مدل ستاره‌ای یا دانه ‌برفی و یا طرحمنظومه‌ای صورت می‌گیرد.

طرح ستاره‌ای: عمومی‌ترین نمونه برای مدل‌سازی مدلچند‌بعدی، طرح ستاره است. در این طرح انباره داده شامل یک جدول بزرگ مرکزی به نامجدول حقایق و یک سری جدول کوچکتر به نام جدول بعد که وابسته به جدولحقایق هستند می‌باشد.

طرح دانه‌برفی: این طرح، تغییریافته طرح ستاره‌ای استبه طوری که بعضی از جداول بعد، نرمال شده‌اند. تفاوت اصلی بین طرح ستاره‌ای و طرح دانهبرفی این است که جدول بعد در طرح دانه‌‌برفی به فرم نرمال نگهداری می‌شود تا میزانافزونگی کاهش پیدا کند. این کار باعث کاهش میزان حافظه مورد نیاز خواهد شد البتهصرفه‌جویی در فضای ذخیره‌سازی جدول بعد در مقایسه با حجم جدول حقایق ناچیز است چونتعداد اتصالاتی که برای پردازش یک گزارش باید گذارده شود در این حالت افزایشمی‌یابد و مدت زمان پاسخ ‌دادن به گزارش در مدل دانه‌برفی بیشتر از مدت زمان لازم درمدل ستاره‌ای است بنابراین غالبا طرح دانه برفی در طراحی انباره داده عمومیت طرحستاره‌ای را ندارد مگر انکه بنا بر صلاح‌دید فرد خبره بر طرح ستاره‌ای ترجیح دادهشود.

طرح منظومه‌ای: هنگامی که نیاز به چندین جدول حقایق باشد کهدارای جداول بعد‌های مشترک هستند، طرحی ایجاد می‌شود که به ان طرح کهکشان یامنظومه‌ای می‌گویند. در این مدل حقایق به جداول ابعاد اجازه می‌دهد که بینجداول حقایق مشترک باشند.

  • وارد سازی داده‌های پاکسازی شده به انباره داده

با توجه بهفرمت داده‌های اخذ شده، وارد‌سازی داده‌‌های پاکسازی شده به انباره داده با اجرایاسکریپت مربوطه (بخشبارگذاری[3]از عملیات ETL) انجام می‌شود.

انبار داده در اشکال و اندازه‌های متفاوتی وجود دارد که با هزینه و زمان در ارتباط است. رویکرد اغاز کردن یک پروژه انبار داده، متفاوت است. گامهایی که برای شروع یک پروژه انبار کالا داده باید طی شود، عبارتند از:

  1.  فراهم‌کردن اطلاعات حرفه‌ای
  2.  طرح‌ریزی داده‌ها
  3. چه کسی از انبار داده استفاده خواهد کرد.
  4. یکپارچگی درخواست‌های خارجی
  5. انتخاب فناوری مورد استفاده

 



[1]Extract

[2]Transform

[3]Load 

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26