کاربردهای OLAP

            کاربردهای معمول OLAP عبارتند از : گزارشات تجاری فروش ، بازاريابی ، گزارشات مديريتی ، مديريت کارايی تجاری (BPM ) ، بودجه بندی ، پيش بينی مالی ، گزارشات مالی و موارد مشابه...
سيستم های OLAP داده های خود را به نحوی خاص نگهداری می کنند و از اين نظر مانند يک ديتابيس عمل می‌کنند. اين سيستم ها از نظر سرعت در برخورد با داده های چند بعدی بهتر از خويشاوندان Relational خود عمل می کنند و از اينرو به اين سيستم ها ، بانکهای اطلاعاتی سلسله مراتبی (Hierarchical) هم گفته می‌شود. يک ديتابيس چند بعدی معماری ای از ديتابيس بوده که اطلاعات Aggregate شده را بگونه ای نگهداری می کند که تمامی اجزاء داده ای با اهميت با اجزايی که به عنوان ابعاد می باشند به شکل متقاطع در ارتباط باشند. بعنوان مثال يک ديتابيس چند بعدی می تواند فروش کل ساليانه را با ماه ، خط توليد و فروشنده متقاطع سازد. حاصل اين تقاطع اين است که گزارشات بسيار متنوعی مثل مجموع فروش در ماه خاص يا بهترين فروشنده سال و ... از سيستم به راحتی قابل استخراج است.
در شکل زير نمايش ساده ای از داده های چندبعدی را ملاحظه می کنيد:

   در مثال فوق ، جزء داده ای "مجموع فروش" داده با اهميت ماست که بنام قلم اطلاعاتی یا Fact خوانده می شود و به هريک از پارامترها و اجزای داده ای نظير "سال" ، "مشتری" و ... نام بعد يا Dimension اطلاق می گردد.
سيستم های OLAP در مواردی کاربرد دارند که اولا داده ها در حجم بسیار زیادی وجود داشته و محتاج آنالیز و گزارش گیری باشند و در عین حال کاربر نهايی به عامل زمان توجه بسيار داشته باشد، آناليزهای داده‌ای پيچيده بوده و راحتی استفاده از سيستم نيز پارامتر مهمی باشد.

نحوه عملکرد سيستم های OLAP

          سيستم OLAP يک تصوير از داده های منابع معرفی شده خود را برداشته و آنها را در يک مکعب اطلاعاتی (Cube) مرتب می کند. پرس و جوهای بعدی می تواند روی اين مکعب اجرا شود. در عمل ثابت شده که کوئريهای پيچيده روی سيستم های OLAP به زمانی حدود تنها 0.1 درصد از زمان اجرای کوئری مشابه روی سيستم‌های OLTP احتياج دارند.
          برای دستيابی به چنين سرعت بالا و زمان اندکی ، سيستم های OLAP  از روشهای خاصی جهت نگهداری داده ها استفاده می کنند. آنها برای رسيدن به اين هدف ، جداول اطلاعاتی خود را در آرايش های ستاره ای يا دانه برفی می چينند. در ميان اين معماری ، جداول حقايق (Facts ) قرار دارند که در عمل تمامی Fact هايی را نگهداری می کنند که کوئری ها را شکل می دهند. جداول ابعاد (Dimension Tables) جداولی هستند که به جداول Facts لينک شده اند و نشان می دهند که چگونه می توان اجتماعی از داده های رابطه ای را مورد پردازش قرار داد.

انواع سيستم های OLAP

          سيستم های OLAP امروزه بر سه نوع اصلی دسته بندی می شوند:

  • سيستم های OLAP چند بعدی MOLAP
  • سيستم های OLAP رابطه ای ROLAP
  • سيستم های OLAP از نوع HOLAP

سيستم های MOLAP بدليل ساختار خاص نگهداری اطلاعات از سرعت بالاتری نسبت به ساير مدلها برخوردارند . اين سيستم ها جداول داده های Fact و Dimension را با ايندکسهای فشرده نگهداری کرده و عملا کوئريهای تحليلی پيچيده را در حداقل زمان اجرا می کنند.
سيستم های ROLAP عمليات OLAP را در قالب استفاده از مدل سنتی Relational ساماندهی می کنند و لذا از سيستم های MOLAP کندتر عمل می کنند و به فضای بيشتری نيز نياز دارند.
سيستمهای HOLAP بشکل بينابينی پياده سازی شده اند يعنی داده های Fact را در جداول فشرده و داده های Dimension را در فضای رابطه ای نگهداری می کنند لذا از مزايای هردومدل سود می برند اما ممکن است هنگام دسترسی به ريز داده ها بدلیل حجم فراوان آنها دچار کندی انتقال دیتا شوند.

 

داده کاوی در توليد چهار نوع دانش ذیل مفيد است:
- دانش سطحی (کاربردهای SQL )
- دانش چند وجهی (کاربردهای OALP )
- دانش نهان (تشخيص الگو و کاربردهای الگوریتم یادگيری ماشينی)
- دانش عميق (کاربردهای الگوریتم بهينه سازی داخلی)

از آنجا که داده کاوی با بانکهای اطلاعاتی بزرگ سروکار دارد، به شکل ایده آلی با تکنولوژی Client/Server سازگار شده است . کاربردهای عمومی داده کاوی بيشتر شامل تقسيم کردن داده ها در خوشه های لازم، کدگذاریهای مناسب، کاوش برای الگوها و طراحی کردن با استفاده از فنون آماری و الگوریتمهای ژنتيکی است . تعداد زیادی از بسته های نرم افزاری واجد این جنبه های ابزارهای داده کاوی با درجات متفاوتی از جامعيت در دسترس هستند . برای نمونه می توان به SPSS يا Oracle OLAP Server يا DB2 OLAP Server اشاره کرد.

 

کاربرد و مزایای تکنیک های وب کاوی

وب كاوي

       در سالهاي اخير وب معنايي به عنوان يكي از مهمترين موضوعات تحقيقاتي در حوزه ي وب مطرح شده است. اين موضوع كاربردهاي متعددي در حوزه هايي نظير بيو انفورماتيك، علوم زيستي، مديريت دانش، آموزش تحت وب و غيره دارد.حوزه هاي تحقيقاتي وب معنايي و وب كاوي به سرعت در حال پيشرفت است. هر كدام از اين حوزه ها مكمل يكديگر هستند زيرا هر يك قسمتي از چالش هاي جديدي كه در وب كنوني وجود دارد را مورد بررسي قرار مي دهند. همچنين تحقق كامل حوزه ي جديد وب معنايي مستلزم ارتقاء سطح داده هاي موجود بر روي وب كنوني به سمت دانش مي باشد. براي اين منظور روش هاي مختلف وب كاوي مي توانند براي رسيدن به دانش نهفته در داده هاي موجود و همچنين پيدا كردن كانديداهاي مناسب براي شركت در فرايند ايجاد آنتولوژي هاي مربوطه ، مورد استفاده قرار گيرند. فقدان يك چارچوب مشخص جهت استفاده از روش هاي وب كاوي در حوزه ي وب معنايي ، بهره گيري مناسب از روش هاي مذكور را از محققين حوزه ي وب معنايي سلب نموده است. در اين مقاله با تحليل رابطه ي در هم بافته ي دو حوزه ي تحقيقاتي وب معنايي و وب كاوي ، زمينه هاي استفاده از مدل هاي وب كاوي در تحقق وب معنايي شناسايي و دسته بندي مي شوند. نتايج حاصل از اين پژوهش مي توانند در جهت دهي و استفاده ي مناسب از روش هاي موجود در اين حوزه ها موثر واقع شوند.

مشكلات ومحدوديت هاي وب كاوي در سايت هاي فارسي زبان

         در دهه هاي اخير ، بيشترين اختلاف نظر در باب شيوه املاي كلمات فارسي بر سر موضوع جدانويسي يا پيوسته نويسي كلمات مركب بوده است.فرهنگستان زبان و ادب فارسي ، در اين باب راه ميانه را برگزيده و كوشيده است تا فقط مواردي را كه جدانوشتن و يا پيوسته نوشتن آنها الزامي است ، تحت قاعده و ضابطه درآورد و شيوه نگارش بقيه كلمات مركب را به ذوق و سليقه نويسندگان واگذار كند.]فرهنگستان،1382[
بعضي چالش هاي زبان فارسي در رايانه و بخصوص در اينترنت كه باعث تفاوت در نتيجه جستجو در وب يا وب كاوي مي شود از قرار زير است :
الف) تنوع نحوه استفاده از “مي” چسبان و غير چسبان ، مثل كلمات “مي تواند” و “ميتواند”.
ب) تنوع نحوه بكاربردن چسبان و غير چسبان “ها” ، مثل “آن ها” و “آنها”.
ج) بكار بردن بعضي پيشوند ها و پسوند ها ، مثل “همين كه” و “همينكه” ويا “هيچ يك” و “هيچيك” و يا “راه گشا” و “راهگشا”.
د) بكاربردن “حمزه” بصورت هاي مختلف ، مثل “مسؤول” و “مسئول” يا “مسأله” و “مسئله”.
ه) استفاده يا عدم استفاده از “ء” ، براي كلمات مختوم به هاي بيان حركت ، در حالت مضاف ، مثل “خانة مسكوني” و “خانه مسكوني”.
و) تنوع استفاده از “ي” در كلمات عربي مختوم به “ا” ، مثل “موسي” و “موسا”.
ز) تنوع املايي بعضي كلمات كه همه درست هستند ، مثل “اتاق” و “اطاق”.
ح) استفاده از كلمات اروپايي بصورت زبان اصلي يا ترجمه فارسي بخصوص در متون علمي ، مثل “Update” و “بروزآوري”.
ط) استفاده يا عدم استفاده از جمع مكسر براي بعضي كلمات.
ي) تبديل كلمات اروپايي به رسم الخط فارسي با همان تلفظ اصلي ، مثل “Source” و “سورس”.
ك) استفاده از “ا” و “آ” بجاي هم ، مثل “فرايند” و “فرآيند”.
ل) استفاده يا عدم استفاده از اعراب براي كلمات .
بعبارت ديگر ، يك كاربر ممكن است در جستجوي خود در وب ، كلمه كليدي خاصي را بكار برد ، ليكن در صفحات وب چنين كلمه اي بكار نرفته باشد و با توجه به مواردي كه در مورد تنوع كاربري كلمات ، بحث شد ،كلمه مشابهي ثبت شده باشد. بنابراين بسياري از صفحات وب مطلوب كاربر ، در مجموعه بازيابي شده ، وجود نداشته باشد.

بررسي تاثيرات وب معنايي و تكنيكهاي وب كاوي بر هوشمندي وب

خلاصه مقاله:
          ايده وب كاوي معنايي يا كاوش در وبمعنايي تركيب دو دانش جديد يعني وب كاوي و وبمعنايي مي باشد هدف اصلي وب كاوي معنايي مقابله و مواجهه با چالشهايي است كه هنگام ايجاد وب هوشمند ايجاد مي شود دراين مقاله با شمارش و طرح چالشهايي كه هنگام ايجاد هوشمندي وب بوجود مي آيند مطلب را آغاز نموده سپس با بهره برداري از ساختار معنايي موجود در وبمعنايي، راهكارهايي براي بهبود نتايج وبكاوي ارائه ميدهيم در ادامه مطالب با طرح راهكاري براي يكپارچه نموده وب كاوي و وبمعنايي چگونگي قابل فهم نمودن وب را براي ماشينها نشان خواهيم داد كه اين موضوع پايه و اساسي براي ايجاد نسلهاي بعدي ابزارهاي كاوش در وب هوشمند خواهد گرديد.

+ نوشته شده توسط نجات در یازدهم دی ۱۳۸۹ و ساعت ۱۸:۴۶ بعد از ظهر |