خانه / WebMining / اصول وب کاوی – مقدمه
وب کاوی

اصول وب کاوی – مقدمه

وب کاوی به معنای استخراج دانش جذاب و الگوهای کاربردی از وب است، و یکی از زیر شاخه های داده کاوی قرار می گیرد.

معموال داده ها در وب کاوی، داده های حجیم هستند و دارای ساختار مشخصی نیستند. در واقع مشکل اصلی در وب کاوی مرتب سازی و یا  clean کردن داده ها است. به عنوان مثال در سایت آمازون در روز به صورت معمول 20 میلیون تراکنش دارد که تحلیل ماتریس ها در این حجم از داده ها بسیار سنگین خواهد بود.

در واقع داده چیزی است که فضای داده کاوی را از وب کاوی متمایز می کند در وب کاوی فضای کاری که داریم وب است.

ما باید برای تجزیه و تحلیل در وب کاوی بتوانیم رفتار کاربران را در وب به صورت مدل در بیاوریم. هدف اینست که به صورت پویا، تبلیغات و محصولات و تخفیف ها و … برای کاربران شخصی سازی شود.

وب کاوی به طور کلی به سه زیر دسته زیر تقسیم می شود. که در فصل های آینده مفصل بحث خواهد شد.

  • Web Content Mining

یافتن الگوهای با ارزش از محتوای صفحات وب.

  • Web structure mining

یافتن الگوهای با ارزش از ساختار ارتباطی(لینک ها) بین صفحات.

  • Web usage mining

یافتن الگوهای با ارزش از رفتار کاربر و نحوه استفاده کاربر از صفحه وب.

وب کاوی

استخراج محتوا برای بررسی داده های جمع آوری شده توسط موتورهای جستجو و کرولرهای وب مورد استفاده قرار می گیرد. Web structure mining برای بررسی داده های مربوط به ساختار یک وب سایت خاص استفاده می شود و Web usage mining برای بررسی داده های مربوط به یک مرور خاص کاربر و نیز داده های جمع آوری شده توسط کلیک ها و submit  کردن انواع فرم ها توسط کاربر مورد استفاده قرار می گیرد.

اطلاعات جمع آوری شده از طریق وب کاوی با استفاده از پارامترهای داده کاوی داده ها مانند خوشه بندی و طبقه بندی، ارتباط و بررسی الگوهای پیوسته مورد ارزیابی قرار می گیرند (گاهی با کمک برنامه های کاربردی گرافیکی).

 

  • آیا این مقاله مفید بود؟
  • بله   خیر

با تمام وجود علاقمندم مباحث جدید مربوط به برنامه نویسی رو یاد بگیرم و به دیگران یاد بدم. نیمی از زمان روزانه رو صرف یادگیری میکنم. سعی میکنم مقالات مفید و جدید در حوزه برنامه نویسی و به ویژه جاوا اسکریپت رو برای شما دوستان عزیز در لایو گوگل منتشر کنم.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد.