پایان نامه درمورد هزینه های اضافی و شناسایی مشتری

= 421
[ category : airy,Liquor,Purchasing,Packaging,Meat,Sause,Others ]
4.4 . آماده سازی داده ها
همان گونه که در فصل سوم به صورت کامل تشریح شد، مرحله آماده سازی داده ها، مهمترین مرحله در طی فرایند داده کاوی می باشد. این مرحله شامل پاک سازی داده ها، نرمال سازی و کاهش بعد می باشد. این مرحله به عنوان حساس ترین مرحله داده کاوی می باشد.
پاک سازی داده ها:
فرایند پاک سازی داده ها، شامل تکمیل مقادیر مفقود، هموار سازی داده های مغشوش و برطرف کردن تناقضات موجود بین داده ها می باشد. در پایگاه داده موجود در این پروژه عملیات زیر برای پاک سازی داده ها انجام شده است:
حذف فیلد هایی که دارای مقادیر Null زیاد بوده و یا مقادیری برای آنها وجود ندارد:
در جدول اطلاعات فروش فیلد های زیر به علت مقایر Null زیاد حذف شدند:
تخفیف – Discount
هزینه های اضافی – Addition-Cost
هزینه واحد – unit-Cost
در جدول اطلاعات مشتری فیلد های زیر به علت مقایر Null زیاد حذف شدند:
جنسیت، از آنجایی که بیشتر مشتریان این شرکت را مشتریان حقوقی تشکیل می دادند. این فیلد دارای مقادیر Null بسیاری بود.
در جدول اطلاعات مشتریان، نوع مشتری اعم از حقیقی و حقوقی نیز وجود دارد که در بعضی از موارد مشتریان حقوقی با نوع حقیقی تعریف شده بودند، که تناقضات موجود بر طرف شد.
نرمال سازی داده ها:
تفاوت مقیاس ها در متغیر های مختلف، نتایج داده کاوی را در جهات متفاوتی تحت تاثیر قرار می دهد. برای کاهش تاثیر این نکته در نتایج داده کاوی به نرمال سازی داده پرداخته می شود. در فصل سوم به صورت کامل روش های متداول نرمال سازی داده بیان شد. دراین مطالعه برای نرمال سازی داده ها از روش امتیاز Z با رابطه زیر استفاده شده است. پس از اعمال این رابطه به روی داده ها، داده های موجود در پایگاه داده به صورت یکپارچه ذخیره شده اند. [33]

  مقاله درمورد ماتریس انتقال و پردازش تصویر

کاهش بعد:
در دنیای واقعی، معمولا داده به ندرت به منظور داده کاوی جمع آوری می شوند. در چنین مواردی معمولا با حجم عظیمی از داده ها روبه رو شده و به دنبال استفاده از آنها برای کاربرد خاص می باشیم. بنابراین کاهش بعد یکی از افدامات مورد نیاز است. ساخت، استخراج و انتخاب مشخصه ها، از رویکرد های کارآمد برای کاهش داده
می باشد. در این مطالعه با استفاده از رفتار مشاهده شده مشتری در گذشته متغیر های پیش بینی برای شناسایی مشتریان رویگردان انتخاب شده است که در ادامه به بررسی آنها پرداخته می شود. [40]

5.4 . متغیرهای پیش بینی در این مطالعه
در این قسمت متغیر های پیش بینی که در این مطالعه مورد استفاده قرار گرفته است به تفضیل شرح داده

این نوشته در علمی ارسال شده است. افزودن پیوند یکتا به علاقه‌مندی‌ها.