که در این نمایشt یک مقدار حقیقی[۹۶] و x(t) یک سیگنال پیوسته هست. برای بدست آوردن یک سری باید در زمانهای گسسته از سیگنال نمونه گرفت. اگر بازه ی نمونهگیری، در نمونهگیری یکنواخت[۹۷]، باشد، خواهیم داشت:
برای دانلود متن کامل این پایان نامه به سایت fumi.ir مراجعه نمایید. |
(۳-۲) |
از جمله پردازشهای ممکن روی سریهای زمانی، علاوه بر دستهبندی، توصیف[۹۸] و تبدیل[۹۹] پیشبینی مقادیر آینده x[t] است. به منظور پیشبینی آینده با برگشت به عقب از زمان t، سری زمانی را خواهیمداشت که میخواهیم x را در زمانهای آینده تخمین[۱۰۰] بزنیم:
(۳-۳) |
در این نشانهگذاری به s، افق پیشبینی [۱۰۱] میگویند. اگر بخواهیم فقط یک نمونه زمانی در آینده را پیشبینی کنیم s را برابر ۱ در نظر میگیریم. در واقع این مبحث، یک مسئله تقریب تابع[۱۰۲] هست که برای حل آن باید ابتدا یک مدل در نظرگرفته وآن را روی همه مقادیرگذاشته x[ti] آموزش دهیم و سپس مدل را برای پیشبینی x[t+s] اجرا کنیم. به عبارتی میتوان پیشبینی را به دید یک نگاشت [۱۰۳]یا تابع در نظرگرفت که x ورودی و y خروجی (یک مقدار پیوسته یا با ترتیب) میباشد که قرار است این تابع و رابطه x و y را یاد بگیریم.
از میان روشهای متعدد گسترش یافته در این حوزه مانند روشهای کالمن فیلترینگ [۴]، [۳]، متدهای آماری غیرپارامتریک [۵]، [۶]، روشهای یادگیری متوالی [۷] مدلهای شبکهعصبی [۸-۱۲] و آنالیزهای سریهای زمانی[۱۳-۱۷] از پرکاربردترین متدهای مورد استفاده به حساب میآیند. در نگاهی کلی، (۱) روشهای آنالیز سریهای زمانی بر روی ویژگیهای سری زمانی بودن دادهها، تکیه دارند و غالبا برای این فرض استوارند که دادههای ثبت شده در طی زمانهای مختلف نسبت به هم همبستگی[۱۰۴] دارند. (۲) الگوریتمهای شبکه عصبی مصنوعی نیز متدهای یادگیری باناظر[۱۰۵] هستند که با بکارگیری مدلهای مختلف همچون RBF، TDNN،… و تنظیم انواع پارامترها شامل تعداد لایهها و نرونها، سعی در حل مسئله پیشبینی ترافیک دارد. علاوه بر این، نظر به گرایش قابل ملاحظهای از تحقیقات اخیر به سمت (۳) روشهای داده کاوی، در قسمت بعدی به بررسی آنها میپردازیم. در واقع تکنیک های داده کاوی قابلیت استخراج اطلاعات از پایگاه دادههای بزرگ همچون دادههای ترافیکی را دارند. در ادامه به توضیح و بررسی هرکدام از این روشها میپردازیم.
روشهای مبتنی بر آنالیزهای سری زمانی:
نظر به ارائهی دادههای ترافیکی در غالب دادههای سری زمانی، آنالیزهای سری زمانی بطور گستردهای مورد استفادهی این حوزه قرار گرفتند. در واقع آنالیزهای سری زمانی در جهت استخراج آمارهای معنادار و دیگر خصوصیات از داده سری زمانی مورد استفاده قرار میگیرند. همچنین فرض اصلی آنالیزهای سری زمانی، به همبستگی دادههای جمع آوری شده در طول زمان، استوار است .[۲۲] این موضوع از دهه ۹۰ در مبحث پیشبینی کوتاه مدت ترافیک اهمیت زیادی پیدا کرده است. بسیاری از روشهای عضو این دسته، مبتنی بر مدل معروف” میانگین متحرک خودگردان یکپارچه[۱۰۶] (ARIMA) هستند که با توجه به پرکاربرد بودن آن در بسیاری از تحقیقات همچون [۱۳] ، [۱۴]، [۱۵] ،[۱۷] در ابتدا مروری بر مفاهیم آن خواهیم داشت.
مدلهای ARIMA در سریهای زمانی برای توصیف مدل یا پیشبینی وضعیت آینده به کار گرفته میشوند. این مدل سه پارامتر مهم q,d,p دارند که به ترتیب درجه خودگردانی[۱۰۷]، یکپارچگی[۱۰۸] و میانگین متحرک[۱۰۹] هستند. صفر بودن هرکدام از این پارامترها، نشان دهندهی مدلهای Auto-Regression(AR) که همان ARIMA(1,0,0)، مدلهای Integrated(I) یا ARIMA(0,1,0) و مدلهای Moving Average(MA) که برابر با ARIMA(0,0,1) میباشد. بطور کلی، مدلهای ARIMA در مواردی که دادهی مورد بررسی غیر ایستا[۱۱۰] داشته باشند و روند آنها قابل تشخیص باشد، بکار گرفته میشوند. اگر xt سری زمانی داده شده باشد که t یک عدد صحیح شاخص و xt عدد حقیقی باشد، پیشبینی با ARIMA را میتوان ترکیبی از مدلهای wide-sense stationary بصورت زیر در نظر گرفت:
(۳-۴) | ( ۱- ) Xt = ( ۱+ ) εt |
که در آن پارامتر L عملگر تأخیر و مربوط به بخش خودگران مدل و پارامتر قسمت میانگین متحرک هستند. همچنین tε نمایانگر خطای مدل میباشد و در حالت ایستا[۱۱۱] بصورت:
(۳-۵) |