ارائه‌ چارچوبی در راستای بهبود پیش‌بینی وضعیت ترافیک- قسمت ۷

که در این نمایشt یک مقدار حقیقی[۹۶] و x(t) یک سیگنال پیوسته هست. برای بدست آوردن یک سری  باید در زمان‌های گسسته از سیگنال نمونه گرفت. اگر بازه ی نمونه‌گیری، در نمونه‌گیری یکنواخت[۹۷]،  باشد، خواهیم داشت:

برای دانلود متن کامل این پایان نامه به سایت  fumi.ir  مراجعه نمایید.

(۳-۲)

از جمله پردازش‌های ممکن روی سری‌های زمانی، علاوه بر دسته‌بندی، توصیف[۹۸] و تبدیل[۹۹] پیشبینی مقادیر آینده x[t] است. به منظور پیش‌بینی آینده با برگشت به عقب از زمان t، سری زمانی  را خواهیم‌داشت که می‌خواهیم x را در زمانهای آینده تخمین[۱۰۰] بزنیم:

(۳-۳)

در این نشانه‌گذاری به s، افق پیشبینی [۱۰۱] می‌گویند. اگر بخواهیم فقط یک نمونه زمانی در آینده را پیش‌بینی کنیم s را برابر ۱ در نظر می‌گیریم. در واقع این مبحث، یک مسئله تقریب تابع[۱۰۲] هست که برای حل آن باید ابتدا یک مدل در نظرگرفته وآن را روی همه مقادیرگذاشته x[ti] آموزش دهیم و سپس مدل را برای پیش‌بینی x[t+s] اجرا کنیم. به عبارتی می‌توان پیش‌بینی را به دید یک نگاشت [۱۰۳]یا تابع  در نظرگرفت که x ورودی و خروجی (یک مقدار پیوسته یا با ترتیب) می‌باشد که قرار است این تابع و رابطه x و y را یاد بگیریم.
از میان روش‌های متعدد گسترش یافته در این حوزه مانند روش‌های کالمن فیلترینگ [۴]، [۳]، متدهای آماری غیرپارامتریک [۵]، [۶]، روش‌های یادگیری متوالی [۷] مدل‌های شبکه‌عصبی [۸-۱۲] و آنالیزهای سری‌های زمانی[۱۳-۱۷] از پرکاربردترین متدهای مورد استفاده به حساب می‌آیند. در نگاهی کلی، (۱) روش‌های آنالیز سری‌های زمانی بر روی ویژگی‌های سری زمانی بودن داده‌ها، تکیه دارند و غالبا برای این فرض استوارند که داده‌های ثبت شده در طی زمان‌های مختلف نسبت به هم همبستگی[۱۰۴] دارند. (۲) الگوریتم‌های شبکه عصبی مصنوعی نیز متدهای یادگیری باناظر[۱۰۵] هستند که با بکارگیری مدل‌های مختلف همچون RBF، TDNN،… و تنظیم انواع پارامترها شامل تعداد لایه‌ها و نرون‌ها، سعی در حل مسئله پیش‌بینی ترافیک دارد. علاوه بر این، نظر به گرایش قابل ملاحظه‌ای از تحقیقات اخیر به سمت (۳) روش‌های داده کاوی، در قسمت بعدی به بررسی آن‌ها می‌پردازیم. در واقع تکنیک های داده کاوی قابلیت استخراج اطلاعات از پایگاه داده‌های بزرگ همچون داده‌های ترافیکی را دارند. در ادامه به توضیح و بررسی هرکدام از این روش‌ها می‌پردازیم.

این مطلب را هم بخوانید :
جستجوی مقالات فارسی - ارزیابی تاثیرات سفارشی سازی و محیط بازار بر موفقیت کسب و کار ...

روش‌های مبتنی بر آنالیزهای سری زمانی:

نظر به ارائه‌ی داده‌های ترافیکی در غالب داده‌های سری زمانی، آنالیزهای سری زمانی بطور گسترده‌ای مورد استفاده‌ی این حوزه قرار گرفتند. در واقع آنالیزهای سری زمانی در جهت استخراج آمارهای معنادار و دیگر خصوصیات از داده سری زمانی مورد استفاده قرار می‌گیرند. همچنین فرض اصلی آنالیزهای سری زمانی، به همبستگی داده‌های جمع آوری شده در طول زمان، استوار است .[۲۲] این موضوع از دهه ۹۰ در مبحث پیشبینی کوتاه مدت ترافیک اهمیت زیادی پیدا کرده است. بسیاری از روش‌های عضو این دسته، مبتنی بر مدل معروف” میانگین متحرک خودگردان یکپارچه[۱۰۶] (ARIMA) هستند که با توجه به پرکاربرد بودن آن در بسیاری از تحقیقات همچون [۱۳] ، [۱۴]، [۱۵] ،[۱۷] در ابتدا مروری بر مفاهیم آن خواهیم داشت.
مدل‌های ARIMA در سری‌های زمانی برای توصیف مدل یا پیشبینی وضعیت آینده به کار گرفته می‌شوند. این مدل سه پارامتر مهم q,d,p دارند که به ترتیب درجه خودگردانی[۱۰۷]، یکپارچگی[۱۰۸] و میانگین متحرک[۱۰۹] هستند. صفر بودن هرکدام از این پارامترها، نشان دهنده‌ی مدل‌های Auto-Regression(AR) که همان ARIMA(1,0,0)، مدل‌های Integrated(I) یا ARIMA(0,1,0) و مدل‌های Moving Average(MA) که برابر با ARIMA(0,0,1) می‌باشد. بطور کلی، مدل‌های ARIMA در مواردی که داده‌ی مورد بررسی غیر ایستا[۱۱۰] داشته باشند و روند آن‌ها قابل تشخیص باشد، بکار گرفته می‌شوند. اگر xt سری زمانی داده شده باشد که t یک عدد صحیح شاخص و xt عدد حقیقی باشد، پیشبینی با ARIMA را می‌توان ترکیبی از مدل‌های wide-sense stationary بصورت زیر در نظر گرفت:

(۳-۴) ( ۱- ) Xt = ( ۱+ ) εt
این مطلب را هم بخوانید :
منابع مقالات علمی : ارائه‌ چارچوبی در راستای بهبود پیش‌بینی وضعیت ترافیک- قسمت ۳

که در آن پارامتر L عملگر تأخیر و مربوط به بخش خودگران مدل و  پارامتر قسمت میانگین متحرک هستند. همچنین tε نمایانگر خطای مدل می‌باشد و در حالت ایستا[۱۱۱] بصورت:

(۳-۵)