ارائه‌ چارچوبی در راستای بهبود پیش‌بینی وضعیت ترافیک- قسمت ۱۲

بررسی توزیع جریان های ترافیکی در داده

بطور معمول جریان‌های ترافیکی مربوط به خیابان‌های شهری، رفتار و پترنی وابسته به زمان را دنبال می‌کنند. علاوه‌براین، رفتار ترافیکی مشاهده شده‌ی مربوط به یک خیابان، معمولاً در طی روزهای مختلف یکسان است. از دیگر ویژگی‌های مشترک جریان‌های ترافیکی همه خیابان‌ها نیز، وجود نرخ ترافیکی بالا در ساعت‌های اوج ترافیک است. در این راستا، با آنالیز داده‌های موجود و به دنبال یافتن رفتارهای ذکر شده، نمودارهایی همچون شکل (۴-۴) در مورد همه‌ی مسیرها، مشاهده شد.

برای دانلود متن کامل پایان نامه به سایت zusa.ir مراجعه نمایید.

شکل ۴-۴٫ روند جریان‌های ترافیکی مشاهده شده در خصوص مسیرهای مختلف، مربوط به ۱۰ سایکل متوالی ومستقل(۶۰۰۰دقیقه). محور افقی و عمودی به ترتیب نشان‌دهنده‌ی زمان (به دقیقه) و نرخ ترافیکی(تعداد ماشین‌های عبوری در بازه‌ی یک دقیقه) می‌باشند. رنگهای مختلف نمایانگر جریان‌های ترافیکی خیابانهای مختلف است. طبق شکل، بر خلاف مشاهده‌ی نرخ ترافیکی مختلف در خیابان‌های مختلف، همه‌ی جریان‌ها دارای پیک‌های متوالی و با فاصله‌های تقریباً یکسان می‌باشند.

در شکل ۴-۴، رنگهای متفاوت نشان‌دهنده‌ی جریانهای ترافیکی مشاهده شده برای یک مسیر، در طول ۱۰ سایکل می‌باشد. مطابق با انتظار، مشاهده می‌شود که علیرغم وجود رِنج‌های متفاوت نرخ ترافیکی مختص هر مسیر، همه آنها پیک‌های واضحی را تجربه می‌کنند. غالب این پیک‌ها بصورت پریودیک مشاهده می‌شوند و بطور تقریبی، عموم این رفتارها برای هر مسیر، در دامنه‌ی محدود و مشخصی دیده می‌شود.
به منظور مشخص شدن زمان مربوط به رفتارهای مختلف، دو مرحله میانگین‌گیری بر روی جریان‌ها انجام شد. در ابتدا، میانگین‌گیری بین تمام مسیرها انجام شد و سپس به جای ارائه داده‌ها در سطح دقیقه، میانگین هر ۶۰ دقیقه، یک نقطه را در نمودار نشان داد. بطور نمونه روند مشاهده شده در طول ۱۰ سایکل به طول ۱۰ ساعت از داده‌ی داده شده در نمودار(۱) نشان داده شده است.

شکل ۴-۵٫ ارائه‌ی دید دقیق‌تر در خصوص رفتار جریان‌های ترافیکی مربوط به ۱۰ سایکل نمونه. محور افقی و عمودی به ترتیب نشان‌دهنده‌ی زمان ونرخ ترافیکی می‌باشند. پریودهای اوج ترافیک (پیک) در طول ساعت‌های اولیه سایکل‌ها قابل مشاهده است و در نموداری جدا بزرگنمایی شده است. روند آورده شده مربوط به میانگین نرخ ترافیکی ۲۰ مسیر است.

با دقت در نمودارِ شکل(۴-۵) مشخص می‌شود که پیکهای تند در ساعت‌های اولیه سایکل‌ها رخ داده‌اند. هرچند، با توجه به مصنوعی بودن پایگاه داده، زمان واقعی مرتبط با این رفتارها مشخص نیست، اما می‌توان برای تفسیر آنها به توضیحاتی که در خصوص شبیه ساز این پایگاه داده، آورده شده، استناد کرد. با دقت در توضیحات مرتبط با شبیه ساز، نکات مفید زیر استخراج شد:
همانطور که میدانیم روند مشابهی که در مورد وسایل نقلیه در طی روزهای مختلف دیده می‌شود، این‌است که رفت‌وآمدها و جابجاییها در ساعات ابتدائی روز شروع و اوج می‌گیرند و در ساعات پایانی شب، رفت و آمدها پایان مییابند و جایجایی‌های تقریباً ناچیزی در طول شب صورت میگیرد. به منظور دقت در شبیه سازی و نزدیک شدن به واقعیت، اعمال این موارد نیز در TSF رعایت شده است. بدین صورت که، همانطور که در توضیحات شبیه ساز آمده است، بعد از هر سایکل، توزیع مبدأ و مقصدهای وسایل نقلیه بطور رندوم انتخاب و شبیه سازی از ابتدا شروع میشود. بنابراین، این سایکلها در این پایگاه داده‌ی مصنوعی میتوانند معادل با روزهای متفاوت در پایگاه دادههای واقعی در نظر گرفته شوند.
نکته قابل اشاره دیگر اینست که، همانطور که می‌دانیم و همچنین در تحقیقات مرتبط با این حوزه اشاره شده است، ساعت‌های اوج ترافیکی، ساعتهای همزمان با شروع فعالیت های روزانه، همچون رفتن به سر کار، مدارس و … تعریف می‌شوند. همچنین، مسئله وقوع اوج ترافیک، تقریباً ۲ بار در طول روز تکرار میشود که بسته به کشور و شهر و فرهنگ آنها، ساعت‌های رخداد آنها متفاوت می‌باشند. بطور مثال در [۲۲] ساعت‌های رخداد پیک صبحگاهی[۱۶۵](۶ تا ۹) و پیک عصر[۱۶۶] (۱۵:۳۰ تا ۱۸:۳۰) در نظرگرفته‌شده‌است. همچنین در [۴۳] این ساعات به ترتیب (۸ تا ۹:۳۰) و (۱۶ تا ۱۸) ، در [۴۴] پیک صبحگاهی (۶ تا ۱۰) و در دیگر تحقیقات این پریود (۷:۱۵ تا ۹:۱۵) گزارش شده‌اند. هرچند وجه مشترک همه‌ی جریان‌های ترافیکی، وقوع ۲ بار اوج ترافیکی است که به ساعات هجوم[۱۶۷] مشهورند (صبح و عصر) . بنابراین در طی ۲۴ ساعت معمولاً دو پیک در رفتار جریانهای ترافیکی مشاهده میشود. هرچند، داده‌ی مورد بررسی حاصل اجرای سایکلهای به طول ۱۰ساعت هستند، بنابراین احتمال وجود ۱ پیک در طول بازه ۱۰ ساعته، مطابق با انتظار است. چرا که در داده‌های واقعی نیز غالباً، فاصله‌ی شروع پیک صبحگاهی تا پیک عصر، بیش از ده ساعت میباشد. مطابقاً در نمودار (۴-۵) نیز در طی یک سایکل، یک پیک مشاهده میشود.

این مطلب را هم بخوانید :
ارائه‌ چارچوبی در راستای بهبود پیش‌بینی وضعیت ترافیک- قسمت ۹

مرحله پیش پردازش و استخراج ویژگی

همان طور که در قسمت توضیح پایگاه داده، اشاره شد، دادههای نرخ ترافیکی در بازههای ۱-دقیقهای ثبت شده‌اند. هرچند ارائهی داده در این سطح، علاوه بر افزایش بُعد منجر به نوسانات رفتاری شدید و جریانهای ترافیکی میشود (این موضوع نیز در نمودار (۴-۴) به وضوح دیده می‌شود). از طرف دیگر، در اکثر تحقیقات، داده‌ها در غالب بازه‌های ۳-دقیقه‌ای یا بازه‌های طولانی‌تر ارائه شده‌اند. بنابراین یک مرحله گردآمدگی نیاز است، تا دادهها به بلاک های طولانیتر تبدیل شوند [۱۹]. در تعیین سایز گردآمدگی باید نکاتی لحاظ شود. در واقع سایز گردآمدگی باید بقدری طولانی باشد که منجر به اطلاعات تکراری نشود، اما طول آن نباید بقدری بزرگ باد که موجب از بین رفتن اطلاعات مفید شود. در طی آزمایشات مختلف، مرحله‌ی گردآمدگی با سایزهای ممکن انجام شد که از میان آنها سایز ۱۰ و ۱۵-دقیقهای کارآیی بهتری نسبت به دیگر سایزها داشت. به بیانی دقیق‌تر، هر ۱۰ یا ۱۵ رکورد (دقیقه)های پشت سر هم با هم جمع بسته شده ودر غالب یک رکورد یا بردار نمایش داده میشوند.
در نهایت، با اعمال این مرحله بطور نمونه می‌توان، داده‌های هر یک ساعت را با ۶ رکورد به جای ۶۰ رکورد نمایش داد. در نموادر شکل (۴-۶) نمایی از این مرحله را میبینیم.
شکل ۴-۶٫ نمایش نمادین روند انجام مرحله گردآمدگی با سایز نمونه‌ی ۱۰-دقیقه‌ای. در این مرحله، جلوگیری از افزایش بُعد و رفتارهای نوساناتی شدید که حاوی اطلاعات مفید نیستند.
پس از اعمال پیش پردازش با هدف کاهش بُعد، لازم است برای آموزش مدل از دادههای موجود، خصیصه[۱۶۸] استخراج کنیم. در این راستا از هر پنجره‌ی ۶۰-دقیقهای مربوط به داده‌های آموزشی، نیم ساعت اول به منظور ساختن بردار خصیصه‌ها و نیم ساعت دوم برای ساختن بردار هدف در نظر گرفته میشود. همانطور که مشخص است، از ۶ بردار حاصل از گردآمدگی دادههای یک ساعت، بردار پنجم که جمع رکوردهای ۴۱-۵۰ است، بعنوان بردار هدف و بردار اول، دوم و سوم بعنوان بردارهای خصیصه در نظر گرفته می‌شوند. از آنجا که بطور معمول یک نمونهِ آموزشی، تحت تنها یک بردار ارائه میشود، پس بردار یکم و دوم و سوم را به دنبال هم قرار داده و یک بردار ویژگی ۶۰ =۲۰×۳ مقداری تشکیل می‌دهیم. فرمت بردارهای هدف و خصیصه را در غالب فرمول‌های (۴-۵) و (۴-۶) به ترتیب می‌بینیم.

این مطلب را هم بخوانید :
رابطه بین فعالیت آنزیم های زنجیره تنفسی و بازدهی خوراک در بره های نر قزل ...

(۴-۵)