حمل و نقل و چالش های آن همواره مورد توجه پژوهشگران بوده است. از جمله ی این چالش ها، ایجاد عبور و مرور روان برای خودروها در سطح شهر است. استفاده از چراغ راهنمایی برای اولویت بندی عبور خودروها در سطح تقاطع از جمله روش های مدیریت ترافیک می باشد. در این پژوهش به مطالعه ی چراغ راهنمایی هوشمند با شبیه سازی در محیط سومو پرداخته شده است. دو مدل تقاطع، تکی-مستقل و دو تقاطع متصل به هم در نظر گرفته شده است. محیط برای به دست آوردن اطلاعات لازم به صورت گسسته در نظر گرفته شده است و تلاش شد از اطلاعات مختلف دریافتی ناشی از این روش، برای بهبود عملکرد عامل استفاده شود. با استفاده از یادگیری تقویتی (یادگیری کیو و شبکه عصبی عمیق)چراغ راهنمایی به عنوان عامل هوشمند تصمیم گیرنده در سطح تقاطع با مدیریت تخصیص فازها، در پی کاهش زمان انتظار وسایل نقلیه در سطح تقاطع است. نتایج این پایان نامه حاکی از کاهش طول صف خودروهای در انتظار با به کارگیری روش های ارائه شده، می باشد. در فاز دوم این پژوهش با در نظر گرفتن بسیاری از مفروضات قبلی، دو تقاطع در حالتی کاملا مستقل و حالت اشتراک گذاری اطلاعات میان عاملان بررسی شد. مقایسه میان نحوه تعریف پاداش و اثرگذاری آن بر حجم ترافیک بررسی شده است. همچنین، مطالعه ی مختصری بر پایش ترافیک از طریق الگوریتم یولو نسخه 5 نیز صورت گرفته است که نشان داده شد نحوه ی استفاده از این الگوریتم بر دقت شناسایی وسایل نقلیه و متعاقبا برآورد حجم ترافیک موثر است. در این بخش انواع وسایل نقلیه با در نظر گرفتن ضریب هم سنگ، در ایجاد ترافیک موثر واقع شدند که این امر برآورد اطلاعات را به شرایط واقعی نزدیک تر می کند.