عنوان کنترل آرایش بندی برای سیستم چندعاملی شناورهای سطحی بدون سرنشین با یادگیری تقویتی نوع پژوهش پایاننامه کلیدواژهها Reinforcement Learning, Formation Control, Unmanned Surface Sailing, Multi-Agent Systems چکیده در سالهای اخیر، شناورهای سطحی بدون سرنشین در انجام م أ موریتهای اکتشاف اقیانوس، پایش محیط و عملیاتهای مختلف دریایی پرکاربرد شدهاند. از بین انواع مختلف این شناورها، نوع شناور بادبانی سطحی بدون سرنشین که از انرژ ی باد به جای سوخت و موتور محرکه استفاده می کند، برای عملیاتهای بلندمدت بسیار مناسب است. در این پای اننامه، کاربرد یادگیری تقویتی در کنترل آرایشبندی شناورهای سطحی بادبانی بدون سرنشین در ساختار رهبر و دنبالکننده سیستم چند عامل ی می پردازد. هدف تحقیق، توسعه یک استراتژ ی کنترل برای این نوع شناورها است؛ به صورتی که در حین حرکت در محیطهای دریایی پوی ا و نامطمئن آرایش مشخصی را حفظ کنند. با وجود دینامیک غ یرخطی سیستم، تغییرات محیطی و روشهای پ یچیده ناوبری در فرآیند آرایشبندی شناورهای بادبانی بدون سرنشین در سیستمهای چندعاملی، روشهای سنتی اغلب با چالش مواجه هستند. برای تحقق آرایشبندی، الزم است زاویه جهتگیری و سرعت شناورها با وجود سیستم چند ورودی چند خروجی آنها کنترل شود. در این پژوهش با بهکارگیری یادگیری تقویتی و ع ام لهای گرادیان سیاست قطعی عمیق، روشی برای حل این چالش ها طراحی شده است تا ناوبری مناسب و کنترل آرایشی منعطف حاصل شود. روش پ یشنهادی از طریق شبیه سازیهایی در شرایط محیطی مختلف و ساختارهای آرایش متفاوت، عملکرد مؤثر کنترلکنندهها را نشان م یدهد. پژوهشگران زهرا یدالهی (دانشجو)، امین ترابی جهرمی (استاد راهنما)، ولی اله غفاری (استاد مشاور)