به کارگیری منابع انرژی تجدیدپذیر و ادغام وسایل نقلیه الکتریکی به ریزشبکهها چالشهایی را برای عملکرد کنترل و بهرهبرداری این سیستم ها ایجاد کرده است. از جمله مهمترین این چالشها، عدم قطعیت در خروجی توان منابع انرژی تجدیدپذیر و دینامیک خودروهای برقی را میتوان اشاره کرد.این پایاننامه دو رویکرد آنلاین مدیریت توان ریزشبکه بر اساس مدلهای مبتنی بر یادگیری با ناظر مطلع از لایه فیزیکی و یادگیری تقویتی مکعبی را ارائه میدهد. روشهای پیشنهادی بر روی ریزشبکههای مبتنی بر انرژی تجدیدپذیر متصل به شبکه مورد بررسی قرار گرفتهاند. این ریزشبکهها شامل پنل خورشیدی، توربین بادی، سیستم ذخیره ساز انرژی و خودروی برقی میباشند. شبیهسازیهای انجام شده نشان میدهد که روش پیشنهادی یادگیری با ناظر، با اطلاعات موجود از گذشته و حال، به طور موثر ذخیره ساز انرژی را کنترل میکند. نتایج شبیهسازی دراین بخش نشان میدهد که مدل مبتنی بر یادگیری عمیق مطلع از لایه فیزیکی، در ۹۸.۷٪ از بازه ۲۴ ساعته، موفق به تقلید رفتار بهینه باتری شده است. همچنین در سناریو مبتنی بر یادگیری تقویتی، تجزیه و تحلیل مقایسهای، عملکرد الگوریتم یادگیری Q مکعبی پیشنهادی با الگوریتم های یادگیری Q سنتی و یادگیری Q دوگانه مقایسه شده است .این استراتژی برخط توسعه یافته برای مدیریت موثر همزمان سیستم ذخیرهساز انرژی و خودروهای برقی در ریزشبکه طراحی شده است. میانگین هزینه عملیاتی روزانه ریزشبکه در مجموعه تست (ارزیابی شده توسط یادگیری Q مکعبی) 4.98 دلار است؛ که در تضاد با 5.3 دلار و 5.54 دلار برآورد شده توسط یادگیری Q و یادگیری Q دوگانه است. علاوه براین، یادگیری Q مکعبی استحکام خود را در مدیریت موثر موقعیتهای پیش بینی نشده خودروهای برقی نشان میدهد و حتی در شرایطی که در طول آموزش عامل خودروبرقی با آن مواجه نشده است، تصمیمات آگاهانه را امکانپذیر مینماید.