در سالهای اخیر پردازش دادهها در لبه شبکه (محاسبات مه) بسیار رایج شده است. این نوع پردازش به بهصورت محلی در لبه شبکه انجام شود. از طرفی ، ما کمک میکند تا درخواستهای حساس به تأخیر تأمین انرژی موردنیاز برای این محاسبات در لبه شبکه، پرهزینه و گاهی غیرممکن است؛ بنابراین استفاده در بسیاری از سناریوها لازم ، بهعنوان منبع تغذیه اصلی یا حتی تنها منبع انرژی ، از انرژیهای تجدید پذیر به دلیل داشتن وقفه زیاد و غیرقابلپیشبینی بودن انرژیهای تجدید پذیر، ارائه کیفیت ، است. بااینحال بالای خدمات به کاربران برای استفاده از انرژی در لبههای شبکه دچار چالش میشود. در این پژوهش به بررسی چالشهای موجود منابع تجدید پذیر در محاسبات مه پرداخته و الگوریتم مدیریت ، منابع مبتنی بر یادگیری تقویتی پیشنهاد میشود. روش پیشنهادی سیاست تخصیص بار را بهصورت پویا میان ابر و سرورهای لبه یاد میگیرد .نتایج شبیهسازی مؤید آن است که این الگوریتم هزینه بلندمدت سیستم (شامل تأخیر خدمات و هزینه عملیاتی) را کاهش میدهد