پاداشها و یادداشتها!
الگوریتم جدید دیپمایند برای یادگیری آنچه بدو محول شده، کاری انجام میدهد که پیشبینی میکند بیشترین پاداش را به همراه دارد. الگوریتم، پاداشهای دریافتی را با پاداشهایی که انتظارشان را داشت مقایسه و با تحلیل تفاوتها و میزان خطاها عملکرد خود را اصلاح میکند. پژوهشگران بر این باور هستند شیوه یادگیری تقویتی (Reinforcement Learning) ممکن است نحوه یادگیری مباحث توسط مغز را تشریح کند. دیپمایند با بهینهسازی الگوریتمهای یادگیری تقویتی (Reinforcement Learning) درباره نقش دوپامین در یادگیری مغز به جزییات جدیدی دست یافت.
نوشته الگوریتمهای یادگیری تقویتی عملکرد مغز را شرح میدهند! اولین بار در رازمگ. پدیدار شد.
from رازمگ https://ift.tt/2USHjk9
via IFTTT
No comments:
Post a Comment