home rl

Github Twitter

View code on Github

#

ශක්තිමත්කිරීමේ ඉගෙනුම් ඇල්ගොරිතම

  • ප්රතිපත්ති ප්රශස්තිකරණය
  • මෙය Atari Breakout මත PPO නියෝජිතයෙකු ධාවනය කරන අත්හදා බැලීමකි .
  • සාමාන්යකරණය වාසි තක්සේරුව
  • ගැඹුරු Q ජාල
  • මෙය Atari Breakout මත DQN නියෝජිතයා ධාවනය කරන අත්හදා බැලීමකි .
  • ඩූලිංජාලය සහිතආකෘතිය
  • ප්රමුඛතා අත්දැකීම් නැවත ධාවනය කිරීමේ බෆරය

OpenAI ක්රීඩා දවටනය භාවිතා කිරීම සඳහා ක්රියාත්මක කිරීම මෙයයි multiprocessing .

Trending Research Papers labml.ai