Search Results

Found 21 repositories(showing 21)

DRL-code-pytorch

Lizhi-sjtu

💛74

Concise pytorch implements of DRL algorithms, including REINFORCE, A2C, DQN, PPO(discrete and continuous), DDPG, TD3, SAC.

1.5k

207

MIT

Python

Updated 4 hours ago

ddpg-pytorchdqn-pytorchppo-gru+7

PPO-Continuous-Pytorch

XinJingHao

🧡60

A clean and robust Pytorch implementation of PPO on continuous action space.

173

MIT

Python

Updated 1 week ago

PPO

adi3e08

🧡65

A clean and minimal implementation of PPO (Proximal Policy Optimization) algorithm in Pytorch, for continuous action spaces.

Python

Updated 2 days ago

Deep-Reinforcement-Learning-Reimplementation

tony23545

❤️35

Pytorch Implement DRL algorithms (A2C, DDPG, PPO, TD3, SAC) for continuous action space control tasks.

Python

Updated 6 months ago

Robot-Sumo-RL

sebastianbrzustowicz

🧡55

Python + PyTorch. Advanced Reinforcement Learning (SAC/PPO/A2C) for ✨autonomous Robot Sumo combat featuring competitive self-play in continuous action spaces.

NOASSERTION

Python

Updated 2 weeks ago

a2cactor-criticartificial-intelligence+15

Pendulum_PPO

NiranjanBhujel

🧡60

Implementation of Proximal Policy Optimization (PPO) for continuous action space (`Pendulum-v1` from gym) using tensorflow2.x and pytorch.

MIT

Python

Updated 2 weeks ago

ppo_tutorial

AndersonPeng

❤️45

PPO pytorch tutorial for continuous control (BipedalWalker-v3)

Jupyter Notebook

Updated 1 month ago

machine-learningproximal-policy-optimizationpytorch+1

BipedalWalker

CSautier

❤️35

Continuous asynchronous PPO in Pytorch solving OpenAI's bipdedal walker

Python

Updated 10 months ago

DRLND_P2_Continuous_Control

ulamaca

❤️35

The Second Project of Udacity Deep Reinforcement Learning Nano Degree. PyTorch implementation of PPO to solve Reacher Environment (Unity) with Continuous Action Space.

Python

Updated 4 years ago

PPO

naivoder

❤️35

Pytorch implementation of Proximal Policy Optimization (PPO) for continuous action spaces

Python

Updated 12 months ago

continuous-action-spacecontinuous-controlgymnasium+6

PPO_continuous_pytorch_dev

AlfredMoore

❤️20

No description available

Python

Updated 7 months ago

rocket-lander-ppo

atilavahedian

🧡60

Continuous-control rocket landing environment and PPO agent in PyTorch.

MIT

Python

Updated 3 weeks ago

proximal-policy-optimization-algorithm

adhiiisetiawan

❤️30

PyTorch implementation of Proximal Policy Optimization (PPO) for discrete and continuous environments.

Python

Updated 5 months ago

PPO

jason19990305

❤️30

PyTorch PPO (discrete & continuous): clipped-surrogate actor, critic with TD-based advantage, minibatch updates & evaluation.

Python

Updated 6 months ago

ppo_implementation

davidabasabe

🧡55

PPO Implementation from scratch, using Pytorch, Gymnasium, Numpy, and the Lunar Lander Continuous environment for testing both FF and RNN Policies

Python

Updated 2 weeks ago

PyTorch implementation of chart-consistent mixture-of-experts PPO (CCMoE-PPO) for HalfCheetah-v5, including single-Gaussian PPO, MoE, and graph-Laplacian baselines, with training scripts, AUC-based evaluation, and paper-style figures for the associated CCMoE continuous-control study.

MIT

Python

Updated 4 months ago

ppo-continuous-control

MaanaRajesh

❤️45

Proximal Policy Optimization (PPO) in PyTorch for continuous control in MuJoCo (DM Control Walker). Includes GAE, clipped objective, value function learning, and performance visualization.

Python

Updated 1 month ago

agentic-ppo-model

ignius299792458

🧡55

Implemented and benchmarked PPO agent across pytorch, OpenAI Gym environments (CartPole, LunarLander, MountainCar) — studying policy gradient convergence, reward shaping, and hyperparameter sensitivity under continuous and discrete action spaces

Python

Updated 3 weeks ago

Continuous-Control-Workbench

Tahernezhad

❤️45

A clean PyTorch implementation of PPO, SAC, and TD3 made from scratch. It is built for testing and comparing continuous control RL algorithms on complex environments such as BipedalWalker-v3.

Python

Updated 2 months ago

actor-criticbipedalwalkercontinuous-control-tasks+9

Vision-Based-Autonomous-Driving-PPO

sagar-24bytes

🧡60

Vision-based autonomous driving using Proximal Policy Optimization (PPO) in the CarRacing-v2 Gymnasium environment. The agent learns continuous control actions (steering, gas, brake) from raw pixel inputs using a CNN-based Actor-Critic architecture implemented with Stable-Baselines3 and PyTorch.

MIT

Python

Updated 1 week ago

PPO_Pendulum_Continuous_Control

BoopathiKumar6485

❤️45

From-scratch implementation of Proximal Policy Optimization (PPO) for continuous control using the Pendulum-v1 environment. The project focuses on policy/value network design, numerical stability, hyperparameter sensitivity, and performance analysis. Implemented in PyTorch without high-level reinforcement learning frameworks.

Jupyter Notebook

Updated 2 months ago

All 21 repositories loaded

GitHub Explorer

Search Results

DRL-code-pytorch

PPO-Continuous-Pytorch

PPO

Deep-Reinforcement-Learning-Reimplementation

Robot-Sumo-RL

Pendulum_PPO

ppo_tutorial

BipedalWalker

DRLND_P2_Continuous_Control

PPO

PPO_continuous_pytorch_dev

rocket-lander-ppo

proximal-policy-optimization-algorithm

PPO

ppo_implementation

ccmoe-halfcheetah

ppo-continuous-control

agentic-ppo-model

Continuous-Control-Workbench

Vision-Based-Autonomous-Driving-PPO

PPO_Pendulum_Continuous_Control

DRL-code-pytorch

PPO-Continuous-Pytorch

PPO

Deep-Reinforcement-Learning-Reimplementation

Robot-Sumo-RL

Pendulum_PPO

ppo_tutorial

BipedalWalker

DRLND_P2_Continuous_Control

PPO

PPO_continuous_pytorch_dev

rocket-lander-ppo

proximal-policy-optimization-algorithm

PPO

ppo_implementation

ccmoe-halfcheetah

ppo-continuous-control

agentic-ppo-model

Continuous-Control-Workbench

Vision-Based-Autonomous-Driving-PPO

PPO_Pendulum_Continuous_Control