开启AI学习之旅:OpenAI Gym的27种任务
- CartPole-v0 & v1:平衡一个直立的杆子,防止其倒下。
- MountainCar-v0 & MountainCarContinuous-v0:让一辆车爬上陡峭的山坡。
- Pendulum-v1:使倒立摆保持上下倒立的状态。
- Acrobot-v1:通过控制连接两个连杆的关节,使得机器人的末端达到目标高度。
- LunarLander-v2 & LunarLanderContinuous-v2:在月球表面降落太空船,需要平稳且尽可能在目标点降落。
- BipedalWalker-v3 & BipedalWalkerHardcore-v3:控制一个两足行走的机器人过障碍。
- CarRacing-v0:控制一辆车在赛道上快速、准确地行驶。
- Blackjack-v1:在赌场游戏黑杰克中取得优势,尽可能赢得游戏。
- FrozenLake-v1 & FrozenLake8x8-v1:在冰冻的湖面上找到安全的路径从起点走到终点。
- CliffWalking-v0:找到从起点到终点的最优路径,同时避免掉入悬崖。
- Taxi-v3:控制出租车去接客并把客人送到目的地。
- Reacher-v2:控制一个二维臂将其末端移动到目标位置。
- Pusher-v2:控制一个二维臂推动一个物体到目标位置。
- Thrower-v2:控制一个二维臂抛出一个物体到目标位置。
- Striker-v2:控制一个二维臂击打一个物体使其移动到目标位置。
- InvertedPendulum-v2 & InvertedDoublePendulum-v2:控制车上的摆来保持平衡,防止倒下。
- HalfCheetah-v2 & v3:控制一个仿生机器人像猎豹一样快速前进。
- Hopper-v2 & v3:控制一个单足跳跃的机器人快速前进。
- Swimmer-v2 & v3:控制一个仿生游泳机器人在水下快速前进。
- Walker2d-v2 & v3:控制一个二维行走的机器人快速前进。
- Ant-v2 & v3:控制一个像蚂蚁一样的四足机器人快速前进。
- Humanoid-v2 & v3:控制一个人形机器人快速前进。
- HumanoidStandup-v2:让一个人形机器人从倒下的状态起立起来。
- FetchSlide-v1, FetchPickAndPlace-v1, FetchReach-v1, FetchPush-v1以及相应的Dense版本:控制一个机械臂完成特定任务,如滑动、抓取放置、触达和推动物体。
- HandReach-v0, HandManipulateBlockRotateZ-v0, HandManipulateBlockRotateParallel-v0等以及相应的TouchSensors和Dense版本:控制一个模拟的手完成特定的任务,例如抓取、旋转和操纵物体。
- CubeCrash-v0, CubeCrashSparse-v0, CubeCrashScreenBecomesBlack-v0:控制一个立方体避免碰撞,游戏的难度和视觉反馈有所不同。
- MemorizeDigits-v0:记住显示的数字序列。