Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SeaquestNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 14.00 +/- 12.81
       name: mean_reward
       verified: false
 ---
@@ -72,7 +72,7 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: SeaquestNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 536.00 +/- 121.59
       name: mean_reward
       verified: false
 ---
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 200000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 2166315367
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 4005514533
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 1000000.0
   - - optimize_memory_usage
     - false
   - - policy

   - - learning_starts
     - 100000
   - - n_timesteps
+    - 200000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SeaquestNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7adfc078a17878315b28c8edd76a1ecb6d0ab495a8d68142716540a5a80750df
-size 27318776

 version https://git-lfs.github.com/spec/v1
+oid sha256:dccda62d3e08ca34a8c9410fd2aa26e9def1951f0d29f1fdbbc77b885176c8df
+size 27318770

dqn-SeaquestNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SeaquestNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4dcacae8139d0cd3e746a819cfa1411792cf73bfddb4f50da273564d38497d03
 size 13555132

 version https://git-lfs.github.com/spec/v1
+oid sha256:7988961cfac034ea29402f041ce8c3c1a77096aa84098c8ff21245c7fd84c666
 size 13555132

dqn-SeaquestNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88adb68464c89ed7196c80d5d467c2e34dade3b99922027f685753c61cd1653a
 size 13554458

 version https://git-lfs.github.com/spec/v1
+oid sha256:5aac9731780e0ed04b816169f59fa62e732aaa232dc4d3ef0087a65727d09f73
 size 13554458

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83b938996da27c278bd257f3931d6ce292f86fdf307dce01bedbb3d0c9de71aa
-size 140703

 version https://git-lfs.github.com/spec/v1
+oid sha256:fde933f86192b397bce85aafd65d2a59b7f43c5a0b8d95961e771a7e6d71e02f
+size 161465

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": 14.0, "std_reward": 12.~~806248474865697~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-05-~~15T20~~:32:11.~~023771~~"}


1	+ {"mean_reward": 536.0, "std_reward": 121.58947322856531, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-05-15T21:58:00.643821"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cc0b431a971c808ed2a86f32965628298636083df1085b1c0bb6edce8e897134
-size 11293

 version https://git-lfs.github.com/spec/v1
+oid sha256:b7ad5a4fc9e4e923cf8a7c50fea477fda80f17ac7c14567c2124c49ab529741f
+size 8828