{ "best_metric": 0.12391031808507537, "best_model_checkpoint": "results3_3_aug\\checkpoint-144000", "epoch": 2.1086613333333335, "eval_steps": 12000, "global_step": 144000, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0.0005333333333333334, "grad_norm": 20.909313201904297, "learning_rate": 1.8600000000000002e-06, "loss": 2.5894, "step": 100 }, { "epoch": 0.0010666666666666667, "grad_norm": 18.833477020263672, "learning_rate": 3.86e-06, "loss": 1.6722, "step": 200 }, { "epoch": 0.0016, "grad_norm": 27.412614822387695, "learning_rate": 5.86e-06, "loss": 1.3062, "step": 300 }, { "epoch": 0.0021333333333333334, "grad_norm": 23.11896324157715, "learning_rate": 7.860000000000001e-06, "loss": 0.9023, "step": 400 }, { "epoch": 0.0026666666666666666, "grad_norm": 30.71421241760254, "learning_rate": 9.86e-06, "loss": 0.9339, "step": 500 }, { "epoch": 0.0032, "grad_norm": 36.52252960205078, "learning_rate": 9.995026737967915e-06, "loss": 0.9454, "step": 600 }, { "epoch": 0.0037333333333333333, "grad_norm": 19.084806442260742, "learning_rate": 9.989679144385027e-06, "loss": 0.8988, "step": 700 }, { "epoch": 0.004266666666666667, "grad_norm": 19.131267547607422, "learning_rate": 9.984331550802139e-06, "loss": 0.9667, "step": 800 }, { "epoch": 0.0048, "grad_norm": 19.621259689331055, "learning_rate": 9.978983957219253e-06, "loss": 0.9442, "step": 900 }, { "epoch": 0.005333333333333333, "grad_norm": 11.794302940368652, "learning_rate": 9.973636363636364e-06, "loss": 0.9034, "step": 1000 }, { "epoch": 0.005866666666666667, "grad_norm": 19.786479949951172, "learning_rate": 9.968288770053476e-06, "loss": 0.8831, "step": 1100 }, { "epoch": 0.0064, "grad_norm": 24.166467666625977, "learning_rate": 9.962941176470588e-06, "loss": 0.8429, "step": 1200 }, { "epoch": 0.006933333333333333, "grad_norm": 12.046767234802246, "learning_rate": 9.957593582887702e-06, "loss": 0.8287, "step": 1300 }, { "epoch": 0.007466666666666667, "grad_norm": 36.68341827392578, "learning_rate": 9.952245989304813e-06, "loss": 0.88, "step": 1400 }, { "epoch": 0.008, "grad_norm": 15.059752464294434, "learning_rate": 9.946898395721925e-06, "loss": 0.8574, "step": 1500 }, { "epoch": 0.008533333333333334, "grad_norm": 19.416316986083984, "learning_rate": 9.941550802139039e-06, "loss": 0.8363, "step": 1600 }, { "epoch": 0.009066666666666667, "grad_norm": 14.828474998474121, "learning_rate": 9.93620320855615e-06, "loss": 0.8418, "step": 1700 }, { "epoch": 0.0096, "grad_norm": 13.504772186279297, "learning_rate": 9.930855614973262e-06, "loss": 0.8831, "step": 1800 }, { "epoch": 0.010133333333333333, "grad_norm": 12.300155639648438, "learning_rate": 9.925508021390376e-06, "loss": 0.8075, "step": 1900 }, { "epoch": 0.010666666666666666, "grad_norm": 21.094024658203125, "learning_rate": 9.920160427807488e-06, "loss": 0.8252, "step": 2000 }, { "epoch": 0.0112, "grad_norm": 13.642194747924805, "learning_rate": 9.9148128342246e-06, "loss": 0.8283, "step": 2100 }, { "epoch": 0.011733333333333333, "grad_norm": 22.896575927734375, "learning_rate": 9.909465240641713e-06, "loss": 0.7749, "step": 2200 }, { "epoch": 0.012266666666666667, "grad_norm": 16.33399772644043, "learning_rate": 9.904117647058825e-06, "loss": 0.7945, "step": 2300 }, { "epoch": 0.0128, "grad_norm": 17.154855728149414, "learning_rate": 9.898770053475936e-06, "loss": 0.8236, "step": 2400 }, { "epoch": 0.013333333333333334, "grad_norm": 18.06867218017578, "learning_rate": 9.893422459893048e-06, "loss": 0.8288, "step": 2500 }, { "epoch": 0.013866666666666666, "grad_norm": 17.08945083618164, "learning_rate": 9.888074866310162e-06, "loss": 0.8184, "step": 2600 }, { "epoch": 0.0144, "grad_norm": 19.866514205932617, "learning_rate": 9.882727272727274e-06, "loss": 0.8332, "step": 2700 }, { "epoch": 0.014933333333333333, "grad_norm": 12.449649810791016, "learning_rate": 9.877379679144385e-06, "loss": 0.7665, "step": 2800 }, { "epoch": 0.015466666666666667, "grad_norm": 23.460554122924805, "learning_rate": 9.872032085561499e-06, "loss": 0.7559, "step": 2900 }, { "epoch": 0.016, "grad_norm": 20.189571380615234, "learning_rate": 9.86668449197861e-06, "loss": 0.7602, "step": 3000 }, { "epoch": 0.016533333333333334, "grad_norm": 24.740507125854492, "learning_rate": 9.861336898395723e-06, "loss": 0.8176, "step": 3100 }, { "epoch": 0.017066666666666667, "grad_norm": 13.635833740234375, "learning_rate": 9.855989304812836e-06, "loss": 0.797, "step": 3200 }, { "epoch": 0.0176, "grad_norm": 12.762578964233398, "learning_rate": 9.850641711229946e-06, "loss": 0.7869, "step": 3300 }, { "epoch": 0.018133333333333335, "grad_norm": 18.076692581176758, "learning_rate": 9.84529411764706e-06, "loss": 0.7898, "step": 3400 }, { "epoch": 0.018666666666666668, "grad_norm": 18.79241371154785, "learning_rate": 9.839946524064171e-06, "loss": 0.7775, "step": 3500 }, { "epoch": 0.0192, "grad_norm": 41.773109436035156, "learning_rate": 9.834598930481283e-06, "loss": 0.7108, "step": 3600 }, { "epoch": 0.019733333333333332, "grad_norm": 8.07943344116211, "learning_rate": 9.829251336898397e-06, "loss": 0.7746, "step": 3700 }, { "epoch": 0.020266666666666665, "grad_norm": 12.956999778747559, "learning_rate": 9.823903743315509e-06, "loss": 0.7729, "step": 3800 }, { "epoch": 0.0208, "grad_norm": 14.171869277954102, "learning_rate": 9.81855614973262e-06, "loss": 0.7841, "step": 3900 }, { "epoch": 0.021333333333333333, "grad_norm": 13.105381965637207, "learning_rate": 9.813208556149734e-06, "loss": 0.7386, "step": 4000 }, { "epoch": 0.021866666666666666, "grad_norm": 27.054149627685547, "learning_rate": 9.807860962566846e-06, "loss": 0.774, "step": 4100 }, { "epoch": 0.0224, "grad_norm": 33.765167236328125, "learning_rate": 9.802513368983957e-06, "loss": 0.7913, "step": 4200 }, { "epoch": 0.022933333333333333, "grad_norm": 15.996896743774414, "learning_rate": 9.797165775401071e-06, "loss": 0.7573, "step": 4300 }, { "epoch": 0.023466666666666667, "grad_norm": 19.66457748413086, "learning_rate": 9.791818181818183e-06, "loss": 0.737, "step": 4400 }, { "epoch": 0.024, "grad_norm": 17.600889205932617, "learning_rate": 9.786470588235295e-06, "loss": 0.7292, "step": 4500 }, { "epoch": 0.024533333333333334, "grad_norm": 18.8813419342041, "learning_rate": 9.781122994652406e-06, "loss": 0.7756, "step": 4600 }, { "epoch": 0.025066666666666668, "grad_norm": 15.333890914916992, "learning_rate": 9.77577540106952e-06, "loss": 0.7227, "step": 4700 }, { "epoch": 0.0256, "grad_norm": 18.026052474975586, "learning_rate": 9.770427807486632e-06, "loss": 0.7059, "step": 4800 }, { "epoch": 0.026133333333333335, "grad_norm": 20.47505760192871, "learning_rate": 9.765080213903744e-06, "loss": 0.7317, "step": 4900 }, { "epoch": 0.02666666666666667, "grad_norm": 18.107833862304688, "learning_rate": 9.759732620320857e-06, "loss": 0.7262, "step": 5000 }, { "epoch": 0.0272, "grad_norm": 20.581003189086914, "learning_rate": 9.754385026737969e-06, "loss": 0.7662, "step": 5100 }, { "epoch": 0.027733333333333332, "grad_norm": 13.934900283813477, "learning_rate": 9.74903743315508e-06, "loss": 0.7362, "step": 5200 }, { "epoch": 0.028266666666666666, "grad_norm": 12.188075065612793, "learning_rate": 9.743689839572194e-06, "loss": 0.7329, "step": 5300 }, { "epoch": 0.0288, "grad_norm": 12.688673973083496, "learning_rate": 9.738342245989306e-06, "loss": 0.665, "step": 5400 }, { "epoch": 0.029333333333333333, "grad_norm": 25.470083236694336, "learning_rate": 9.732994652406418e-06, "loss": 0.6962, "step": 5500 }, { "epoch": 0.029866666666666666, "grad_norm": 15.63334846496582, "learning_rate": 9.727647058823531e-06, "loss": 0.6614, "step": 5600 }, { "epoch": 0.0304, "grad_norm": 22.595970153808594, "learning_rate": 9.722299465240641e-06, "loss": 0.7401, "step": 5700 }, { "epoch": 0.030933333333333334, "grad_norm": 17.291120529174805, "learning_rate": 9.716951871657755e-06, "loss": 0.6924, "step": 5800 }, { "epoch": 0.031466666666666664, "grad_norm": 9.094500541687012, "learning_rate": 9.711604278074868e-06, "loss": 0.6876, "step": 5900 }, { "epoch": 0.032, "grad_norm": 19.379308700561523, "learning_rate": 9.706256684491978e-06, "loss": 0.7899, "step": 6000 }, { "epoch": 0.03253333333333333, "grad_norm": 13.661979675292969, "learning_rate": 9.700909090909092e-06, "loss": 0.7158, "step": 6100 }, { "epoch": 0.03306666666666667, "grad_norm": 11.968832015991211, "learning_rate": 9.695561497326204e-06, "loss": 0.6447, "step": 6200 }, { "epoch": 0.0336, "grad_norm": 14.156913757324219, "learning_rate": 9.690213903743316e-06, "loss": 0.7007, "step": 6300 }, { "epoch": 0.034133333333333335, "grad_norm": 10.123744010925293, "learning_rate": 9.684866310160429e-06, "loss": 0.6772, "step": 6400 }, { "epoch": 0.034666666666666665, "grad_norm": 20.01508903503418, "learning_rate": 9.679518716577541e-06, "loss": 0.6937, "step": 6500 }, { "epoch": 0.0352, "grad_norm": 10.189972877502441, "learning_rate": 9.674171122994653e-06, "loss": 0.6807, "step": 6600 }, { "epoch": 0.03573333333333333, "grad_norm": 18.569059371948242, "learning_rate": 9.668823529411766e-06, "loss": 0.743, "step": 6700 }, { "epoch": 0.03626666666666667, "grad_norm": 11.37586784362793, "learning_rate": 9.663475935828878e-06, "loss": 0.7633, "step": 6800 }, { "epoch": 0.0368, "grad_norm": 22.754648208618164, "learning_rate": 9.65812834224599e-06, "loss": 0.7128, "step": 6900 }, { "epoch": 0.037333333333333336, "grad_norm": 16.840478897094727, "learning_rate": 9.652780748663102e-06, "loss": 0.6679, "step": 7000 }, { "epoch": 0.037866666666666667, "grad_norm": 13.180849075317383, "learning_rate": 9.647433155080215e-06, "loss": 0.6966, "step": 7100 }, { "epoch": 0.0384, "grad_norm": 15.731171607971191, "learning_rate": 9.642085561497327e-06, "loss": 0.6573, "step": 7200 }, { "epoch": 0.038933333333333334, "grad_norm": 11.76677131652832, "learning_rate": 9.636737967914439e-06, "loss": 0.6556, "step": 7300 }, { "epoch": 0.039466666666666664, "grad_norm": 9.791987419128418, "learning_rate": 9.631390374331552e-06, "loss": 0.6368, "step": 7400 }, { "epoch": 0.04, "grad_norm": 17.124353408813477, "learning_rate": 9.626042780748664e-06, "loss": 0.6684, "step": 7500 }, { "epoch": 0.04053333333333333, "grad_norm": 12.826231956481934, "learning_rate": 9.620695187165776e-06, "loss": 0.6631, "step": 7600 }, { "epoch": 0.04106666666666667, "grad_norm": 10.297476768493652, "learning_rate": 9.61534759358289e-06, "loss": 0.6544, "step": 7700 }, { "epoch": 0.0416, "grad_norm": 16.811626434326172, "learning_rate": 9.610000000000001e-06, "loss": 0.6343, "step": 7800 }, { "epoch": 0.042133333333333335, "grad_norm": 13.623756408691406, "learning_rate": 9.604652406417113e-06, "loss": 0.6443, "step": 7900 }, { "epoch": 0.042666666666666665, "grad_norm": 22.790386199951172, "learning_rate": 9.599304812834226e-06, "loss": 0.711, "step": 8000 }, { "epoch": 0.0432, "grad_norm": 13.907777786254883, "learning_rate": 9.593957219251338e-06, "loss": 0.6848, "step": 8100 }, { "epoch": 0.04373333333333333, "grad_norm": 11.813100814819336, "learning_rate": 9.58860962566845e-06, "loss": 0.6563, "step": 8200 }, { "epoch": 0.04426666666666667, "grad_norm": 15.979551315307617, "learning_rate": 9.583262032085562e-06, "loss": 0.6573, "step": 8300 }, { "epoch": 0.0448, "grad_norm": 18.21453094482422, "learning_rate": 9.577914438502675e-06, "loss": 0.6506, "step": 8400 }, { "epoch": 0.04533333333333334, "grad_norm": 10.605395317077637, "learning_rate": 9.572566844919787e-06, "loss": 0.6902, "step": 8500 }, { "epoch": 0.04586666666666667, "grad_norm": 14.384843826293945, "learning_rate": 9.567219251336899e-06, "loss": 0.6713, "step": 8600 }, { "epoch": 0.0464, "grad_norm": 17.110769271850586, "learning_rate": 9.56187165775401e-06, "loss": 0.632, "step": 8700 }, { "epoch": 0.046933333333333334, "grad_norm": 25.55857276916504, "learning_rate": 9.556524064171124e-06, "loss": 0.6908, "step": 8800 }, { "epoch": 0.047466666666666664, "grad_norm": 12.988242149353027, "learning_rate": 9.551176470588236e-06, "loss": 0.6355, "step": 8900 }, { "epoch": 0.048, "grad_norm": 14.928725242614746, "learning_rate": 9.545828877005348e-06, "loss": 0.7064, "step": 9000 }, { "epoch": 0.04853333333333333, "grad_norm": 12.199774742126465, "learning_rate": 9.54048128342246e-06, "loss": 0.6474, "step": 9100 }, { "epoch": 0.04906666666666667, "grad_norm": 10.237113952636719, "learning_rate": 9.535133689839573e-06, "loss": 0.7199, "step": 9200 }, { "epoch": 0.0496, "grad_norm": 19.523265838623047, "learning_rate": 9.529786096256685e-06, "loss": 0.6632, "step": 9300 }, { "epoch": 0.050133333333333335, "grad_norm": 13.61367130279541, "learning_rate": 9.524438502673797e-06, "loss": 0.6787, "step": 9400 }, { "epoch": 0.050666666666666665, "grad_norm": 17.536989212036133, "learning_rate": 9.51909090909091e-06, "loss": 0.6212, "step": 9500 }, { "epoch": 0.0512, "grad_norm": 18.138784408569336, "learning_rate": 9.513743315508022e-06, "loss": 0.6679, "step": 9600 }, { "epoch": 0.05173333333333333, "grad_norm": 22.869043350219727, "learning_rate": 9.508395721925134e-06, "loss": 0.6238, "step": 9700 }, { "epoch": 0.05226666666666667, "grad_norm": 24.540325164794922, "learning_rate": 9.503048128342247e-06, "loss": 0.7091, "step": 9800 }, { "epoch": 0.0528, "grad_norm": 15.114578247070312, "learning_rate": 9.49770053475936e-06, "loss": 0.6502, "step": 9900 }, { "epoch": 0.05333333333333334, "grad_norm": 18.020856857299805, "learning_rate": 9.492352941176471e-06, "loss": 0.6082, "step": 10000 }, { "epoch": 0.05386666666666667, "grad_norm": 17.735315322875977, "learning_rate": 9.487005347593585e-06, "loss": 0.6586, "step": 10100 }, { "epoch": 0.0544, "grad_norm": 14.836255073547363, "learning_rate": 9.481657754010696e-06, "loss": 0.7467, "step": 10200 }, { "epoch": 0.054933333333333334, "grad_norm": 3.1689369678497314, "learning_rate": 9.476363636363637e-06, "loss": 0.64, "step": 10300 }, { "epoch": 0.055466666666666664, "grad_norm": 8.675093650817871, "learning_rate": 9.47101604278075e-06, "loss": 0.6161, "step": 10400 }, { "epoch": 0.056, "grad_norm": 14.851204872131348, "learning_rate": 9.465668449197861e-06, "loss": 0.7006, "step": 10500 }, { "epoch": 0.05653333333333333, "grad_norm": 13.375722885131836, "learning_rate": 9.460320855614975e-06, "loss": 0.6184, "step": 10600 }, { "epoch": 0.05706666666666667, "grad_norm": 15.373180389404297, "learning_rate": 9.454973262032086e-06, "loss": 0.6144, "step": 10700 }, { "epoch": 0.0576, "grad_norm": 16.655046463012695, "learning_rate": 9.449625668449198e-06, "loss": 0.617, "step": 10800 }, { "epoch": 0.058133333333333335, "grad_norm": 8.983287811279297, "learning_rate": 9.444278074866312e-06, "loss": 0.6621, "step": 10900 }, { "epoch": 0.058666666666666666, "grad_norm": 23.232200622558594, "learning_rate": 9.438930481283423e-06, "loss": 0.6223, "step": 11000 }, { "epoch": 0.0592, "grad_norm": 13.591826438903809, "learning_rate": 9.433582887700535e-06, "loss": 0.658, "step": 11100 }, { "epoch": 0.05973333333333333, "grad_norm": 10.02418041229248, "learning_rate": 9.428235294117649e-06, "loss": 0.6776, "step": 11200 }, { "epoch": 0.06026666666666667, "grad_norm": 18.175771713256836, "learning_rate": 9.422887700534759e-06, "loss": 0.6483, "step": 11300 }, { "epoch": 0.0608, "grad_norm": 18.215675354003906, "learning_rate": 9.417540106951872e-06, "loss": 0.6139, "step": 11400 }, { "epoch": 0.06133333333333333, "grad_norm": 16.22684669494629, "learning_rate": 9.412192513368986e-06, "loss": 0.6343, "step": 11500 }, { "epoch": 0.06186666666666667, "grad_norm": 25.01458740234375, "learning_rate": 9.406844919786096e-06, "loss": 0.6441, "step": 11600 }, { "epoch": 0.0624, "grad_norm": 13.164143562316895, "learning_rate": 9.40149732620321e-06, "loss": 0.6234, "step": 11700 }, { "epoch": 0.06293333333333333, "grad_norm": 19.57975959777832, "learning_rate": 9.396149732620321e-06, "loss": 0.5923, "step": 11800 }, { "epoch": 0.06346666666666667, "grad_norm": 19.135597229003906, "learning_rate": 9.390802139037433e-06, "loss": 0.6308, "step": 11900 }, { "epoch": 0.064, "grad_norm": 13.570038795471191, "learning_rate": 9.385454545454547e-06, "loss": 0.5655, "step": 12000 }, { "epoch": 0.064, "eval_test1_cer": 0.07081839569796101, "eval_test1_cer_norm": 0.04963622829975749, "eval_test1_loss": 0.22951769828796387, "eval_test1_runtime": 1750.6188, "eval_test1_samples_per_second": 1.428, "eval_test1_steps_per_second": 0.357, "eval_test1_wer": 0.20000583107379225, "eval_test1_wer_norm": 0.13279172389608113, "step": 12000 }, { "epoch": 0.064, "eval_test2_cer": 0.1842311569044686, "eval_test2_cer_norm": 0.1433897582894329, "eval_test2_loss": 0.37590545415878296, "eval_test2_runtime": 1856.4817, "eval_test2_samples_per_second": 1.347, "eval_test2_steps_per_second": 0.337, "eval_test2_wer": 0.35694666971847105, "eval_test2_wer_norm": 0.2850103140041256, "step": 12000 }, { "epoch": 0.06453333333333333, "grad_norm": 15.533170700073242, "learning_rate": 9.380106951871658e-06, "loss": 0.644, "step": 12100 }, { "epoch": 0.06506666666666666, "grad_norm": 28.71904754638672, "learning_rate": 9.37475935828877e-06, "loss": 0.6589, "step": 12200 }, { "epoch": 0.0656, "grad_norm": 17.29625129699707, "learning_rate": 9.369465240641711e-06, "loss": 0.6199, "step": 12300 }, { "epoch": 0.06613333333333334, "grad_norm": 11.095048904418945, "learning_rate": 9.364117647058825e-06, "loss": 0.6369, "step": 12400 }, { "epoch": 0.06666666666666667, "grad_norm": 13.593456268310547, "learning_rate": 9.358770053475937e-06, "loss": 0.5787, "step": 12500 }, { "epoch": 0.0672, "grad_norm": 13.990767478942871, "learning_rate": 9.353422459893048e-06, "loss": 0.6362, "step": 12600 }, { "epoch": 0.06773333333333334, "grad_norm": 15.640002250671387, "learning_rate": 9.348074866310162e-06, "loss": 0.6552, "step": 12700 }, { "epoch": 0.06826666666666667, "grad_norm": 10.44587516784668, "learning_rate": 9.342727272727274e-06, "loss": 0.6324, "step": 12800 }, { "epoch": 0.0688, "grad_norm": 18.517908096313477, "learning_rate": 9.337379679144385e-06, "loss": 0.6385, "step": 12900 }, { "epoch": 0.06933333333333333, "grad_norm": 11.567337036132812, "learning_rate": 9.332032085561497e-06, "loss": 0.6405, "step": 13000 }, { "epoch": 0.06986666666666666, "grad_norm": 13.229918479919434, "learning_rate": 9.32668449197861e-06, "loss": 0.6289, "step": 13100 }, { "epoch": 0.0704, "grad_norm": 12.379899978637695, "learning_rate": 9.321336898395723e-06, "loss": 0.6397, "step": 13200 }, { "epoch": 0.07093333333333333, "grad_norm": 14.909361839294434, "learning_rate": 9.315989304812834e-06, "loss": 0.6025, "step": 13300 }, { "epoch": 0.07146666666666666, "grad_norm": 5.700790882110596, "learning_rate": 9.310641711229948e-06, "loss": 0.6396, "step": 13400 }, { "epoch": 0.072, "grad_norm": 19.968151092529297, "learning_rate": 9.30529411764706e-06, "loss": 0.6109, "step": 13500 }, { "epoch": 0.07253333333333334, "grad_norm": 46.141014099121094, "learning_rate": 9.299946524064172e-06, "loss": 0.6202, "step": 13600 }, { "epoch": 0.07306666666666667, "grad_norm": 19.477182388305664, "learning_rate": 9.294598930481285e-06, "loss": 0.648, "step": 13700 }, { "epoch": 0.0736, "grad_norm": 10.043542861938477, "learning_rate": 9.289251336898397e-06, "loss": 0.5776, "step": 13800 }, { "epoch": 0.07413333333333333, "grad_norm": 18.73679542541504, "learning_rate": 9.283903743315509e-06, "loss": 0.5919, "step": 13900 }, { "epoch": 0.07466666666666667, "grad_norm": 9.48547649383545, "learning_rate": 9.278556149732622e-06, "loss": 0.6809, "step": 14000 }, { "epoch": 0.0752, "grad_norm": 13.849043846130371, "learning_rate": 9.273208556149734e-06, "loss": 0.6277, "step": 14100 }, { "epoch": 0.07573333333333333, "grad_norm": 16.55092430114746, "learning_rate": 9.267860962566846e-06, "loss": 0.6284, "step": 14200 }, { "epoch": 0.07626666666666666, "grad_norm": 12.911582946777344, "learning_rate": 9.262513368983958e-06, "loss": 0.6004, "step": 14300 }, { "epoch": 0.0768, "grad_norm": 17.991535186767578, "learning_rate": 9.25716577540107e-06, "loss": 0.6649, "step": 14400 }, { "epoch": 0.07733333333333334, "grad_norm": 9.104124069213867, "learning_rate": 9.251818181818183e-06, "loss": 0.6542, "step": 14500 }, { "epoch": 0.07786666666666667, "grad_norm": 12.342418670654297, "learning_rate": 9.246470588235295e-06, "loss": 0.6371, "step": 14600 }, { "epoch": 0.0784, "grad_norm": 11.461055755615234, "learning_rate": 9.241122994652406e-06, "loss": 0.6104, "step": 14700 }, { "epoch": 0.07893333333333333, "grad_norm": 12.767594337463379, "learning_rate": 9.23577540106952e-06, "loss": 0.6125, "step": 14800 }, { "epoch": 0.07946666666666667, "grad_norm": 17.43072509765625, "learning_rate": 9.230427807486632e-06, "loss": 0.6288, "step": 14900 }, { "epoch": 0.08, "grad_norm": 13.317976951599121, "learning_rate": 9.225080213903744e-06, "loss": 0.5889, "step": 15000 }, { "epoch": 0.08053333333333333, "grad_norm": 14.456542015075684, "learning_rate": 9.219786096256685e-06, "loss": 0.5828, "step": 15100 }, { "epoch": 0.08106666666666666, "grad_norm": 11.979194641113281, "learning_rate": 9.214438502673796e-06, "loss": 0.6114, "step": 15200 }, { "epoch": 0.0816, "grad_norm": 16.597810745239258, "learning_rate": 9.20909090909091e-06, "loss": 0.597, "step": 15300 }, { "epoch": 0.08213333333333334, "grad_norm": 13.478951454162598, "learning_rate": 9.203743315508022e-06, "loss": 0.6031, "step": 15400 }, { "epoch": 0.08266666666666667, "grad_norm": 10.99223804473877, "learning_rate": 9.198395721925134e-06, "loss": 0.597, "step": 15500 }, { "epoch": 0.0832, "grad_norm": 17.912006378173828, "learning_rate": 9.193048128342247e-06, "loss": 0.5636, "step": 15600 }, { "epoch": 0.08373333333333334, "grad_norm": 18.451698303222656, "learning_rate": 9.187700534759359e-06, "loss": 0.6106, "step": 15700 }, { "epoch": 0.08426666666666667, "grad_norm": 18.612892150878906, "learning_rate": 9.18235294117647e-06, "loss": 0.6052, "step": 15800 }, { "epoch": 0.0848, "grad_norm": 8.992218971252441, "learning_rate": 9.177005347593584e-06, "loss": 0.6154, "step": 15900 }, { "epoch": 0.08533333333333333, "grad_norm": 14.347183227539062, "learning_rate": 9.171657754010696e-06, "loss": 0.5863, "step": 16000 }, { "epoch": 0.08586666666666666, "grad_norm": 18.64897918701172, "learning_rate": 9.166310160427808e-06, "loss": 0.5871, "step": 16100 }, { "epoch": 0.0864, "grad_norm": 14.13971996307373, "learning_rate": 9.160962566844921e-06, "loss": 0.5602, "step": 16200 }, { "epoch": 0.08693333333333333, "grad_norm": 14.770001411437988, "learning_rate": 9.155614973262033e-06, "loss": 0.5872, "step": 16300 }, { "epoch": 0.08746666666666666, "grad_norm": 16.351795196533203, "learning_rate": 9.150267379679145e-06, "loss": 0.5981, "step": 16400 }, { "epoch": 0.088, "grad_norm": 11.358668327331543, "learning_rate": 9.144919786096258e-06, "loss": 0.6464, "step": 16500 }, { "epoch": 0.08853333333333334, "grad_norm": 13.102170944213867, "learning_rate": 9.13957219251337e-06, "loss": 0.565, "step": 16600 }, { "epoch": 0.08906666666666667, "grad_norm": 14.601571083068848, "learning_rate": 9.134224598930482e-06, "loss": 0.591, "step": 16700 }, { "epoch": 0.0896, "grad_norm": 15.014618873596191, "learning_rate": 9.128877005347594e-06, "loss": 0.5555, "step": 16800 }, { "epoch": 0.09013333333333333, "grad_norm": 16.045061111450195, "learning_rate": 9.123529411764707e-06, "loss": 0.6343, "step": 16900 }, { "epoch": 0.09066666666666667, "grad_norm": 16.32196807861328, "learning_rate": 9.118181818181819e-06, "loss": 0.5877, "step": 17000 }, { "epoch": 0.0912, "grad_norm": 12.774066925048828, "learning_rate": 9.112834224598931e-06, "loss": 0.5812, "step": 17100 }, { "epoch": 0.09173333333333333, "grad_norm": 26.12006950378418, "learning_rate": 9.107486631016044e-06, "loss": 0.6492, "step": 17200 }, { "epoch": 0.09226666666666666, "grad_norm": 29.404294967651367, "learning_rate": 9.102139037433155e-06, "loss": 0.6121, "step": 17300 }, { "epoch": 0.0928, "grad_norm": 12.358072280883789, "learning_rate": 9.096791443850268e-06, "loss": 0.5611, "step": 17400 }, { "epoch": 0.09333333333333334, "grad_norm": 10.559739112854004, "learning_rate": 9.091443850267382e-06, "loss": 0.5849, "step": 17500 }, { "epoch": 0.09386666666666667, "grad_norm": 11.778017044067383, "learning_rate": 9.086096256684492e-06, "loss": 0.641, "step": 17600 }, { "epoch": 0.0944, "grad_norm": 14.79358196258545, "learning_rate": 9.080802139037433e-06, "loss": 0.5776, "step": 17700 }, { "epoch": 0.09493333333333333, "grad_norm": 13.538490295410156, "learning_rate": 9.075454545454546e-06, "loss": 0.6097, "step": 17800 }, { "epoch": 0.09546666666666667, "grad_norm": 17.121206283569336, "learning_rate": 9.07010695187166e-06, "loss": 0.6488, "step": 17900 }, { "epoch": 0.096, "grad_norm": 23.828664779663086, "learning_rate": 9.06475935828877e-06, "loss": 0.5955, "step": 18000 }, { "epoch": 0.09653333333333333, "grad_norm": 19.401390075683594, "learning_rate": 9.059411764705883e-06, "loss": 0.5919, "step": 18100 }, { "epoch": 0.09706666666666666, "grad_norm": 10.457847595214844, "learning_rate": 9.054064171122995e-06, "loss": 0.614, "step": 18200 }, { "epoch": 0.0976, "grad_norm": 17.540199279785156, "learning_rate": 9.048716577540107e-06, "loss": 0.5777, "step": 18300 }, { "epoch": 0.09813333333333334, "grad_norm": 14.692615509033203, "learning_rate": 9.04336898395722e-06, "loss": 0.6289, "step": 18400 }, { "epoch": 0.09866666666666667, "grad_norm": 11.115076065063477, "learning_rate": 9.038021390374332e-06, "loss": 0.5544, "step": 18500 }, { "epoch": 0.0992, "grad_norm": 12.48447322845459, "learning_rate": 9.032673796791444e-06, "loss": 0.6307, "step": 18600 }, { "epoch": 0.09973333333333333, "grad_norm": 14.416707038879395, "learning_rate": 9.027326203208558e-06, "loss": 0.567, "step": 18700 }, { "epoch": 0.10026666666666667, "grad_norm": 15.415923118591309, "learning_rate": 9.02197860962567e-06, "loss": 0.531, "step": 18800 }, { "epoch": 0.1008, "grad_norm": 17.087148666381836, "learning_rate": 9.016631016042781e-06, "loss": 0.5842, "step": 18900 }, { "epoch": 0.10133333333333333, "grad_norm": 11.97078800201416, "learning_rate": 9.011283422459893e-06, "loss": 0.5768, "step": 19000 }, { "epoch": 0.10186666666666666, "grad_norm": 9.799630165100098, "learning_rate": 9.005935828877006e-06, "loss": 0.5684, "step": 19100 }, { "epoch": 0.1024, "grad_norm": 15.150003433227539, "learning_rate": 9.000588235294118e-06, "loss": 0.5593, "step": 19200 }, { "epoch": 0.10293333333333334, "grad_norm": 17.181509017944336, "learning_rate": 8.99524064171123e-06, "loss": 0.6105, "step": 19300 }, { "epoch": 0.10346666666666667, "grad_norm": 12.629448890686035, "learning_rate": 8.989893048128344e-06, "loss": 0.5441, "step": 19400 }, { "epoch": 0.104, "grad_norm": 11.403772354125977, "learning_rate": 8.984545454545455e-06, "loss": 0.5955, "step": 19500 }, { "epoch": 0.10453333333333334, "grad_norm": 6.143219947814941, "learning_rate": 8.979197860962567e-06, "loss": 0.5674, "step": 19600 }, { "epoch": 0.10506666666666667, "grad_norm": 12.959674835205078, "learning_rate": 8.97385026737968e-06, "loss": 0.6168, "step": 19700 }, { "epoch": 0.1056, "grad_norm": 10.56905746459961, "learning_rate": 8.968502673796792e-06, "loss": 0.596, "step": 19800 }, { "epoch": 0.10613333333333333, "grad_norm": 18.031017303466797, "learning_rate": 8.963155080213904e-06, "loss": 0.5554, "step": 19900 }, { "epoch": 0.10666666666666667, "grad_norm": 15.258442878723145, "learning_rate": 8.957807486631018e-06, "loss": 0.5969, "step": 20000 }, { "epoch": 0.1072, "grad_norm": 12.341730117797852, "learning_rate": 8.95245989304813e-06, "loss": 0.5481, "step": 20100 }, { "epoch": 0.10773333333333333, "grad_norm": 15.251503944396973, "learning_rate": 8.947112299465241e-06, "loss": 0.5678, "step": 20200 }, { "epoch": 0.10826666666666666, "grad_norm": 12.949088096618652, "learning_rate": 8.941764705882353e-06, "loss": 0.6123, "step": 20300 }, { "epoch": 0.1088, "grad_norm": 18.673795700073242, "learning_rate": 8.936417112299465e-06, "loss": 0.5209, "step": 20400 }, { "epoch": 0.10933333333333334, "grad_norm": 29.50274085998535, "learning_rate": 8.931069518716579e-06, "loss": 0.5745, "step": 20500 }, { "epoch": 0.10986666666666667, "grad_norm": 12.730548858642578, "learning_rate": 8.92572192513369e-06, "loss": 0.5317, "step": 20600 }, { "epoch": 0.1104, "grad_norm": 8.79454517364502, "learning_rate": 8.920374331550802e-06, "loss": 0.5622, "step": 20700 }, { "epoch": 0.11093333333333333, "grad_norm": 11.844402313232422, "learning_rate": 8.915026737967916e-06, "loss": 0.5507, "step": 20800 }, { "epoch": 0.11146666666666667, "grad_norm": 15.78973388671875, "learning_rate": 8.909679144385027e-06, "loss": 0.5466, "step": 20900 }, { "epoch": 0.112, "grad_norm": 12.811589241027832, "learning_rate": 8.90433155080214e-06, "loss": 0.5493, "step": 21000 }, { "epoch": 0.11253333333333333, "grad_norm": 10.229161262512207, "learning_rate": 8.898983957219251e-06, "loss": 0.5742, "step": 21100 }, { "epoch": 0.11306666666666666, "grad_norm": 15.424541473388672, "learning_rate": 8.893636363636365e-06, "loss": 0.5935, "step": 21200 }, { "epoch": 0.1136, "grad_norm": 7.911862373352051, "learning_rate": 8.888288770053476e-06, "loss": 0.5342, "step": 21300 }, { "epoch": 0.11413333333333334, "grad_norm": 14.5869779586792, "learning_rate": 8.882941176470588e-06, "loss": 0.5334, "step": 21400 }, { "epoch": 0.11466666666666667, "grad_norm": 23.397838592529297, "learning_rate": 8.877593582887702e-06, "loss": 0.5813, "step": 21500 }, { "epoch": 0.1152, "grad_norm": 11.292886734008789, "learning_rate": 8.872245989304813e-06, "loss": 0.5279, "step": 21600 }, { "epoch": 0.11573333333333333, "grad_norm": 12.716238975524902, "learning_rate": 8.866951871657755e-06, "loss": 0.5459, "step": 21700 }, { "epoch": 0.11626666666666667, "grad_norm": 9.298455238342285, "learning_rate": 8.861604278074866e-06, "loss": 0.5209, "step": 21800 }, { "epoch": 0.1168, "grad_norm": 26.798046112060547, "learning_rate": 8.85625668449198e-06, "loss": 0.5799, "step": 21900 }, { "epoch": 0.11733333333333333, "grad_norm": 11.609378814697266, "learning_rate": 8.850909090909092e-06, "loss": 0.5171, "step": 22000 }, { "epoch": 0.11786666666666666, "grad_norm": 12.713021278381348, "learning_rate": 8.845561497326203e-06, "loss": 0.5698, "step": 22100 }, { "epoch": 0.1184, "grad_norm": 13.702390670776367, "learning_rate": 8.840213903743317e-06, "loss": 0.5633, "step": 22200 }, { "epoch": 0.11893333333333334, "grad_norm": 14.028585433959961, "learning_rate": 8.834919786096258e-06, "loss": 0.5872, "step": 22300 }, { "epoch": 0.11946666666666667, "grad_norm": 13.933432579040527, "learning_rate": 8.82957219251337e-06, "loss": 0.5535, "step": 22400 }, { "epoch": 0.12, "grad_norm": 11.228196144104004, "learning_rate": 8.824224598930482e-06, "loss": 0.6001, "step": 22500 }, { "epoch": 0.12053333333333334, "grad_norm": 10.748672485351562, "learning_rate": 8.818877005347595e-06, "loss": 0.5234, "step": 22600 }, { "epoch": 0.12106666666666667, "grad_norm": 12.32231330871582, "learning_rate": 8.813529411764707e-06, "loss": 0.5679, "step": 22700 }, { "epoch": 0.1216, "grad_norm": 7.364382266998291, "learning_rate": 8.808181818181819e-06, "loss": 0.5559, "step": 22800 }, { "epoch": 0.12213333333333333, "grad_norm": 10.767403602600098, "learning_rate": 8.80283422459893e-06, "loss": 0.5975, "step": 22900 }, { "epoch": 0.12266666666666666, "grad_norm": 9.686403274536133, "learning_rate": 8.797486631016044e-06, "loss": 0.5673, "step": 23000 }, { "epoch": 0.1232, "grad_norm": 8.938547134399414, "learning_rate": 8.792139037433156e-06, "loss": 0.5691, "step": 23100 }, { "epoch": 0.12373333333333333, "grad_norm": 8.393336296081543, "learning_rate": 8.786791443850268e-06, "loss": 0.5856, "step": 23200 }, { "epoch": 0.12426666666666666, "grad_norm": 13.846830368041992, "learning_rate": 8.781443850267381e-06, "loss": 0.5691, "step": 23300 }, { "epoch": 0.1248, "grad_norm": 13.33504867553711, "learning_rate": 8.776096256684493e-06, "loss": 0.5295, "step": 23400 }, { "epoch": 0.12533333333333332, "grad_norm": 8.576156616210938, "learning_rate": 8.770748663101605e-06, "loss": 0.5389, "step": 23500 }, { "epoch": 0.12586666666666665, "grad_norm": 6.582005023956299, "learning_rate": 8.765401069518718e-06, "loss": 0.5314, "step": 23600 }, { "epoch": 0.1264, "grad_norm": 17.374574661254883, "learning_rate": 8.760053475935828e-06, "loss": 0.5423, "step": 23700 }, { "epoch": 0.12693333333333334, "grad_norm": 16.400501251220703, "learning_rate": 8.754705882352942e-06, "loss": 0.5839, "step": 23800 }, { "epoch": 0.12746666666666667, "grad_norm": 14.798341751098633, "learning_rate": 8.749358288770055e-06, "loss": 0.5478, "step": 23900 }, { "epoch": 0.128, "grad_norm": 16.066513061523438, "learning_rate": 8.744010695187165e-06, "loss": 0.5574, "step": 24000 }, { "epoch": 0.128, "eval_test1_cer": 0.06237396370154605, "eval_test1_cer_norm": 0.04452661656301774, "eval_test1_loss": 0.207879900932312, "eval_test1_runtime": 1670.2534, "eval_test1_samples_per_second": 1.497, "eval_test1_steps_per_second": 0.374, "eval_test1_wer": 0.17484474766028163, "eval_test1_wer_norm": 0.11569595838569216, "step": 24000 }, { "epoch": 0.128, "eval_test2_cer": 0.12311009071564565, "eval_test2_cer_norm": 0.09723621010226216, "eval_test2_loss": 0.3492690324783325, "eval_test2_runtime": 1705.7374, "eval_test2_samples_per_second": 1.466, "eval_test2_steps_per_second": 0.366, "eval_test2_wer": 0.26516365300984207, "eval_test2_wer_norm": 0.19779967911987165, "step": 24000 }, { "epoch": 0.12853333333333333, "grad_norm": 9.348806381225586, "learning_rate": 8.738663101604279e-06, "loss": 0.5725, "step": 24100 }, { "epoch": 0.12906666666666666, "grad_norm": 9.932604789733887, "learning_rate": 8.73331550802139e-06, "loss": 0.5939, "step": 24200 }, { "epoch": 0.1296, "grad_norm": 13.418341636657715, "learning_rate": 8.727967914438503e-06, "loss": 0.5421, "step": 24300 }, { "epoch": 0.13013333333333332, "grad_norm": 9.391742706298828, "learning_rate": 8.722620320855616e-06, "loss": 0.5391, "step": 24400 }, { "epoch": 0.13066666666666665, "grad_norm": 15.926789283752441, "learning_rate": 8.717326203208557e-06, "loss": 0.5617, "step": 24500 }, { "epoch": 0.1312, "grad_norm": 11.089564323425293, "learning_rate": 8.711978609625669e-06, "loss": 0.5518, "step": 24600 }, { "epoch": 0.13173333333333334, "grad_norm": 10.87433910369873, "learning_rate": 8.70663101604278e-06, "loss": 0.5671, "step": 24700 }, { "epoch": 0.13226666666666667, "grad_norm": 11.572349548339844, "learning_rate": 8.701283422459894e-06, "loss": 0.5499, "step": 24800 }, { "epoch": 0.1328, "grad_norm": 5.108274936676025, "learning_rate": 8.695935828877006e-06, "loss": 0.591, "step": 24900 }, { "epoch": 0.13333333333333333, "grad_norm": 12.408733367919922, "learning_rate": 8.690588235294118e-06, "loss": 0.572, "step": 25000 }, { "epoch": 0.13386666666666666, "grad_norm": 13.672950744628906, "learning_rate": 8.685240641711231e-06, "loss": 0.5373, "step": 25100 }, { "epoch": 0.1344, "grad_norm": 15.337900161743164, "learning_rate": 8.679893048128343e-06, "loss": 0.5954, "step": 25200 }, { "epoch": 0.13493333333333332, "grad_norm": 12.863790512084961, "learning_rate": 8.674545454545455e-06, "loss": 0.5397, "step": 25300 }, { "epoch": 0.13546666666666668, "grad_norm": 10.173994064331055, "learning_rate": 8.669197860962567e-06, "loss": 0.565, "step": 25400 }, { "epoch": 0.136, "grad_norm": 16.5118350982666, "learning_rate": 8.66385026737968e-06, "loss": 0.5092, "step": 25500 }, { "epoch": 0.13653333333333334, "grad_norm": 8.356051445007324, "learning_rate": 8.658502673796792e-06, "loss": 0.5639, "step": 25600 }, { "epoch": 0.13706666666666667, "grad_norm": 21.643964767456055, "learning_rate": 8.653155080213904e-06, "loss": 0.5443, "step": 25700 }, { "epoch": 0.1376, "grad_norm": 13.246092796325684, "learning_rate": 8.647807486631017e-06, "loss": 0.5363, "step": 25800 }, { "epoch": 0.13813333333333333, "grad_norm": 17.80112075805664, "learning_rate": 8.64245989304813e-06, "loss": 0.6058, "step": 25900 }, { "epoch": 0.13866666666666666, "grad_norm": 12.117707252502441, "learning_rate": 8.637112299465241e-06, "loss": 0.5411, "step": 26000 }, { "epoch": 0.1392, "grad_norm": 13.295595169067383, "learning_rate": 8.631764705882355e-06, "loss": 0.5369, "step": 26100 }, { "epoch": 0.13973333333333332, "grad_norm": 9.28141975402832, "learning_rate": 8.626417112299466e-06, "loss": 0.5954, "step": 26200 }, { "epoch": 0.14026666666666668, "grad_norm": 8.32870864868164, "learning_rate": 8.621069518716578e-06, "loss": 0.5639, "step": 26300 }, { "epoch": 0.1408, "grad_norm": 21.67440414428711, "learning_rate": 8.615721925133692e-06, "loss": 0.4978, "step": 26400 }, { "epoch": 0.14133333333333334, "grad_norm": 13.5792818069458, "learning_rate": 8.610374331550803e-06, "loss": 0.514, "step": 26500 }, { "epoch": 0.14186666666666667, "grad_norm": 9.779759407043457, "learning_rate": 8.605026737967915e-06, "loss": 0.6062, "step": 26600 }, { "epoch": 0.1424, "grad_norm": 15.113900184631348, "learning_rate": 8.599679144385027e-06, "loss": 0.5694, "step": 26700 }, { "epoch": 0.14293333333333333, "grad_norm": 11.434464454650879, "learning_rate": 8.594331550802139e-06, "loss": 0.5537, "step": 26800 }, { "epoch": 0.14346666666666666, "grad_norm": 18.655942916870117, "learning_rate": 8.588983957219252e-06, "loss": 0.5653, "step": 26900 }, { "epoch": 0.144, "grad_norm": 15.276129722595215, "learning_rate": 8.583636363636364e-06, "loss": 0.5371, "step": 27000 }, { "epoch": 0.14453333333333335, "grad_norm": 7.964346408843994, "learning_rate": 8.578288770053476e-06, "loss": 0.5158, "step": 27100 }, { "epoch": 0.14506666666666668, "grad_norm": 16.52235984802246, "learning_rate": 8.57294117647059e-06, "loss": 0.5678, "step": 27200 }, { "epoch": 0.1456, "grad_norm": 10.735230445861816, "learning_rate": 8.567593582887701e-06, "loss": 0.5532, "step": 27300 }, { "epoch": 0.14613333333333334, "grad_norm": 12.510869026184082, "learning_rate": 8.562245989304813e-06, "loss": 0.4977, "step": 27400 }, { "epoch": 0.14666666666666667, "grad_norm": 5.735808849334717, "learning_rate": 8.556898395721925e-06, "loss": 0.5411, "step": 27500 }, { "epoch": 0.1472, "grad_norm": 14.77776050567627, "learning_rate": 8.551550802139038e-06, "loss": 0.535, "step": 27600 }, { "epoch": 0.14773333333333333, "grad_norm": 13.652959823608398, "learning_rate": 8.54620320855615e-06, "loss": 0.5225, "step": 27700 }, { "epoch": 0.14826666666666666, "grad_norm": 14.045892715454102, "learning_rate": 8.540855614973262e-06, "loss": 0.4906, "step": 27800 }, { "epoch": 0.1488, "grad_norm": 17.691871643066406, "learning_rate": 8.535508021390376e-06, "loss": 0.5456, "step": 27900 }, { "epoch": 0.14933333333333335, "grad_norm": 15.236734390258789, "learning_rate": 8.530160427807487e-06, "loss": 0.5229, "step": 28000 }, { "epoch": 0.14986666666666668, "grad_norm": 13.682173728942871, "learning_rate": 8.524812834224599e-06, "loss": 0.5042, "step": 28100 }, { "epoch": 0.1504, "grad_norm": 17.953258514404297, "learning_rate": 8.519465240641713e-06, "loss": 0.5599, "step": 28200 }, { "epoch": 0.15093333333333334, "grad_norm": 18.066553115844727, "learning_rate": 8.514117647058824e-06, "loss": 0.5363, "step": 28300 }, { "epoch": 0.15146666666666667, "grad_norm": 17.90055274963379, "learning_rate": 8.508877005347595e-06, "loss": 0.5237, "step": 28400 }, { "epoch": 0.152, "grad_norm": 9.729470252990723, "learning_rate": 8.503529411764706e-06, "loss": 0.5223, "step": 28500 }, { "epoch": 0.15253333333333333, "grad_norm": 10.79881477355957, "learning_rate": 8.498181818181818e-06, "loss": 0.5088, "step": 28600 }, { "epoch": 0.15306666666666666, "grad_norm": 20.735776901245117, "learning_rate": 8.492834224598932e-06, "loss": 0.5523, "step": 28700 }, { "epoch": 0.1536, "grad_norm": 18.563356399536133, "learning_rate": 8.487486631016044e-06, "loss": 0.582, "step": 28800 }, { "epoch": 0.15413333333333334, "grad_norm": 22.205400466918945, "learning_rate": 8.482139037433155e-06, "loss": 0.5234, "step": 28900 }, { "epoch": 0.15466666666666667, "grad_norm": 14.695528030395508, "learning_rate": 8.476791443850269e-06, "loss": 0.5248, "step": 29000 }, { "epoch": 0.1552, "grad_norm": 10.37659740447998, "learning_rate": 8.47144385026738e-06, "loss": 0.4997, "step": 29100 }, { "epoch": 0.15573333333333333, "grad_norm": 12.897777557373047, "learning_rate": 8.466096256684493e-06, "loss": 0.5424, "step": 29200 }, { "epoch": 0.15626666666666666, "grad_norm": 21.31694984436035, "learning_rate": 8.460748663101604e-06, "loss": 0.563, "step": 29300 }, { "epoch": 0.1568, "grad_norm": 20.148386001586914, "learning_rate": 8.455401069518718e-06, "loss": 0.5623, "step": 29400 }, { "epoch": 0.15733333333333333, "grad_norm": 13.629040718078613, "learning_rate": 8.45005347593583e-06, "loss": 0.5018, "step": 29500 }, { "epoch": 0.15786666666666666, "grad_norm": 5.38335657119751, "learning_rate": 8.444705882352941e-06, "loss": 0.5411, "step": 29600 }, { "epoch": 0.1584, "grad_norm": 6.576192855834961, "learning_rate": 8.439358288770055e-06, "loss": 0.5308, "step": 29700 }, { "epoch": 0.15893333333333334, "grad_norm": 11.397637367248535, "learning_rate": 8.434010695187167e-06, "loss": 0.528, "step": 29800 }, { "epoch": 0.15946666666666667, "grad_norm": 15.237577438354492, "learning_rate": 8.428663101604279e-06, "loss": 0.5367, "step": 29900 }, { "epoch": 0.16, "grad_norm": 23.824840545654297, "learning_rate": 8.423315508021392e-06, "loss": 0.5047, "step": 30000 }, { "epoch": 0.16053333333333333, "grad_norm": 9.93086051940918, "learning_rate": 8.417967914438502e-06, "loss": 0.4942, "step": 30100 }, { "epoch": 0.16106666666666666, "grad_norm": 31.71828842163086, "learning_rate": 8.412620320855616e-06, "loss": 0.526, "step": 30200 }, { "epoch": 0.1616, "grad_norm": 9.7785062789917, "learning_rate": 8.40727272727273e-06, "loss": 0.5187, "step": 30300 }, { "epoch": 0.16213333333333332, "grad_norm": 13.722928047180176, "learning_rate": 8.40192513368984e-06, "loss": 0.5579, "step": 30400 }, { "epoch": 0.16266666666666665, "grad_norm": 16.2613582611084, "learning_rate": 8.396577540106953e-06, "loss": 0.5291, "step": 30500 }, { "epoch": 0.1632, "grad_norm": 14.837869644165039, "learning_rate": 8.391229946524065e-06, "loss": 0.5629, "step": 30600 }, { "epoch": 0.16373333333333334, "grad_norm": 8.765687942504883, "learning_rate": 8.385882352941176e-06, "loss": 0.5309, "step": 30700 }, { "epoch": 0.16426666666666667, "grad_norm": 30.875959396362305, "learning_rate": 8.38053475935829e-06, "loss": 0.5056, "step": 30800 }, { "epoch": 0.1648, "grad_norm": 9.384804725646973, "learning_rate": 8.375187165775402e-06, "loss": 0.5007, "step": 30900 }, { "epoch": 0.16533333333333333, "grad_norm": 11.935778617858887, "learning_rate": 8.369839572192514e-06, "loss": 0.4794, "step": 31000 }, { "epoch": 0.16586666666666666, "grad_norm": 10.166949272155762, "learning_rate": 8.364491978609627e-06, "loss": 0.5034, "step": 31100 }, { "epoch": 0.1664, "grad_norm": 19.91596794128418, "learning_rate": 8.359144385026739e-06, "loss": 0.5149, "step": 31200 }, { "epoch": 0.16693333333333332, "grad_norm": 27.00314712524414, "learning_rate": 8.35379679144385e-06, "loss": 0.4907, "step": 31300 }, { "epoch": 0.16746666666666668, "grad_norm": 15.259913444519043, "learning_rate": 8.348449197860962e-06, "loss": 0.5087, "step": 31400 }, { "epoch": 0.168, "grad_norm": 11.177299499511719, "learning_rate": 8.343155080213905e-06, "loss": 0.5494, "step": 31500 }, { "epoch": 0.16853333333333334, "grad_norm": 14.176301002502441, "learning_rate": 8.337807486631017e-06, "loss": 0.5131, "step": 31600 }, { "epoch": 0.16906666666666667, "grad_norm": 8.51374340057373, "learning_rate": 8.332459893048129e-06, "loss": 0.5344, "step": 31700 }, { "epoch": 0.1696, "grad_norm": 15.946298599243164, "learning_rate": 8.32711229946524e-06, "loss": 0.5448, "step": 31800 }, { "epoch": 0.17013333333333333, "grad_norm": 15.905390739440918, "learning_rate": 8.321764705882354e-06, "loss": 0.5176, "step": 31900 }, { "epoch": 0.17066666666666666, "grad_norm": 14.842996597290039, "learning_rate": 8.316417112299466e-06, "loss": 0.5034, "step": 32000 }, { "epoch": 0.1712, "grad_norm": 22.108545303344727, "learning_rate": 8.311069518716578e-06, "loss": 0.542, "step": 32100 }, { "epoch": 0.17173333333333332, "grad_norm": 12.659880638122559, "learning_rate": 8.305721925133691e-06, "loss": 0.5071, "step": 32200 }, { "epoch": 0.17226666666666668, "grad_norm": 14.883027076721191, "learning_rate": 8.300374331550803e-06, "loss": 0.5607, "step": 32300 }, { "epoch": 0.1728, "grad_norm": 23.926809310913086, "learning_rate": 8.295026737967915e-06, "loss": 0.4902, "step": 32400 }, { "epoch": 0.17333333333333334, "grad_norm": 15.58038330078125, "learning_rate": 8.289679144385028e-06, "loss": 0.5359, "step": 32500 }, { "epoch": 0.17386666666666667, "grad_norm": 11.64762020111084, "learning_rate": 8.28433155080214e-06, "loss": 0.5018, "step": 32600 }, { "epoch": 0.1744, "grad_norm": 5.896636486053467, "learning_rate": 8.278983957219252e-06, "loss": 0.5411, "step": 32700 }, { "epoch": 0.17493333333333333, "grad_norm": 17.061283111572266, "learning_rate": 8.273636363636365e-06, "loss": 0.5667, "step": 32800 }, { "epoch": 0.17546666666666666, "grad_norm": 13.379528045654297, "learning_rate": 8.268288770053477e-06, "loss": 0.5504, "step": 32900 }, { "epoch": 0.176, "grad_norm": 14.993772506713867, "learning_rate": 8.262941176470589e-06, "loss": 0.5572, "step": 33000 }, { "epoch": 0.17653333333333332, "grad_norm": 14.116128921508789, "learning_rate": 8.257593582887701e-06, "loss": 0.5171, "step": 33100 }, { "epoch": 0.17706666666666668, "grad_norm": 13.497896194458008, "learning_rate": 8.252245989304813e-06, "loss": 0.5053, "step": 33200 }, { "epoch": 0.1776, "grad_norm": 13.400202751159668, "learning_rate": 8.246898395721926e-06, "loss": 0.5291, "step": 33300 }, { "epoch": 0.17813333333333334, "grad_norm": 13.911009788513184, "learning_rate": 8.241550802139038e-06, "loss": 0.5145, "step": 33400 }, { "epoch": 0.17866666666666667, "grad_norm": 11.858577728271484, "learning_rate": 8.23620320855615e-06, "loss": 0.5487, "step": 33500 }, { "epoch": 0.1792, "grad_norm": 9.835482597351074, "learning_rate": 8.230855614973263e-06, "loss": 0.52, "step": 33600 }, { "epoch": 0.17973333333333333, "grad_norm": 12.186354637145996, "learning_rate": 8.225508021390375e-06, "loss": 0.5434, "step": 33700 }, { "epoch": 0.18026666666666666, "grad_norm": 11.162744522094727, "learning_rate": 8.220160427807487e-06, "loss": 0.5849, "step": 33800 }, { "epoch": 0.1808, "grad_norm": 18.547521591186523, "learning_rate": 8.214812834224599e-06, "loss": 0.5692, "step": 33900 }, { "epoch": 0.18133333333333335, "grad_norm": 16.762039184570312, "learning_rate": 8.209465240641712e-06, "loss": 0.517, "step": 34000 }, { "epoch": 0.18186666666666668, "grad_norm": 13.912572860717773, "learning_rate": 8.204117647058824e-06, "loss": 0.4954, "step": 34100 }, { "epoch": 0.1824, "grad_norm": 10.338089942932129, "learning_rate": 8.198770053475936e-06, "loss": 0.5069, "step": 34200 }, { "epoch": 0.18293333333333334, "grad_norm": 21.81599998474121, "learning_rate": 8.19342245989305e-06, "loss": 0.5853, "step": 34300 }, { "epoch": 0.18346666666666667, "grad_norm": 6.486080646514893, "learning_rate": 8.188074866310161e-06, "loss": 0.4804, "step": 34400 }, { "epoch": 0.184, "grad_norm": 18.35474967956543, "learning_rate": 8.182727272727273e-06, "loss": 0.5056, "step": 34500 }, { "epoch": 0.18453333333333333, "grad_norm": 11.695199966430664, "learning_rate": 8.177379679144386e-06, "loss": 0.4989, "step": 34600 }, { "epoch": 0.18506666666666666, "grad_norm": 16.98781967163086, "learning_rate": 8.172032085561498e-06, "loss": 0.5677, "step": 34700 }, { "epoch": 0.1856, "grad_norm": 10.917583465576172, "learning_rate": 8.16668449197861e-06, "loss": 0.5465, "step": 34800 }, { "epoch": 0.18613333333333335, "grad_norm": 13.011962890625, "learning_rate": 8.161336898395724e-06, "loss": 0.5042, "step": 34900 }, { "epoch": 0.18666666666666668, "grad_norm": 6.6014251708984375, "learning_rate": 8.155989304812835e-06, "loss": 0.5592, "step": 35000 }, { "epoch": 0.1872, "grad_norm": 18.332862854003906, "learning_rate": 8.150641711229947e-06, "loss": 0.5551, "step": 35100 }, { "epoch": 0.18773333333333334, "grad_norm": 8.745649337768555, "learning_rate": 8.145294117647059e-06, "loss": 0.4883, "step": 35200 }, { "epoch": 0.18826666666666667, "grad_norm": 10.527746200561523, "learning_rate": 8.139946524064172e-06, "loss": 0.5117, "step": 35300 }, { "epoch": 0.1888, "grad_norm": 12.2564058303833, "learning_rate": 8.134598930481284e-06, "loss": 0.5494, "step": 35400 }, { "epoch": 0.18933333333333333, "grad_norm": 10.974699020385742, "learning_rate": 8.129251336898396e-06, "loss": 0.4973, "step": 35500 }, { "epoch": 0.18986666666666666, "grad_norm": 14.795953750610352, "learning_rate": 8.12390374331551e-06, "loss": 0.4924, "step": 35600 }, { "epoch": 0.1904, "grad_norm": 12.102880477905273, "learning_rate": 8.118556149732621e-06, "loss": 0.4832, "step": 35700 }, { "epoch": 0.19093333333333334, "grad_norm": 31.31418228149414, "learning_rate": 8.113208556149733e-06, "loss": 0.5249, "step": 35800 }, { "epoch": 0.19146666666666667, "grad_norm": 11.979596138000488, "learning_rate": 8.107860962566847e-06, "loss": 0.4698, "step": 35900 }, { "epoch": 0.192, "grad_norm": 8.735377311706543, "learning_rate": 8.102513368983957e-06, "loss": 0.5138, "step": 36000 }, { "epoch": 0.192, "eval_test1_cer": 0.06729404735230413, "eval_test1_cer_norm": 0.04736475616490984, "eval_test1_loss": 0.1987852156162262, "eval_test1_runtime": 1688.7203, "eval_test1_samples_per_second": 1.48, "eval_test1_steps_per_second": 0.37, "eval_test1_wer": 0.18090906440421003, "eval_test1_wer_norm": 0.11914433501855694, "step": 36000 }, { "epoch": 0.192, "eval_test2_cer": 0.1579590846306044, "eval_test2_cer_norm": 0.12365877750232414, "eval_test2_loss": 0.3402596116065979, "eval_test2_runtime": 1757.4555, "eval_test2_samples_per_second": 1.423, "eval_test2_steps_per_second": 0.356, "eval_test2_wer": 0.3113698786907759, "eval_test2_wer_norm": 0.24358239743295898, "step": 36000 }, { "epoch": 0.19253333333333333, "grad_norm": 14.927349090576172, "learning_rate": 8.09716577540107e-06, "loss": 0.5004, "step": 36100 }, { "epoch": 0.19306666666666666, "grad_norm": 14.457831382751465, "learning_rate": 8.091818181818182e-06, "loss": 0.4895, "step": 36200 }, { "epoch": 0.1936, "grad_norm": 13.645181655883789, "learning_rate": 8.086470588235294e-06, "loss": 0.4901, "step": 36300 }, { "epoch": 0.19413333333333332, "grad_norm": 11.273202896118164, "learning_rate": 8.081122994652407e-06, "loss": 0.5385, "step": 36400 }, { "epoch": 0.19466666666666665, "grad_norm": 12.43293571472168, "learning_rate": 8.07577540106952e-06, "loss": 0.4956, "step": 36500 }, { "epoch": 0.1952, "grad_norm": 12.721123695373535, "learning_rate": 8.070427807486631e-06, "loss": 0.5159, "step": 36600 }, { "epoch": 0.19573333333333334, "grad_norm": 14.079936981201172, "learning_rate": 8.065080213903745e-06, "loss": 0.511, "step": 36700 }, { "epoch": 0.19626666666666667, "grad_norm": 12.54669189453125, "learning_rate": 8.059732620320856e-06, "loss": 0.5095, "step": 36800 }, { "epoch": 0.1968, "grad_norm": 7.294404029846191, "learning_rate": 8.054385026737968e-06, "loss": 0.4584, "step": 36900 }, { "epoch": 0.19733333333333333, "grad_norm": 19.54963493347168, "learning_rate": 8.049037433155082e-06, "loss": 0.4944, "step": 37000 }, { "epoch": 0.19786666666666666, "grad_norm": 19.137300491333008, "learning_rate": 8.043689839572193e-06, "loss": 0.4982, "step": 37100 }, { "epoch": 0.1984, "grad_norm": 16.745487213134766, "learning_rate": 8.038342245989305e-06, "loss": 0.5043, "step": 37200 }, { "epoch": 0.19893333333333332, "grad_norm": 16.08888053894043, "learning_rate": 8.032994652406417e-06, "loss": 0.5063, "step": 37300 }, { "epoch": 0.19946666666666665, "grad_norm": 14.163363456726074, "learning_rate": 8.02764705882353e-06, "loss": 0.4943, "step": 37400 }, { "epoch": 0.2, "grad_norm": 13.600285530090332, "learning_rate": 8.022352941176472e-06, "loss": 0.512, "step": 37500 }, { "epoch": 0.20053333333333334, "grad_norm": 10.524750709533691, "learning_rate": 8.017005347593583e-06, "loss": 0.534, "step": 37600 }, { "epoch": 0.20106666666666667, "grad_norm": 11.459936141967773, "learning_rate": 8.011657754010695e-06, "loss": 0.4873, "step": 37700 }, { "epoch": 0.2016, "grad_norm": 14.06971263885498, "learning_rate": 8.006310160427809e-06, "loss": 0.4917, "step": 37800 }, { "epoch": 0.20213333333333333, "grad_norm": 13.051273345947266, "learning_rate": 8.00096256684492e-06, "loss": 0.5023, "step": 37900 }, { "epoch": 0.20266666666666666, "grad_norm": 11.831831932067871, "learning_rate": 7.995614973262032e-06, "loss": 0.5571, "step": 38000 }, { "epoch": 0.2032, "grad_norm": 11.375923156738281, "learning_rate": 7.990267379679146e-06, "loss": 0.5343, "step": 38100 }, { "epoch": 0.20373333333333332, "grad_norm": 20.65483283996582, "learning_rate": 7.984919786096258e-06, "loss": 0.4561, "step": 38200 }, { "epoch": 0.20426666666666668, "grad_norm": 17.058748245239258, "learning_rate": 7.97957219251337e-06, "loss": 0.4944, "step": 38300 }, { "epoch": 0.2048, "grad_norm": 10.77281665802002, "learning_rate": 7.974224598930483e-06, "loss": 0.4969, "step": 38400 }, { "epoch": 0.20533333333333334, "grad_norm": 11.621271133422852, "learning_rate": 7.968877005347593e-06, "loss": 0.5433, "step": 38500 }, { "epoch": 0.20586666666666667, "grad_norm": 14.342939376831055, "learning_rate": 7.963529411764707e-06, "loss": 0.5331, "step": 38600 }, { "epoch": 0.2064, "grad_norm": 7.223623275756836, "learning_rate": 7.95818181818182e-06, "loss": 0.4877, "step": 38700 }, { "epoch": 0.20693333333333333, "grad_norm": 8.031376838684082, "learning_rate": 7.95283422459893e-06, "loss": 0.5238, "step": 38800 }, { "epoch": 0.20746666666666666, "grad_norm": 21.257734298706055, "learning_rate": 7.947486631016044e-06, "loss": 0.4855, "step": 38900 }, { "epoch": 0.208, "grad_norm": 8.847993850708008, "learning_rate": 7.942139037433155e-06, "loss": 0.5108, "step": 39000 }, { "epoch": 0.20853333333333332, "grad_norm": 14.951128959655762, "learning_rate": 7.936844919786097e-06, "loss": 0.4657, "step": 39100 }, { "epoch": 0.20906666666666668, "grad_norm": 13.883966445922852, "learning_rate": 7.931497326203208e-06, "loss": 0.4768, "step": 39200 }, { "epoch": 0.2096, "grad_norm": 6.545587062835693, "learning_rate": 7.926149732620322e-06, "loss": 0.4925, "step": 39300 }, { "epoch": 0.21013333333333334, "grad_norm": 12.866109848022461, "learning_rate": 7.920802139037434e-06, "loss": 0.473, "step": 39400 }, { "epoch": 0.21066666666666667, "grad_norm": 8.276854515075684, "learning_rate": 7.915454545454545e-06, "loss": 0.4795, "step": 39500 }, { "epoch": 0.2112, "grad_norm": 9.323075294494629, "learning_rate": 7.910106951871659e-06, "loss": 0.5063, "step": 39600 }, { "epoch": 0.21173333333333333, "grad_norm": 9.32303237915039, "learning_rate": 7.90475935828877e-06, "loss": 0.5094, "step": 39700 }, { "epoch": 0.21226666666666666, "grad_norm": 12.414153099060059, "learning_rate": 7.899411764705883e-06, "loss": 0.5314, "step": 39800 }, { "epoch": 0.2128, "grad_norm": 11.19997787475586, "learning_rate": 7.894064171122994e-06, "loss": 0.4898, "step": 39900 }, { "epoch": 0.21333333333333335, "grad_norm": 15.265658378601074, "learning_rate": 7.888716577540108e-06, "loss": 0.5012, "step": 40000 }, { "epoch": 0.21386666666666668, "grad_norm": 10.962374687194824, "learning_rate": 7.88336898395722e-06, "loss": 0.4991, "step": 40100 }, { "epoch": 0.2144, "grad_norm": 8.004968643188477, "learning_rate": 7.878021390374331e-06, "loss": 0.5297, "step": 40200 }, { "epoch": 0.21493333333333334, "grad_norm": 11.827025413513184, "learning_rate": 7.872673796791445e-06, "loss": 0.5443, "step": 40300 }, { "epoch": 0.21546666666666667, "grad_norm": 10.659557342529297, "learning_rate": 7.867326203208557e-06, "loss": 0.4903, "step": 40400 }, { "epoch": 0.216, "grad_norm": 10.38294506072998, "learning_rate": 7.861978609625669e-06, "loss": 0.4642, "step": 40500 }, { "epoch": 0.21653333333333333, "grad_norm": 12.667179107666016, "learning_rate": 7.856631016042782e-06, "loss": 0.5427, "step": 40600 }, { "epoch": 0.21706666666666666, "grad_norm": 17.750839233398438, "learning_rate": 7.851283422459894e-06, "loss": 0.5154, "step": 40700 }, { "epoch": 0.2176, "grad_norm": 5.515246868133545, "learning_rate": 7.845935828877006e-06, "loss": 0.4884, "step": 40800 }, { "epoch": 0.21813333333333335, "grad_norm": 12.247614860534668, "learning_rate": 7.84058823529412e-06, "loss": 0.4506, "step": 40900 }, { "epoch": 0.21866666666666668, "grad_norm": 11.110750198364258, "learning_rate": 7.835240641711231e-06, "loss": 0.4833, "step": 41000 }, { "epoch": 0.2192, "grad_norm": 16.250259399414062, "learning_rate": 7.829893048128343e-06, "loss": 0.4794, "step": 41100 }, { "epoch": 0.21973333333333334, "grad_norm": 8.168596267700195, "learning_rate": 7.824545454545455e-06, "loss": 0.5103, "step": 41200 }, { "epoch": 0.22026666666666667, "grad_norm": 14.486651420593262, "learning_rate": 7.819197860962568e-06, "loss": 0.5101, "step": 41300 }, { "epoch": 0.2208, "grad_norm": 15.912956237792969, "learning_rate": 7.81385026737968e-06, "loss": 0.4991, "step": 41400 }, { "epoch": 0.22133333333333333, "grad_norm": 6.588569641113281, "learning_rate": 7.808502673796792e-06, "loss": 0.4964, "step": 41500 }, { "epoch": 0.22186666666666666, "grad_norm": 13.260436058044434, "learning_rate": 7.803155080213905e-06, "loss": 0.4948, "step": 41600 }, { "epoch": 0.2224, "grad_norm": 10.861129760742188, "learning_rate": 7.797807486631017e-06, "loss": 0.4845, "step": 41700 }, { "epoch": 0.22293333333333334, "grad_norm": 15.446623802185059, "learning_rate": 7.792459893048129e-06, "loss": 0.4991, "step": 41800 }, { "epoch": 0.22346666666666667, "grad_norm": 18.043420791625977, "learning_rate": 7.78711229946524e-06, "loss": 0.5049, "step": 41900 }, { "epoch": 0.224, "grad_norm": 7.7918877601623535, "learning_rate": 7.781764705882352e-06, "loss": 0.479, "step": 42000 }, { "epoch": 0.22453333333333333, "grad_norm": 13.537217140197754, "learning_rate": 7.776470588235294e-06, "loss": 0.492, "step": 42100 }, { "epoch": 0.22506666666666666, "grad_norm": 11.7057523727417, "learning_rate": 7.771122994652407e-06, "loss": 0.4764, "step": 42200 }, { "epoch": 0.2256, "grad_norm": 11.606700897216797, "learning_rate": 7.765775401069519e-06, "loss": 0.4884, "step": 42300 }, { "epoch": 0.22613333333333333, "grad_norm": 11.91926097869873, "learning_rate": 7.76042780748663e-06, "loss": 0.4635, "step": 42400 }, { "epoch": 0.22666666666666666, "grad_norm": 13.207754135131836, "learning_rate": 7.755080213903744e-06, "loss": 0.5205, "step": 42500 }, { "epoch": 0.2272, "grad_norm": 6.204128742218018, "learning_rate": 7.749732620320856e-06, "loss": 0.5315, "step": 42600 }, { "epoch": 0.22773333333333334, "grad_norm": 9.433666229248047, "learning_rate": 7.744385026737968e-06, "loss": 0.4846, "step": 42700 }, { "epoch": 0.22826666666666667, "grad_norm": 11.480228424072266, "learning_rate": 7.739037433155081e-06, "loss": 0.4465, "step": 42800 }, { "epoch": 0.2288, "grad_norm": 8.330833435058594, "learning_rate": 7.733689839572193e-06, "loss": 0.5202, "step": 42900 }, { "epoch": 0.22933333333333333, "grad_norm": 11.156038284301758, "learning_rate": 7.728342245989305e-06, "loss": 0.5075, "step": 43000 }, { "epoch": 0.22986666666666666, "grad_norm": 8.167844772338867, "learning_rate": 7.722994652406418e-06, "loss": 0.4982, "step": 43100 }, { "epoch": 0.2304, "grad_norm": 12.628026962280273, "learning_rate": 7.71764705882353e-06, "loss": 0.4735, "step": 43200 }, { "epoch": 0.23093333333333332, "grad_norm": 16.067520141601562, "learning_rate": 7.712299465240642e-06, "loss": 0.4906, "step": 43300 }, { "epoch": 0.23146666666666665, "grad_norm": 12.942168235778809, "learning_rate": 7.706951871657755e-06, "loss": 0.4915, "step": 43400 }, { "epoch": 0.232, "grad_norm": 8.250186920166016, "learning_rate": 7.701604278074867e-06, "loss": 0.4761, "step": 43500 }, { "epoch": 0.23253333333333334, "grad_norm": 10.629430770874023, "learning_rate": 7.696256684491979e-06, "loss": 0.4724, "step": 43600 }, { "epoch": 0.23306666666666667, "grad_norm": 22.247819900512695, "learning_rate": 7.690909090909091e-06, "loss": 0.48, "step": 43700 }, { "epoch": 0.2336, "grad_norm": 11.016907691955566, "learning_rate": 7.685561497326204e-06, "loss": 0.4494, "step": 43800 }, { "epoch": 0.23413333333333333, "grad_norm": 9.235944747924805, "learning_rate": 7.680213903743316e-06, "loss": 0.484, "step": 43900 }, { "epoch": 0.23466666666666666, "grad_norm": 7.899468898773193, "learning_rate": 7.674866310160428e-06, "loss": 0.5166, "step": 44000 }, { "epoch": 0.2352, "grad_norm": 19.77458381652832, "learning_rate": 7.669518716577542e-06, "loss": 0.4866, "step": 44100 }, { "epoch": 0.23573333333333332, "grad_norm": 11.023879051208496, "learning_rate": 7.664171122994653e-06, "loss": 0.5068, "step": 44200 }, { "epoch": 0.23626666666666668, "grad_norm": 6.596517086029053, "learning_rate": 7.658823529411765e-06, "loss": 0.5169, "step": 44300 }, { "epoch": 0.2368, "grad_norm": 17.653690338134766, "learning_rate": 7.653475935828879e-06, "loss": 0.4494, "step": 44400 }, { "epoch": 0.23733333333333334, "grad_norm": 9.930411338806152, "learning_rate": 7.648128342245989e-06, "loss": 0.4669, "step": 44500 }, { "epoch": 0.23786666666666667, "grad_norm": 9.89853572845459, "learning_rate": 7.642780748663102e-06, "loss": 0.5018, "step": 44600 }, { "epoch": 0.2384, "grad_norm": 14.063169479370117, "learning_rate": 7.637433155080216e-06, "loss": 0.4907, "step": 44700 }, { "epoch": 0.23893333333333333, "grad_norm": 10.883933067321777, "learning_rate": 7.632085561497326e-06, "loss": 0.5163, "step": 44800 }, { "epoch": 0.23946666666666666, "grad_norm": 11.441637992858887, "learning_rate": 7.626791443850268e-06, "loss": 0.5081, "step": 44900 }, { "epoch": 0.24, "grad_norm": 11.21094036102295, "learning_rate": 7.62144385026738e-06, "loss": 0.5258, "step": 45000 }, { "epoch": 0.24053333333333332, "grad_norm": 13.77007007598877, "learning_rate": 7.616096256684493e-06, "loss": 0.4872, "step": 45100 }, { "epoch": 0.24106666666666668, "grad_norm": 12.370695114135742, "learning_rate": 7.610748663101605e-06, "loss": 0.4715, "step": 45200 }, { "epoch": 0.2416, "grad_norm": 11.089216232299805, "learning_rate": 7.6054010695187175e-06, "loss": 0.4916, "step": 45300 }, { "epoch": 0.24213333333333334, "grad_norm": 12.099841117858887, "learning_rate": 7.600053475935829e-06, "loss": 0.4869, "step": 45400 }, { "epoch": 0.24266666666666667, "grad_norm": 6.819106578826904, "learning_rate": 7.594705882352942e-06, "loss": 0.5069, "step": 45500 }, { "epoch": 0.2432, "grad_norm": 8.451045036315918, "learning_rate": 7.589358288770055e-06, "loss": 0.4893, "step": 45600 }, { "epoch": 0.24373333333333333, "grad_norm": 14.727716445922852, "learning_rate": 7.584010695187166e-06, "loss": 0.4316, "step": 45700 }, { "epoch": 0.24426666666666666, "grad_norm": 16.35677719116211, "learning_rate": 7.578663101604279e-06, "loss": 0.5, "step": 45800 }, { "epoch": 0.2448, "grad_norm": 14.498254776000977, "learning_rate": 7.573315508021391e-06, "loss": 0.4596, "step": 45900 }, { "epoch": 0.24533333333333332, "grad_norm": 11.929694175720215, "learning_rate": 7.5679679144385035e-06, "loss": 0.5071, "step": 46000 }, { "epoch": 0.24586666666666668, "grad_norm": 14.48741626739502, "learning_rate": 7.562620320855616e-06, "loss": 0.5184, "step": 46100 }, { "epoch": 0.2464, "grad_norm": 15.136734962463379, "learning_rate": 7.557272727272727e-06, "loss": 0.5086, "step": 46200 }, { "epoch": 0.24693333333333334, "grad_norm": 15.296268463134766, "learning_rate": 7.551925133689841e-06, "loss": 0.4688, "step": 46300 }, { "epoch": 0.24746666666666667, "grad_norm": 10.236528396606445, "learning_rate": 7.546577540106953e-06, "loss": 0.4422, "step": 46400 }, { "epoch": 0.248, "grad_norm": 9.17018985748291, "learning_rate": 7.541229946524064e-06, "loss": 0.462, "step": 46500 }, { "epoch": 0.24853333333333333, "grad_norm": 12.647317886352539, "learning_rate": 7.535882352941177e-06, "loss": 0.4381, "step": 46600 }, { "epoch": 0.24906666666666666, "grad_norm": 10.621650695800781, "learning_rate": 7.530534759358289e-06, "loss": 0.4846, "step": 46700 }, { "epoch": 0.2496, "grad_norm": 4.528275489807129, "learning_rate": 7.525187165775401e-06, "loss": 0.4269, "step": 46800 }, { "epoch": 0.2501333333333333, "grad_norm": 15.07592487335205, "learning_rate": 7.519839572192514e-06, "loss": 0.5012, "step": 46900 }, { "epoch": 0.25066666666666665, "grad_norm": 11.768869400024414, "learning_rate": 7.514491978609626e-06, "loss": 0.5114, "step": 47000 }, { "epoch": 0.2512, "grad_norm": 14.089399337768555, "learning_rate": 7.5091443850267385e-06, "loss": 0.5112, "step": 47100 }, { "epoch": 0.2517333333333333, "grad_norm": 11.96927261352539, "learning_rate": 7.503796791443851e-06, "loss": 0.4798, "step": 47200 }, { "epoch": 0.25226666666666664, "grad_norm": 8.413769721984863, "learning_rate": 7.498449197860963e-06, "loss": 0.5125, "step": 47300 }, { "epoch": 0.2528, "grad_norm": 20.221294403076172, "learning_rate": 7.493101604278076e-06, "loss": 0.5211, "step": 47400 }, { "epoch": 0.25333333333333335, "grad_norm": 8.478744506835938, "learning_rate": 7.487754010695187e-06, "loss": 0.4743, "step": 47500 }, { "epoch": 0.2538666666666667, "grad_norm": 11.591379165649414, "learning_rate": 7.4824064171123e-06, "loss": 0.469, "step": 47600 }, { "epoch": 0.2544, "grad_norm": 7.226714134216309, "learning_rate": 7.477058823529413e-06, "loss": 0.47, "step": 47700 }, { "epoch": 0.25493333333333335, "grad_norm": 9.70327091217041, "learning_rate": 7.4717112299465245e-06, "loss": 0.4794, "step": 47800 }, { "epoch": 0.2554666666666667, "grad_norm": 10.35185718536377, "learning_rate": 7.466363636363637e-06, "loss": 0.4574, "step": 47900 }, { "epoch": 0.256, "grad_norm": 9.838950157165527, "learning_rate": 7.461069518716578e-06, "loss": 0.4868, "step": 48000 }, { "epoch": 0.256, "eval_test1_cer": 0.05609082082306371, "eval_test1_cer_norm": 0.0411074026940716, "eval_test1_loss": 0.18848280608654022, "eval_test1_runtime": 1689.6473, "eval_test1_samples_per_second": 1.48, "eval_test1_steps_per_second": 0.37, "eval_test1_wer": 0.16257033732761889, "eval_test1_wer_norm": 0.1042695578479792, "step": 48000 }, { "epoch": 0.256, "eval_test2_cer": 0.11827098965916302, "eval_test2_cer_norm": 0.09401630771614503, "eval_test2_loss": 0.3232329189777374, "eval_test2_runtime": 1718.7097, "eval_test2_samples_per_second": 1.455, "eval_test2_steps_per_second": 0.364, "eval_test2_wer": 0.24527924010070953, "eval_test2_wer_norm": 0.1786328214531286, "step": 48000 }, { "epoch": 0.25653333333333334, "grad_norm": 16.19783592224121, "learning_rate": 7.455721925133691e-06, "loss": 0.4636, "step": 48100 }, { "epoch": 0.25706666666666667, "grad_norm": 8.96130084991455, "learning_rate": 7.450374331550803e-06, "loss": 0.4974, "step": 48200 }, { "epoch": 0.2576, "grad_norm": 14.76246166229248, "learning_rate": 7.445026737967915e-06, "loss": 0.437, "step": 48300 }, { "epoch": 0.2581333333333333, "grad_norm": 14.24903392791748, "learning_rate": 7.439679144385027e-06, "loss": 0.479, "step": 48400 }, { "epoch": 0.25866666666666666, "grad_norm": 7.977598667144775, "learning_rate": 7.43433155080214e-06, "loss": 0.4036, "step": 48500 }, { "epoch": 0.2592, "grad_norm": 17.06671905517578, "learning_rate": 7.4289839572192524e-06, "loss": 0.5086, "step": 48600 }, { "epoch": 0.2597333333333333, "grad_norm": 10.244609832763672, "learning_rate": 7.423636363636364e-06, "loss": 0.4178, "step": 48700 }, { "epoch": 0.26026666666666665, "grad_norm": 10.964102745056152, "learning_rate": 7.418288770053477e-06, "loss": 0.4086, "step": 48800 }, { "epoch": 0.2608, "grad_norm": 11.37350845336914, "learning_rate": 7.412941176470589e-06, "loss": 0.4791, "step": 48900 }, { "epoch": 0.2613333333333333, "grad_norm": 9.48231029510498, "learning_rate": 7.407593582887701e-06, "loss": 0.4979, "step": 49000 }, { "epoch": 0.2618666666666667, "grad_norm": 13.668120384216309, "learning_rate": 7.402245989304814e-06, "loss": 0.5135, "step": 49100 }, { "epoch": 0.2624, "grad_norm": 14.564262390136719, "learning_rate": 7.396898395721925e-06, "loss": 0.4606, "step": 49200 }, { "epoch": 0.26293333333333335, "grad_norm": 15.332451820373535, "learning_rate": 7.3915508021390385e-06, "loss": 0.4658, "step": 49300 }, { "epoch": 0.2634666666666667, "grad_norm": 12.676420211791992, "learning_rate": 7.386203208556151e-06, "loss": 0.4973, "step": 49400 }, { "epoch": 0.264, "grad_norm": 15.720377922058105, "learning_rate": 7.380855614973262e-06, "loss": 0.4598, "step": 49500 }, { "epoch": 0.26453333333333334, "grad_norm": 19.4632625579834, "learning_rate": 7.375508021390375e-06, "loss": 0.486, "step": 49600 }, { "epoch": 0.2650666666666667, "grad_norm": 15.794721603393555, "learning_rate": 7.3701604278074866e-06, "loss": 0.4638, "step": 49700 }, { "epoch": 0.2656, "grad_norm": 9.580108642578125, "learning_rate": 7.364812834224599e-06, "loss": 0.4515, "step": 49800 }, { "epoch": 0.26613333333333333, "grad_norm": 12.95749568939209, "learning_rate": 7.359465240641712e-06, "loss": 0.477, "step": 49900 }, { "epoch": 0.26666666666666666, "grad_norm": 6.729991436004639, "learning_rate": 7.354117647058824e-06, "loss": 0.5117, "step": 50000 }, { "epoch": 0.2672, "grad_norm": 17.141700744628906, "learning_rate": 7.348770053475936e-06, "loss": 0.4338, "step": 50100 }, { "epoch": 0.2677333333333333, "grad_norm": 10.719261169433594, "learning_rate": 7.343422459893049e-06, "loss": 0.4816, "step": 50200 }, { "epoch": 0.26826666666666665, "grad_norm": 16.58980369567871, "learning_rate": 7.33812834224599e-06, "loss": 0.4758, "step": 50300 }, { "epoch": 0.2688, "grad_norm": 13.567498207092285, "learning_rate": 7.332780748663102e-06, "loss": 0.5094, "step": 50400 }, { "epoch": 0.2693333333333333, "grad_norm": 6.239638805389404, "learning_rate": 7.3274331550802145e-06, "loss": 0.4592, "step": 50500 }, { "epoch": 0.26986666666666664, "grad_norm": 15.046873092651367, "learning_rate": 7.322085561497326e-06, "loss": 0.4398, "step": 50600 }, { "epoch": 0.2704, "grad_norm": 12.347797393798828, "learning_rate": 7.316737967914439e-06, "loss": 0.4594, "step": 50700 }, { "epoch": 0.27093333333333336, "grad_norm": 7.879425048828125, "learning_rate": 7.311390374331552e-06, "loss": 0.4376, "step": 50800 }, { "epoch": 0.2714666666666667, "grad_norm": 5.057575225830078, "learning_rate": 7.306042780748663e-06, "loss": 0.473, "step": 50900 }, { "epoch": 0.272, "grad_norm": 13.809687614440918, "learning_rate": 7.300695187165776e-06, "loss": 0.5118, "step": 51000 }, { "epoch": 0.27253333333333335, "grad_norm": 16.142139434814453, "learning_rate": 7.295347593582889e-06, "loss": 0.4598, "step": 51100 }, { "epoch": 0.2730666666666667, "grad_norm": 10.899667739868164, "learning_rate": 7.2900000000000005e-06, "loss": 0.4762, "step": 51200 }, { "epoch": 0.2736, "grad_norm": 16.385969161987305, "learning_rate": 7.284652406417113e-06, "loss": 0.4873, "step": 51300 }, { "epoch": 0.27413333333333334, "grad_norm": 9.547894477844238, "learning_rate": 7.279304812834225e-06, "loss": 0.4304, "step": 51400 }, { "epoch": 0.27466666666666667, "grad_norm": 9.721232414245605, "learning_rate": 7.273957219251338e-06, "loss": 0.5003, "step": 51500 }, { "epoch": 0.2752, "grad_norm": 16.282270431518555, "learning_rate": 7.26860962566845e-06, "loss": 0.4881, "step": 51600 }, { "epoch": 0.27573333333333333, "grad_norm": 10.426407814025879, "learning_rate": 7.263262032085562e-06, "loss": 0.5136, "step": 51700 }, { "epoch": 0.27626666666666666, "grad_norm": 13.368882179260254, "learning_rate": 7.257914438502675e-06, "loss": 0.4916, "step": 51800 }, { "epoch": 0.2768, "grad_norm": 17.5191650390625, "learning_rate": 7.252566844919787e-06, "loss": 0.4959, "step": 51900 }, { "epoch": 0.2773333333333333, "grad_norm": 10.768444061279297, "learning_rate": 7.247219251336899e-06, "loss": 0.4551, "step": 52000 }, { "epoch": 0.27786666666666665, "grad_norm": 20.530620574951172, "learning_rate": 7.241871657754012e-06, "loss": 0.4801, "step": 52100 }, { "epoch": 0.2784, "grad_norm": 7.555259704589844, "learning_rate": 7.236524064171123e-06, "loss": 0.428, "step": 52200 }, { "epoch": 0.2789333333333333, "grad_norm": 10.019723892211914, "learning_rate": 7.231176470588236e-06, "loss": 0.4731, "step": 52300 }, { "epoch": 0.27946666666666664, "grad_norm": 7.390499114990234, "learning_rate": 7.225882352941177e-06, "loss": 0.4703, "step": 52400 }, { "epoch": 0.28, "grad_norm": 16.747018814086914, "learning_rate": 7.22053475935829e-06, "loss": 0.4803, "step": 52500 }, { "epoch": 0.28053333333333336, "grad_norm": 8.54539966583252, "learning_rate": 7.215187165775401e-06, "loss": 0.4865, "step": 52600 }, { "epoch": 0.2810666666666667, "grad_norm": 16.00119972229004, "learning_rate": 7.2098395721925145e-06, "loss": 0.4777, "step": 52700 }, { "epoch": 0.2816, "grad_norm": 14.40733528137207, "learning_rate": 7.204491978609627e-06, "loss": 0.4476, "step": 52800 }, { "epoch": 0.28213333333333335, "grad_norm": 19.63300323486328, "learning_rate": 7.199144385026738e-06, "loss": 0.477, "step": 52900 }, { "epoch": 0.2826666666666667, "grad_norm": 10.970003128051758, "learning_rate": 7.193796791443851e-06, "loss": 0.4616, "step": 53000 }, { "epoch": 0.2832, "grad_norm": 7.8082475662231445, "learning_rate": 7.1884491978609625e-06, "loss": 0.4434, "step": 53100 }, { "epoch": 0.28373333333333334, "grad_norm": 15.398110389709473, "learning_rate": 7.183101604278075e-06, "loss": 0.4943, "step": 53200 }, { "epoch": 0.28426666666666667, "grad_norm": 10.75080394744873, "learning_rate": 7.177754010695188e-06, "loss": 0.4635, "step": 53300 }, { "epoch": 0.2848, "grad_norm": 16.437156677246094, "learning_rate": 7.1724064171123e-06, "loss": 0.4668, "step": 53400 }, { "epoch": 0.2853333333333333, "grad_norm": 8.324503898620605, "learning_rate": 7.167058823529412e-06, "loss": 0.4399, "step": 53500 }, { "epoch": 0.28586666666666666, "grad_norm": 7.333218574523926, "learning_rate": 7.161711229946524e-06, "loss": 0.4678, "step": 53600 }, { "epoch": 0.2864, "grad_norm": 13.47083854675293, "learning_rate": 7.156363636363637e-06, "loss": 0.4311, "step": 53700 }, { "epoch": 0.2869333333333333, "grad_norm": 10.553390502929688, "learning_rate": 7.151016042780749e-06, "loss": 0.4634, "step": 53800 }, { "epoch": 0.28746666666666665, "grad_norm": 8.693891525268555, "learning_rate": 7.145668449197861e-06, "loss": 0.4391, "step": 53900 }, { "epoch": 0.288, "grad_norm": 5.305190086364746, "learning_rate": 7.140320855614974e-06, "loss": 0.4939, "step": 54000 }, { "epoch": 0.2885333333333333, "grad_norm": 10.03877067565918, "learning_rate": 7.1349732620320865e-06, "loss": 0.4547, "step": 54100 }, { "epoch": 0.2890666666666667, "grad_norm": 15.345527648925781, "learning_rate": 7.129625668449198e-06, "loss": 0.4652, "step": 54200 }, { "epoch": 0.2896, "grad_norm": 12.022958755493164, "learning_rate": 7.124278074866311e-06, "loss": 0.4803, "step": 54300 }, { "epoch": 0.29013333333333335, "grad_norm": 12.889341354370117, "learning_rate": 7.118930481283423e-06, "loss": 0.4775, "step": 54400 }, { "epoch": 0.2906666666666667, "grad_norm": 14.088959693908691, "learning_rate": 7.113636363636364e-06, "loss": 0.4222, "step": 54500 }, { "epoch": 0.2912, "grad_norm": 13.341967582702637, "learning_rate": 7.1082887700534765e-06, "loss": 0.4699, "step": 54600 }, { "epoch": 0.29173333333333334, "grad_norm": 15.094438552856445, "learning_rate": 7.102941176470589e-06, "loss": 0.5169, "step": 54700 }, { "epoch": 0.2922666666666667, "grad_norm": 9.196638107299805, "learning_rate": 7.097593582887701e-06, "loss": 0.5099, "step": 54800 }, { "epoch": 0.2928, "grad_norm": 11.525211334228516, "learning_rate": 7.092245989304814e-06, "loss": 0.4555, "step": 54900 }, { "epoch": 0.29333333333333333, "grad_norm": 12.856800079345703, "learning_rate": 7.086898395721926e-06, "loss": 0.4857, "step": 55000 }, { "epoch": 0.29386666666666666, "grad_norm": 16.708173751831055, "learning_rate": 7.081550802139038e-06, "loss": 0.4561, "step": 55100 }, { "epoch": 0.2944, "grad_norm": 11.064802169799805, "learning_rate": 7.076203208556151e-06, "loss": 0.4766, "step": 55200 }, { "epoch": 0.2949333333333333, "grad_norm": 12.407217979431152, "learning_rate": 7.0708556149732625e-06, "loss": 0.465, "step": 55300 }, { "epoch": 0.29546666666666666, "grad_norm": 9.437504768371582, "learning_rate": 7.065508021390375e-06, "loss": 0.4482, "step": 55400 }, { "epoch": 0.296, "grad_norm": 10.960165977478027, "learning_rate": 7.060160427807488e-06, "loss": 0.4478, "step": 55500 }, { "epoch": 0.2965333333333333, "grad_norm": 8.491662979125977, "learning_rate": 7.054812834224599e-06, "loss": 0.4893, "step": 55600 }, { "epoch": 0.29706666666666665, "grad_norm": 7.208836555480957, "learning_rate": 7.049465240641712e-06, "loss": 0.4699, "step": 55700 }, { "epoch": 0.2976, "grad_norm": 13.254350662231445, "learning_rate": 7.044117647058825e-06, "loss": 0.4392, "step": 55800 }, { "epoch": 0.2981333333333333, "grad_norm": 11.906819343566895, "learning_rate": 7.038770053475936e-06, "loss": 0.4448, "step": 55900 }, { "epoch": 0.2986666666666667, "grad_norm": 13.398333549499512, "learning_rate": 7.0334224598930486e-06, "loss": 0.4448, "step": 56000 }, { "epoch": 0.2992, "grad_norm": 15.017807960510254, "learning_rate": 7.02807486631016e-06, "loss": 0.4845, "step": 56100 }, { "epoch": 0.29973333333333335, "grad_norm": 9.74543285369873, "learning_rate": 7.022727272727273e-06, "loss": 0.4645, "step": 56200 }, { "epoch": 0.3002666666666667, "grad_norm": 14.451801300048828, "learning_rate": 7.017379679144386e-06, "loss": 0.4594, "step": 56300 }, { "epoch": 0.3008, "grad_norm": 16.830596923828125, "learning_rate": 7.0120320855614975e-06, "loss": 0.4676, "step": 56400 }, { "epoch": 0.30133333333333334, "grad_norm": 6.990233421325684, "learning_rate": 7.0067379679144385e-06, "loss": 0.4554, "step": 56500 }, { "epoch": 0.30186666666666667, "grad_norm": 18.146278381347656, "learning_rate": 7.001390374331551e-06, "loss": 0.4723, "step": 56600 }, { "epoch": 0.3024, "grad_norm": 14.536982536315918, "learning_rate": 6.996042780748664e-06, "loss": 0.5017, "step": 56700 }, { "epoch": 0.30293333333333333, "grad_norm": 10.20271110534668, "learning_rate": 6.990695187165776e-06, "loss": 0.4533, "step": 56800 }, { "epoch": 0.30346666666666666, "grad_norm": 9.512530326843262, "learning_rate": 6.985347593582888e-06, "loss": 0.4434, "step": 56900 }, { "epoch": 0.304, "grad_norm": 13.13642692565918, "learning_rate": 6.98e-06, "loss": 0.4624, "step": 57000 }, { "epoch": 0.3045333333333333, "grad_norm": 13.14323616027832, "learning_rate": 6.974652406417113e-06, "loss": 0.4332, "step": 57100 }, { "epoch": 0.30506666666666665, "grad_norm": 6.8632707595825195, "learning_rate": 6.969304812834225e-06, "loss": 0.4814, "step": 57200 }, { "epoch": 0.3056, "grad_norm": 22.230234146118164, "learning_rate": 6.963957219251337e-06, "loss": 0.4513, "step": 57300 }, { "epoch": 0.3061333333333333, "grad_norm": 10.676624298095703, "learning_rate": 6.95860962566845e-06, "loss": 0.445, "step": 57400 }, { "epoch": 0.30666666666666664, "grad_norm": 9.06760025024414, "learning_rate": 6.9532620320855625e-06, "loss": 0.4455, "step": 57500 }, { "epoch": 0.3072, "grad_norm": 4.524609565734863, "learning_rate": 6.947914438502674e-06, "loss": 0.4766, "step": 57600 }, { "epoch": 0.30773333333333336, "grad_norm": 16.32733917236328, "learning_rate": 6.942566844919787e-06, "loss": 0.4708, "step": 57700 }, { "epoch": 0.3082666666666667, "grad_norm": 9.106210708618164, "learning_rate": 6.937219251336899e-06, "loss": 0.4366, "step": 57800 }, { "epoch": 0.3088, "grad_norm": 10.313011169433594, "learning_rate": 6.9318716577540114e-06, "loss": 0.4492, "step": 57900 }, { "epoch": 0.30933333333333335, "grad_norm": 14.24768352508545, "learning_rate": 6.926524064171124e-06, "loss": 0.4649, "step": 58000 }, { "epoch": 0.3098666666666667, "grad_norm": 6.7667341232299805, "learning_rate": 6.921176470588236e-06, "loss": 0.5127, "step": 58100 }, { "epoch": 0.3104, "grad_norm": 10.429145812988281, "learning_rate": 6.9158288770053485e-06, "loss": 0.4643, "step": 58200 }, { "epoch": 0.31093333333333334, "grad_norm": 7.309459686279297, "learning_rate": 6.91048128342246e-06, "loss": 0.4303, "step": 58300 }, { "epoch": 0.31146666666666667, "grad_norm": 9.676801681518555, "learning_rate": 6.905133689839573e-06, "loss": 0.4409, "step": 58400 }, { "epoch": 0.312, "grad_norm": 8.573541641235352, "learning_rate": 6.899786096256686e-06, "loss": 0.4692, "step": 58500 }, { "epoch": 0.31253333333333333, "grad_norm": 7.649514675140381, "learning_rate": 6.894438502673797e-06, "loss": 0.5029, "step": 58600 }, { "epoch": 0.31306666666666666, "grad_norm": 10.442986488342285, "learning_rate": 6.88909090909091e-06, "loss": 0.4769, "step": 58700 }, { "epoch": 0.3136, "grad_norm": 17.068300247192383, "learning_rate": 6.883743315508023e-06, "loss": 0.411, "step": 58800 }, { "epoch": 0.3141333333333333, "grad_norm": 5.534882068634033, "learning_rate": 6.878449197860964e-06, "loss": 0.4575, "step": 58900 }, { "epoch": 0.31466666666666665, "grad_norm": 14.431659698486328, "learning_rate": 6.873101604278075e-06, "loss": 0.4531, "step": 59000 }, { "epoch": 0.3152, "grad_norm": 10.42286491394043, "learning_rate": 6.867754010695188e-06, "loss": 0.4405, "step": 59100 }, { "epoch": 0.3157333333333333, "grad_norm": 14.349788665771484, "learning_rate": 6.862406417112299e-06, "loss": 0.4495, "step": 59200 }, { "epoch": 0.31626666666666664, "grad_norm": 8.400134086608887, "learning_rate": 6.857058823529412e-06, "loss": 0.4462, "step": 59300 }, { "epoch": 0.3168, "grad_norm": 12.449655532836914, "learning_rate": 6.8517112299465245e-06, "loss": 0.4738, "step": 59400 }, { "epoch": 0.31733333333333336, "grad_norm": 7.185305118560791, "learning_rate": 6.846363636363636e-06, "loss": 0.4844, "step": 59500 }, { "epoch": 0.3178666666666667, "grad_norm": 16.334962844848633, "learning_rate": 6.841016042780749e-06, "loss": 0.4617, "step": 59600 }, { "epoch": 0.3184, "grad_norm": 10.041500091552734, "learning_rate": 6.835668449197862e-06, "loss": 0.4575, "step": 59700 }, { "epoch": 0.31893333333333335, "grad_norm": 15.154574394226074, "learning_rate": 6.8303208556149735e-06, "loss": 0.4291, "step": 59800 }, { "epoch": 0.3194666666666667, "grad_norm": 5.808745384216309, "learning_rate": 6.824973262032086e-06, "loss": 0.4275, "step": 59900 }, { "epoch": 0.32, "grad_norm": 12.688112258911133, "learning_rate": 6.819625668449198e-06, "loss": 0.4449, "step": 60000 }, { "epoch": 0.32, "eval_test1_cer": 0.04866868324744193, "eval_test1_cer_norm": 0.03340936922227291, "eval_test1_loss": 0.18341723084449768, "eval_test1_runtime": 2694.5166, "eval_test1_samples_per_second": 0.928, "eval_test1_steps_per_second": 0.232, "eval_test1_wer": 0.14461063004752325, "eval_test1_wer_norm": 0.08691078056050731, "step": 60000 }, { "epoch": 0.32, "eval_test2_cer": 0.10514428640758577, "eval_test2_cer_norm": 0.08345599628137589, "eval_test2_loss": 0.31721410155296326, "eval_test2_runtime": 2743.4996, "eval_test2_samples_per_second": 0.911, "eval_test2_steps_per_second": 0.228, "eval_test2_wer": 0.22762645914396887, "eval_test2_wer_norm": 0.16278936511574604, "step": 60000 }, { "epoch": 0.32053333333333334, "grad_norm": 3.6791374683380127, "learning_rate": 6.8142780748663106e-06, "loss": 0.4507, "step": 60100 }, { "epoch": 0.32106666666666667, "grad_norm": 10.699987411499023, "learning_rate": 6.808930481283423e-06, "loss": 0.4567, "step": 60200 }, { "epoch": 0.3216, "grad_norm": 9.962234497070312, "learning_rate": 6.803582887700535e-06, "loss": 0.4668, "step": 60300 }, { "epoch": 0.3221333333333333, "grad_norm": 16.917518615722656, "learning_rate": 6.798235294117648e-06, "loss": 0.4595, "step": 60400 }, { "epoch": 0.32266666666666666, "grad_norm": 8.810348510742188, "learning_rate": 6.79288770053476e-06, "loss": 0.4314, "step": 60500 }, { "epoch": 0.3232, "grad_norm": 11.143001556396484, "learning_rate": 6.787540106951872e-06, "loss": 0.4153, "step": 60600 }, { "epoch": 0.3237333333333333, "grad_norm": 12.541175842285156, "learning_rate": 6.782192513368985e-06, "loss": 0.4586, "step": 60700 }, { "epoch": 0.32426666666666665, "grad_norm": 14.007206916809082, "learning_rate": 6.776844919786097e-06, "loss": 0.5048, "step": 60800 }, { "epoch": 0.3248, "grad_norm": 14.983810424804688, "learning_rate": 6.771497326203209e-06, "loss": 0.4259, "step": 60900 }, { "epoch": 0.3253333333333333, "grad_norm": 7.592294216156006, "learning_rate": 6.766149732620322e-06, "loss": 0.4366, "step": 61000 }, { "epoch": 0.3258666666666667, "grad_norm": 9.006990432739258, "learning_rate": 6.760855614973263e-06, "loss": 0.4363, "step": 61100 }, { "epoch": 0.3264, "grad_norm": 23.979963302612305, "learning_rate": 6.755508021390375e-06, "loss": 0.4393, "step": 61200 }, { "epoch": 0.32693333333333335, "grad_norm": 14.03022575378418, "learning_rate": 6.750160427807487e-06, "loss": 0.4684, "step": 61300 }, { "epoch": 0.3274666666666667, "grad_norm": 12.34038257598877, "learning_rate": 6.7448128342246e-06, "loss": 0.4628, "step": 61400 }, { "epoch": 0.328, "grad_norm": 9.196260452270508, "learning_rate": 6.739465240641712e-06, "loss": 0.4328, "step": 61500 }, { "epoch": 0.32853333333333334, "grad_norm": 9.980587005615234, "learning_rate": 6.7341176470588245e-06, "loss": 0.4382, "step": 61600 }, { "epoch": 0.3290666666666667, "grad_norm": 11.493073463439941, "learning_rate": 6.728770053475936e-06, "loss": 0.454, "step": 61700 }, { "epoch": 0.3296, "grad_norm": 16.30095863342285, "learning_rate": 6.723422459893049e-06, "loss": 0.4291, "step": 61800 }, { "epoch": 1.000464, "grad_norm": 8.01889705657959, "learning_rate": 6.718074866310162e-06, "loss": 0.4009, "step": 61900 }, { "epoch": 1.0009973333333333, "grad_norm": 24.891286849975586, "learning_rate": 6.712727272727273e-06, "loss": 0.438, "step": 62000 }, { "epoch": 1.0015306666666666, "grad_norm": 14.906014442443848, "learning_rate": 6.707379679144386e-06, "loss": 0.4316, "step": 62100 }, { "epoch": 1.002064, "grad_norm": 13.491738319396973, "learning_rate": 6.702032085561499e-06, "loss": 0.4021, "step": 62200 }, { "epoch": 1.0025973333333333, "grad_norm": 9.679520606994629, "learning_rate": 6.69668449197861e-06, "loss": 0.4368, "step": 62300 }, { "epoch": 1.0031306666666666, "grad_norm": 12.220060348510742, "learning_rate": 6.691336898395722e-06, "loss": 0.4132, "step": 62400 }, { "epoch": 1.003664, "grad_norm": 18.156707763671875, "learning_rate": 6.685989304812834e-06, "loss": 0.4207, "step": 62500 }, { "epoch": 1.0041973333333334, "grad_norm": 13.550061225891113, "learning_rate": 6.680641711229947e-06, "loss": 0.3895, "step": 62600 }, { "epoch": 1.0047306666666667, "grad_norm": 7.269731521606445, "learning_rate": 6.6752941176470595e-06, "loss": 0.4795, "step": 62700 }, { "epoch": 1.005264, "grad_norm": 7.41557502746582, "learning_rate": 6.669946524064171e-06, "loss": 0.4195, "step": 62800 }, { "epoch": 1.0057973333333334, "grad_norm": 7.0298027992248535, "learning_rate": 6.664598930481284e-06, "loss": 0.4185, "step": 62900 }, { "epoch": 1.0063306666666667, "grad_norm": 10.617578506469727, "learning_rate": 6.659251336898396e-06, "loss": 0.3864, "step": 63000 }, { "epoch": 1.006864, "grad_norm": 7.873201370239258, "learning_rate": 6.653903743315508e-06, "loss": 0.3964, "step": 63100 }, { "epoch": 1.0073973333333333, "grad_norm": 8.579327583312988, "learning_rate": 6.648556149732621e-06, "loss": 0.4043, "step": 63200 }, { "epoch": 1.0079306666666668, "grad_norm": 17.28508758544922, "learning_rate": 6.643208556149733e-06, "loss": 0.4283, "step": 63300 }, { "epoch": 1.008464, "grad_norm": 13.683415412902832, "learning_rate": 6.6378609625668455e-06, "loss": 0.4156, "step": 63400 }, { "epoch": 1.0089973333333333, "grad_norm": 17.157180786132812, "learning_rate": 6.632513368983958e-06, "loss": 0.4126, "step": 63500 }, { "epoch": 1.0095306666666666, "grad_norm": 12.841745376586914, "learning_rate": 6.62716577540107e-06, "loss": 0.4207, "step": 63600 }, { "epoch": 1.010064, "grad_norm": 9.953340530395508, "learning_rate": 6.621818181818183e-06, "loss": 0.4246, "step": 63700 }, { "epoch": 1.0105973333333333, "grad_norm": 10.627287864685059, "learning_rate": 6.6164705882352944e-06, "loss": 0.3994, "step": 63800 }, { "epoch": 1.0111306666666666, "grad_norm": 10.571039199829102, "learning_rate": 6.611122994652407e-06, "loss": 0.4326, "step": 63900 }, { "epoch": 1.011664, "grad_norm": 7.158795356750488, "learning_rate": 6.60577540106952e-06, "loss": 0.3624, "step": 64000 }, { "epoch": 1.0121973333333334, "grad_norm": 7.951521396636963, "learning_rate": 6.6004278074866316e-06, "loss": 0.4232, "step": 64100 }, { "epoch": 1.0127306666666667, "grad_norm": 6.954399108886719, "learning_rate": 6.595080213903744e-06, "loss": 0.3791, "step": 64200 }, { "epoch": 1.013264, "grad_norm": 10.882948875427246, "learning_rate": 6.589732620320857e-06, "loss": 0.4081, "step": 64300 }, { "epoch": 1.0137973333333334, "grad_norm": 8.992507934570312, "learning_rate": 6.584385026737969e-06, "loss": 0.4115, "step": 64400 }, { "epoch": 1.0143306666666667, "grad_norm": 11.477378845214844, "learning_rate": 6.579037433155081e-06, "loss": 0.4275, "step": 64500 }, { "epoch": 1.014864, "grad_norm": 8.451845169067383, "learning_rate": 6.573689839572192e-06, "loss": 0.4019, "step": 64600 }, { "epoch": 1.0153973333333333, "grad_norm": 8.40797233581543, "learning_rate": 6.568342245989305e-06, "loss": 0.3852, "step": 64700 }, { "epoch": 1.0159306666666668, "grad_norm": 12.756950378417969, "learning_rate": 6.5629946524064184e-06, "loss": 0.391, "step": 64800 }, { "epoch": 1.016464, "grad_norm": 13.6979341506958, "learning_rate": 6.557647058823529e-06, "loss": 0.3747, "step": 64900 }, { "epoch": 1.0169973333333333, "grad_norm": 15.006501197814941, "learning_rate": 6.552299465240642e-06, "loss": 0.3812, "step": 65000 }, { "epoch": 1.0175306666666666, "grad_norm": 11.619173049926758, "learning_rate": 6.547005347593584e-06, "loss": 0.3817, "step": 65100 }, { "epoch": 1.018064, "grad_norm": 13.194452285766602, "learning_rate": 6.541657754010697e-06, "loss": 0.3985, "step": 65200 }, { "epoch": 1.0185973333333334, "grad_norm": 15.73879623413086, "learning_rate": 6.536363636363638e-06, "loss": 0.3823, "step": 65300 }, { "epoch": 1.0191306666666666, "grad_norm": 8.490681648254395, "learning_rate": 6.531016042780749e-06, "loss": 0.3863, "step": 65400 }, { "epoch": 1.019664, "grad_norm": 12.528339385986328, "learning_rate": 6.525668449197862e-06, "loss": 0.392, "step": 65500 }, { "epoch": 1.0201973333333334, "grad_norm": 15.020143508911133, "learning_rate": 6.520320855614973e-06, "loss": 0.4093, "step": 65600 }, { "epoch": 1.0207306666666667, "grad_norm": 5.290862560272217, "learning_rate": 6.514973262032086e-06, "loss": 0.3739, "step": 65700 }, { "epoch": 1.021264, "grad_norm": 6.277044296264648, "learning_rate": 6.509625668449198e-06, "loss": 0.4066, "step": 65800 }, { "epoch": 1.0217973333333332, "grad_norm": 12.274043083190918, "learning_rate": 6.50427807486631e-06, "loss": 0.3504, "step": 65900 }, { "epoch": 1.0223306666666667, "grad_norm": 12.672940254211426, "learning_rate": 6.498930481283423e-06, "loss": 0.4149, "step": 66000 }, { "epoch": 1.022864, "grad_norm": 7.316371917724609, "learning_rate": 6.4935828877005355e-06, "loss": 0.3925, "step": 66100 }, { "epoch": 1.0233973333333333, "grad_norm": 12.97452449798584, "learning_rate": 6.488235294117647e-06, "loss": 0.4026, "step": 66200 }, { "epoch": 1.0239306666666668, "grad_norm": 12.279621124267578, "learning_rate": 6.48288770053476e-06, "loss": 0.4314, "step": 66300 }, { "epoch": 1.024464, "grad_norm": 10.550636291503906, "learning_rate": 6.477540106951872e-06, "loss": 0.3792, "step": 66400 }, { "epoch": 1.0249973333333333, "grad_norm": 12.550689697265625, "learning_rate": 6.472192513368984e-06, "loss": 0.3998, "step": 66500 }, { "epoch": 1.0255306666666666, "grad_norm": 10.33371639251709, "learning_rate": 6.466844919786097e-06, "loss": 0.4023, "step": 66600 }, { "epoch": 1.026064, "grad_norm": 15.445892333984375, "learning_rate": 6.461497326203209e-06, "loss": 0.3655, "step": 66700 }, { "epoch": 1.0265973333333334, "grad_norm": 12.017271041870117, "learning_rate": 6.4561497326203215e-06, "loss": 0.3922, "step": 66800 }, { "epoch": 1.0271306666666666, "grad_norm": 19.209487915039062, "learning_rate": 6.450802139037433e-06, "loss": 0.4502, "step": 66900 }, { "epoch": 1.027664, "grad_norm": 11.28745174407959, "learning_rate": 6.445454545454546e-06, "loss": 0.392, "step": 67000 }, { "epoch": 1.0281973333333334, "grad_norm": 15.452877044677734, "learning_rate": 6.440106951871659e-06, "loss": 0.421, "step": 67100 }, { "epoch": 1.0287306666666667, "grad_norm": 7.967385292053223, "learning_rate": 6.43475935828877e-06, "loss": 0.3747, "step": 67200 }, { "epoch": 1.029264, "grad_norm": 13.061688423156738, "learning_rate": 6.429411764705883e-06, "loss": 0.3845, "step": 67300 }, { "epoch": 1.0297973333333332, "grad_norm": 10.806388854980469, "learning_rate": 6.424117647058824e-06, "loss": 0.3954, "step": 67400 }, { "epoch": 1.0303306666666667, "grad_norm": 5.189377784729004, "learning_rate": 6.418770053475937e-06, "loss": 0.3906, "step": 67500 }, { "epoch": 1.030864, "grad_norm": 16.16989517211914, "learning_rate": 6.4134224598930486e-06, "loss": 0.3896, "step": 67600 }, { "epoch": 1.0313973333333333, "grad_norm": 12.614241600036621, "learning_rate": 6.408074866310161e-06, "loss": 0.4039, "step": 67700 }, { "epoch": 1.0319306666666668, "grad_norm": 9.501431465148926, "learning_rate": 6.402727272727274e-06, "loss": 0.3799, "step": 67800 }, { "epoch": 1.032464, "grad_norm": 10.362348556518555, "learning_rate": 6.397379679144386e-06, "loss": 0.4066, "step": 67900 }, { "epoch": 1.0329973333333333, "grad_norm": 11.942172050476074, "learning_rate": 6.392032085561498e-06, "loss": 0.3778, "step": 68000 }, { "epoch": 1.0335306666666666, "grad_norm": 8.966565132141113, "learning_rate": 6.38668449197861e-06, "loss": 0.3742, "step": 68100 }, { "epoch": 1.034064, "grad_norm": 11.575555801391602, "learning_rate": 6.381336898395723e-06, "loss": 0.3807, "step": 68200 }, { "epoch": 1.0345973333333334, "grad_norm": 9.042731285095215, "learning_rate": 6.3759893048128355e-06, "loss": 0.3917, "step": 68300 }, { "epoch": 1.0351306666666666, "grad_norm": 7.102235794067383, "learning_rate": 6.370641711229946e-06, "loss": 0.4025, "step": 68400 }, { "epoch": 1.035664, "grad_norm": 14.31166934967041, "learning_rate": 6.36529411764706e-06, "loss": 0.3925, "step": 68500 }, { "epoch": 1.0361973333333334, "grad_norm": 10.547873497009277, "learning_rate": 6.359946524064171e-06, "loss": 0.3919, "step": 68600 }, { "epoch": 1.0367306666666667, "grad_norm": 10.94647216796875, "learning_rate": 6.3545989304812835e-06, "loss": 0.3996, "step": 68700 }, { "epoch": 1.037264, "grad_norm": 9.351258277893066, "learning_rate": 6.349251336898396e-06, "loss": 0.3652, "step": 68800 }, { "epoch": 1.0377973333333332, "grad_norm": 6.94196891784668, "learning_rate": 6.343903743315508e-06, "loss": 0.4131, "step": 68900 }, { "epoch": 1.0383306666666667, "grad_norm": 11.368610382080078, "learning_rate": 6.338556149732621e-06, "loss": 0.3889, "step": 69000 }, { "epoch": 1.038864, "grad_norm": 12.075126647949219, "learning_rate": 6.333208556149733e-06, "loss": 0.379, "step": 69100 }, { "epoch": 1.0393973333333333, "grad_norm": 12.59950065612793, "learning_rate": 6.327860962566845e-06, "loss": 0.379, "step": 69200 }, { "epoch": 1.0399306666666668, "grad_norm": 10.643357276916504, "learning_rate": 6.322513368983958e-06, "loss": 0.341, "step": 69300 }, { "epoch": 1.040464, "grad_norm": 20.357084274291992, "learning_rate": 6.3171657754010696e-06, "loss": 0.3611, "step": 69400 }, { "epoch": 1.0409973333333333, "grad_norm": 13.733820915222168, "learning_rate": 6.311818181818182e-06, "loss": 0.3912, "step": 69500 }, { "epoch": 1.0415306666666666, "grad_norm": 10.072883605957031, "learning_rate": 6.306470588235295e-06, "loss": 0.3582, "step": 69600 }, { "epoch": 1.042064, "grad_norm": 7.564662933349609, "learning_rate": 6.301122994652407e-06, "loss": 0.3507, "step": 69700 }, { "epoch": 1.0425973333333334, "grad_norm": 8.13917064666748, "learning_rate": 6.295775401069519e-06, "loss": 0.3654, "step": 69800 }, { "epoch": 1.0431306666666667, "grad_norm": 11.081501007080078, "learning_rate": 6.290427807486632e-06, "loss": 0.4059, "step": 69900 }, { "epoch": 1.043664, "grad_norm": 20.92840003967285, "learning_rate": 6.285133689839573e-06, "loss": 0.3522, "step": 70000 }, { "epoch": 1.0441973333333334, "grad_norm": 7.935949325561523, "learning_rate": 6.279786096256685e-06, "loss": 0.3801, "step": 70100 }, { "epoch": 1.0447306666666667, "grad_norm": 6.803170204162598, "learning_rate": 6.2744385026737975e-06, "loss": 0.36, "step": 70200 }, { "epoch": 1.045264, "grad_norm": 12.373359680175781, "learning_rate": 6.269090909090909e-06, "loss": 0.412, "step": 70300 }, { "epoch": 1.0457973333333332, "grad_norm": 8.915419578552246, "learning_rate": 6.263743315508022e-06, "loss": 0.3508, "step": 70400 }, { "epoch": 1.0463306666666667, "grad_norm": 4.754815101623535, "learning_rate": 6.258395721925135e-06, "loss": 0.3562, "step": 70500 }, { "epoch": 1.046864, "grad_norm": 14.02380084991455, "learning_rate": 6.253048128342246e-06, "loss": 0.3957, "step": 70600 }, { "epoch": 1.0473973333333333, "grad_norm": 11.928275108337402, "learning_rate": 6.247700534759359e-06, "loss": 0.3588, "step": 70700 }, { "epoch": 1.0479306666666666, "grad_norm": 11.005744934082031, "learning_rate": 6.242352941176472e-06, "loss": 0.3721, "step": 70800 }, { "epoch": 1.048464, "grad_norm": 19.670007705688477, "learning_rate": 6.2370053475935835e-06, "loss": 0.3716, "step": 70900 }, { "epoch": 1.0489973333333333, "grad_norm": 11.530438423156738, "learning_rate": 6.231657754010696e-06, "loss": 0.3986, "step": 71000 }, { "epoch": 1.0495306666666666, "grad_norm": 8.421469688415527, "learning_rate": 6.226310160427808e-06, "loss": 0.3893, "step": 71100 }, { "epoch": 1.0500639999999999, "grad_norm": 11.619662284851074, "learning_rate": 6.220962566844921e-06, "loss": 0.3741, "step": 71200 }, { "epoch": 1.0505973333333334, "grad_norm": 10.198265075683594, "learning_rate": 6.215614973262033e-06, "loss": 0.3638, "step": 71300 }, { "epoch": 1.0511306666666667, "grad_norm": 11.96955680847168, "learning_rate": 6.210267379679144e-06, "loss": 0.3764, "step": 71400 }, { "epoch": 1.051664, "grad_norm": 9.121621131896973, "learning_rate": 6.204919786096258e-06, "loss": 0.3614, "step": 71500 }, { "epoch": 1.0521973333333334, "grad_norm": 11.102771759033203, "learning_rate": 6.199572192513369e-06, "loss": 0.4096, "step": 71600 }, { "epoch": 1.0527306666666667, "grad_norm": 12.600746154785156, "learning_rate": 6.194224598930481e-06, "loss": 0.3824, "step": 71700 }, { "epoch": 1.053264, "grad_norm": 8.527264595031738, "learning_rate": 6.188877005347594e-06, "loss": 0.3952, "step": 71800 }, { "epoch": 1.0537973333333333, "grad_norm": 16.454973220825195, "learning_rate": 6.183529411764706e-06, "loss": 0.3736, "step": 71900 }, { "epoch": 1.0543306666666667, "grad_norm": 9.620329856872559, "learning_rate": 6.1781818181818185e-06, "loss": 0.4109, "step": 72000 }, { "epoch": 1.0543306666666667, "eval_test1_cer": 0.04738031219657928, "eval_test1_cer_norm": 0.03189665522126444, "eval_test1_loss": 0.18150056898593903, "eval_test1_runtime": 1658.3423, "eval_test1_samples_per_second": 1.508, "eval_test1_steps_per_second": 0.377, "eval_test1_wer": 0.14347357065803668, "eval_test1_wer_norm": 0.0838423098278734, "step": 72000 }, { "epoch": 1.0543306666666667, "eval_test2_cer": 0.10914809422481055, "eval_test2_cer_norm": 0.08456964673070964, "eval_test2_loss": 0.3121275007724762, "eval_test2_runtime": 1698.2451, "eval_test2_samples_per_second": 1.472, "eval_test2_steps_per_second": 0.368, "eval_test2_wer": 0.23277637903410392, "eval_test2_wer_norm": 0.16860531744212698, "step": 72000 }, { "epoch": 1.054864, "grad_norm": 13.338208198547363, "learning_rate": 6.172834224598931e-06, "loss": 0.3837, "step": 72100 }, { "epoch": 1.0553973333333333, "grad_norm": 7.34108829498291, "learning_rate": 6.167486631016043e-06, "loss": 0.3472, "step": 72200 }, { "epoch": 1.0559306666666666, "grad_norm": 18.05777359008789, "learning_rate": 6.162139037433156e-06, "loss": 0.4037, "step": 72300 }, { "epoch": 1.056464, "grad_norm": 24.627025604248047, "learning_rate": 6.156791443850267e-06, "loss": 0.3559, "step": 72400 }, { "epoch": 1.0569973333333333, "grad_norm": 5.6719069480896, "learning_rate": 6.15144385026738e-06, "loss": 0.3502, "step": 72500 }, { "epoch": 1.0575306666666666, "grad_norm": 10.830897331237793, "learning_rate": 6.146096256684493e-06, "loss": 0.386, "step": 72600 }, { "epoch": 1.058064, "grad_norm": 5.048905372619629, "learning_rate": 6.140802139037434e-06, "loss": 0.3712, "step": 72700 }, { "epoch": 1.0585973333333334, "grad_norm": 9.091572761535645, "learning_rate": 6.1354545454545455e-06, "loss": 0.3572, "step": 72800 }, { "epoch": 1.0591306666666667, "grad_norm": 6.825081825256348, "learning_rate": 6.130106951871658e-06, "loss": 0.3854, "step": 72900 }, { "epoch": 1.059664, "grad_norm": 6.429799556732178, "learning_rate": 6.124759358288771e-06, "loss": 0.3922, "step": 73000 }, { "epoch": 1.0601973333333334, "grad_norm": 10.965849876403809, "learning_rate": 6.119411764705883e-06, "loss": 0.391, "step": 73100 }, { "epoch": 1.0607306666666667, "grad_norm": 3.0901551246643066, "learning_rate": 6.114064171122995e-06, "loss": 0.3702, "step": 73200 }, { "epoch": 1.061264, "grad_norm": 13.8071870803833, "learning_rate": 6.108716577540107e-06, "loss": 0.3916, "step": 73300 }, { "epoch": 1.0617973333333333, "grad_norm": 7.512209415435791, "learning_rate": 6.10336898395722e-06, "loss": 0.3661, "step": 73400 }, { "epoch": 1.0623306666666668, "grad_norm": 5.2417192459106445, "learning_rate": 6.0980213903743324e-06, "loss": 0.3683, "step": 73500 }, { "epoch": 1.062864, "grad_norm": 5.9413299560546875, "learning_rate": 6.092673796791444e-06, "loss": 0.3562, "step": 73600 }, { "epoch": 1.0633973333333333, "grad_norm": 10.632054328918457, "learning_rate": 6.087326203208557e-06, "loss": 0.3701, "step": 73700 }, { "epoch": 1.0639306666666666, "grad_norm": 13.87745189666748, "learning_rate": 6.0819786096256695e-06, "loss": 0.3586, "step": 73800 }, { "epoch": 1.064464, "grad_norm": 12.736011505126953, "learning_rate": 6.076631016042781e-06, "loss": 0.3792, "step": 73900 }, { "epoch": 1.0649973333333334, "grad_norm": 27.97041130065918, "learning_rate": 6.071283422459894e-06, "loss": 0.3879, "step": 74000 }, { "epoch": 1.0655306666666666, "grad_norm": 14.216285705566406, "learning_rate": 6.065935828877005e-06, "loss": 0.3938, "step": 74100 }, { "epoch": 1.066064, "grad_norm": 14.331228256225586, "learning_rate": 6.0605882352941185e-06, "loss": 0.3837, "step": 74200 }, { "epoch": 1.0665973333333334, "grad_norm": 7.431007385253906, "learning_rate": 6.055240641711231e-06, "loss": 0.3497, "step": 74300 }, { "epoch": 1.0671306666666667, "grad_norm": 10.472851753234863, "learning_rate": 6.049893048128342e-06, "loss": 0.3689, "step": 74400 }, { "epoch": 1.067664, "grad_norm": 9.100927352905273, "learning_rate": 6.044545454545456e-06, "loss": 0.3989, "step": 74500 }, { "epoch": 1.0681973333333334, "grad_norm": 11.27919864654541, "learning_rate": 6.039197860962568e-06, "loss": 0.3783, "step": 74600 }, { "epoch": 1.0687306666666667, "grad_norm": 9.852141380310059, "learning_rate": 6.033850267379679e-06, "loss": 0.395, "step": 74700 }, { "epoch": 1.069264, "grad_norm": 7.077015399932861, "learning_rate": 6.028502673796792e-06, "loss": 0.3925, "step": 74800 }, { "epoch": 1.0697973333333333, "grad_norm": 11.446548461914062, "learning_rate": 6.023155080213904e-06, "loss": 0.3978, "step": 74900 }, { "epoch": 1.0703306666666668, "grad_norm": 20.403011322021484, "learning_rate": 6.017807486631016e-06, "loss": 0.4026, "step": 75000 }, { "epoch": 1.070864, "grad_norm": 9.752445220947266, "learning_rate": 6.012513368983957e-06, "loss": 0.3652, "step": 75100 }, { "epoch": 1.0713973333333333, "grad_norm": 4.777536869049072, "learning_rate": 6.00716577540107e-06, "loss": 0.3634, "step": 75200 }, { "epoch": 1.0719306666666666, "grad_norm": 23.581727981567383, "learning_rate": 6.001818181818182e-06, "loss": 0.3781, "step": 75300 }, { "epoch": 1.072464, "grad_norm": 10.013482093811035, "learning_rate": 5.9964705882352945e-06, "loss": 0.3586, "step": 75400 }, { "epoch": 1.0729973333333334, "grad_norm": 15.634265899658203, "learning_rate": 5.991122994652407e-06, "loss": 0.3831, "step": 75500 }, { "epoch": 1.0735306666666666, "grad_norm": 12.190671920776367, "learning_rate": 5.985775401069519e-06, "loss": 0.3297, "step": 75600 }, { "epoch": 1.074064, "grad_norm": 18.373353958129883, "learning_rate": 5.9804278074866316e-06, "loss": 0.3411, "step": 75700 }, { "epoch": 1.0745973333333334, "grad_norm": 10.963550567626953, "learning_rate": 5.975080213903743e-06, "loss": 0.4113, "step": 75800 }, { "epoch": 1.0751306666666667, "grad_norm": 25.272197723388672, "learning_rate": 5.969732620320856e-06, "loss": 0.4078, "step": 75900 }, { "epoch": 1.075664, "grad_norm": 3.2908997535705566, "learning_rate": 5.964385026737969e-06, "loss": 0.3683, "step": 76000 }, { "epoch": 1.0761973333333335, "grad_norm": 13.810895919799805, "learning_rate": 5.9590374331550805e-06, "loss": 0.3469, "step": 76100 }, { "epoch": 1.0767306666666667, "grad_norm": 13.081459045410156, "learning_rate": 5.953689839572193e-06, "loss": 0.394, "step": 76200 }, { "epoch": 1.077264, "grad_norm": 24.026365280151367, "learning_rate": 5.948342245989305e-06, "loss": 0.3492, "step": 76300 }, { "epoch": 1.0777973333333333, "grad_norm": 12.764817237854004, "learning_rate": 5.942994652406418e-06, "loss": 0.4015, "step": 76400 }, { "epoch": 1.0783306666666668, "grad_norm": 6.846892356872559, "learning_rate": 5.93764705882353e-06, "loss": 0.3848, "step": 76500 }, { "epoch": 1.078864, "grad_norm": 7.06205940246582, "learning_rate": 5.932299465240642e-06, "loss": 0.3181, "step": 76600 }, { "epoch": 1.0793973333333333, "grad_norm": 5.953244209289551, "learning_rate": 5.926951871657755e-06, "loss": 0.3923, "step": 76700 }, { "epoch": 1.0799306666666666, "grad_norm": 7.950570583343506, "learning_rate": 5.921604278074867e-06, "loss": 0.3952, "step": 76800 }, { "epoch": 1.080464, "grad_norm": 7.693545341491699, "learning_rate": 5.916256684491979e-06, "loss": 0.3513, "step": 76900 }, { "epoch": 1.0809973333333334, "grad_norm": 21.662120819091797, "learning_rate": 5.910909090909092e-06, "loss": 0.3861, "step": 77000 }, { "epoch": 1.0815306666666666, "grad_norm": 12.035287857055664, "learning_rate": 5.905561497326203e-06, "loss": 0.3808, "step": 77100 }, { "epoch": 1.082064, "grad_norm": 7.51136589050293, "learning_rate": 5.900213903743316e-06, "loss": 0.3734, "step": 77200 }, { "epoch": 1.0825973333333334, "grad_norm": 4.4861626625061035, "learning_rate": 5.894866310160429e-06, "loss": 0.384, "step": 77300 }, { "epoch": 1.0831306666666667, "grad_norm": 19.815528869628906, "learning_rate": 5.88951871657754e-06, "loss": 0.3506, "step": 77400 }, { "epoch": 1.083664, "grad_norm": 9.573968887329102, "learning_rate": 5.8841711229946526e-06, "loss": 0.3634, "step": 77500 }, { "epoch": 1.0841973333333332, "grad_norm": 9.915514945983887, "learning_rate": 5.878823529411766e-06, "loss": 0.3758, "step": 77600 }, { "epoch": 1.0847306666666667, "grad_norm": 9.287152290344238, "learning_rate": 5.873475935828877e-06, "loss": 0.3686, "step": 77700 }, { "epoch": 1.085264, "grad_norm": 13.888936042785645, "learning_rate": 5.86812834224599e-06, "loss": 0.3608, "step": 77800 }, { "epoch": 1.0857973333333333, "grad_norm": 16.346073150634766, "learning_rate": 5.8627807486631015e-06, "loss": 0.3638, "step": 77900 }, { "epoch": 1.0863306666666666, "grad_norm": 7.307489395141602, "learning_rate": 5.857433155080214e-06, "loss": 0.3433, "step": 78000 }, { "epoch": 1.086864, "grad_norm": 7.100262641906738, "learning_rate": 5.852139037433155e-06, "loss": 0.3513, "step": 78100 }, { "epoch": 1.0873973333333333, "grad_norm": 6.3530192375183105, "learning_rate": 5.846791443850268e-06, "loss": 0.3419, "step": 78200 }, { "epoch": 1.0879306666666666, "grad_norm": 16.299867630004883, "learning_rate": 5.84144385026738e-06, "loss": 0.3848, "step": 78300 }, { "epoch": 1.088464, "grad_norm": 12.678897857666016, "learning_rate": 5.836096256684492e-06, "loss": 0.3652, "step": 78400 }, { "epoch": 1.0889973333333334, "grad_norm": 5.671292304992676, "learning_rate": 5.830748663101605e-06, "loss": 0.3753, "step": 78500 }, { "epoch": 1.0895306666666666, "grad_norm": 6.488846302032471, "learning_rate": 5.825401069518717e-06, "loss": 0.352, "step": 78600 }, { "epoch": 1.090064, "grad_norm": 8.217711448669434, "learning_rate": 5.820053475935829e-06, "loss": 0.3624, "step": 78700 }, { "epoch": 1.0905973333333334, "grad_norm": 5.695668697357178, "learning_rate": 5.814705882352941e-06, "loss": 0.3398, "step": 78800 }, { "epoch": 1.0911306666666667, "grad_norm": 14.092303276062012, "learning_rate": 5.809358288770054e-06, "loss": 0.3622, "step": 78900 }, { "epoch": 1.091664, "grad_norm": 6.068267822265625, "learning_rate": 5.8040106951871665e-06, "loss": 0.3744, "step": 79000 }, { "epoch": 1.0921973333333332, "grad_norm": 13.035170555114746, "learning_rate": 5.798663101604278e-06, "loss": 0.3909, "step": 79100 }, { "epoch": 1.0927306666666667, "grad_norm": 10.430931091308594, "learning_rate": 5.793315508021391e-06, "loss": 0.3343, "step": 79200 }, { "epoch": 1.093264, "grad_norm": 7.0859832763671875, "learning_rate": 5.787967914438504e-06, "loss": 0.3733, "step": 79300 }, { "epoch": 1.0937973333333333, "grad_norm": 15.03085708618164, "learning_rate": 5.7826203208556154e-06, "loss": 0.3683, "step": 79400 }, { "epoch": 1.0943306666666666, "grad_norm": 8.11173152923584, "learning_rate": 5.777272727272728e-06, "loss": 0.3536, "step": 79500 }, { "epoch": 1.094864, "grad_norm": 6.193539142608643, "learning_rate": 5.77192513368984e-06, "loss": 0.3682, "step": 79600 }, { "epoch": 1.0953973333333333, "grad_norm": 13.29383659362793, "learning_rate": 5.7665775401069526e-06, "loss": 0.4205, "step": 79700 }, { "epoch": 1.0959306666666666, "grad_norm": 7.964110851287842, "learning_rate": 5.761229946524065e-06, "loss": 0.3709, "step": 79800 }, { "epoch": 1.096464, "grad_norm": 16.39187240600586, "learning_rate": 5.755882352941177e-06, "loss": 0.346, "step": 79900 }, { "epoch": 1.0969973333333334, "grad_norm": 10.607369422912598, "learning_rate": 5.75053475935829e-06, "loss": 0.3664, "step": 80000 }, { "epoch": 1.0975306666666667, "grad_norm": 10.523303031921387, "learning_rate": 5.745187165775401e-06, "loss": 0.3388, "step": 80100 }, { "epoch": 1.098064, "grad_norm": 11.562132835388184, "learning_rate": 5.739893048128343e-06, "loss": 0.3519, "step": 80200 }, { "epoch": 1.0985973333333334, "grad_norm": 11.507698059082031, "learning_rate": 5.734545454545455e-06, "loss": 0.3784, "step": 80300 }, { "epoch": 1.0991306666666667, "grad_norm": 7.096197128295898, "learning_rate": 5.729197860962568e-06, "loss": 0.3754, "step": 80400 }, { "epoch": 1.099664, "grad_norm": 7.397789001464844, "learning_rate": 5.723850267379679e-06, "loss": 0.3548, "step": 80500 }, { "epoch": 1.1001973333333332, "grad_norm": 14.025452613830566, "learning_rate": 5.718502673796792e-06, "loss": 0.3375, "step": 80600 }, { "epoch": 1.1007306666666667, "grad_norm": 14.858177185058594, "learning_rate": 5.713155080213905e-06, "loss": 0.3645, "step": 80700 }, { "epoch": 1.101264, "grad_norm": 9.403532981872559, "learning_rate": 5.707807486631016e-06, "loss": 0.3577, "step": 80800 }, { "epoch": 1.1017973333333333, "grad_norm": 6.583309173583984, "learning_rate": 5.702459893048129e-06, "loss": 0.3466, "step": 80900 }, { "epoch": 1.1023306666666666, "grad_norm": 14.58948802947998, "learning_rate": 5.69711229946524e-06, "loss": 0.3359, "step": 81000 }, { "epoch": 1.102864, "grad_norm": 10.651206970214844, "learning_rate": 5.691764705882353e-06, "loss": 0.3739, "step": 81100 }, { "epoch": 1.1033973333333333, "grad_norm": 4.92773962020874, "learning_rate": 5.686417112299466e-06, "loss": 0.3484, "step": 81200 }, { "epoch": 1.1039306666666666, "grad_norm": 5.0526533126831055, "learning_rate": 5.6810695187165775e-06, "loss": 0.3254, "step": 81300 }, { "epoch": 1.1044640000000001, "grad_norm": 13.261932373046875, "learning_rate": 5.67572192513369e-06, "loss": 0.3505, "step": 81400 }, { "epoch": 1.1049973333333334, "grad_norm": 6.491238117218018, "learning_rate": 5.670374331550803e-06, "loss": 0.3857, "step": 81500 }, { "epoch": 1.1055306666666667, "grad_norm": 9.596540451049805, "learning_rate": 5.665026737967915e-06, "loss": 0.3687, "step": 81600 }, { "epoch": 1.106064, "grad_norm": 11.326090812683105, "learning_rate": 5.659679144385027e-06, "loss": 0.3226, "step": 81700 }, { "epoch": 1.1065973333333334, "grad_norm": 8.677849769592285, "learning_rate": 5.654331550802139e-06, "loss": 0.3494, "step": 81800 }, { "epoch": 1.1071306666666667, "grad_norm": 16.48798370361328, "learning_rate": 5.648983957219252e-06, "loss": 0.3419, "step": 81900 }, { "epoch": 1.107664, "grad_norm": 19.157012939453125, "learning_rate": 5.643636363636364e-06, "loss": 0.3575, "step": 82000 }, { "epoch": 1.1081973333333333, "grad_norm": 8.623451232910156, "learning_rate": 5.638288770053476e-06, "loss": 0.3838, "step": 82100 }, { "epoch": 1.1087306666666668, "grad_norm": 6.455203533172607, "learning_rate": 5.632941176470589e-06, "loss": 0.3532, "step": 82200 }, { "epoch": 1.109264, "grad_norm": 11.587851524353027, "learning_rate": 5.6275935828877015e-06, "loss": 0.3585, "step": 82300 }, { "epoch": 1.1097973333333333, "grad_norm": 8.229243278503418, "learning_rate": 5.622245989304813e-06, "loss": 0.3375, "step": 82400 }, { "epoch": 1.1103306666666666, "grad_norm": 11.870606422424316, "learning_rate": 5.616898395721926e-06, "loss": 0.3708, "step": 82500 }, { "epoch": 1.110864, "grad_norm": 11.669835090637207, "learning_rate": 5.611550802139038e-06, "loss": 0.3462, "step": 82600 }, { "epoch": 1.1113973333333333, "grad_norm": 6.647871971130371, "learning_rate": 5.60620320855615e-06, "loss": 0.3243, "step": 82700 }, { "epoch": 1.1119306666666666, "grad_norm": 7.893047332763672, "learning_rate": 5.600855614973263e-06, "loss": 0.3662, "step": 82800 }, { "epoch": 1.112464, "grad_norm": 9.985371589660645, "learning_rate": 5.595508021390375e-06, "loss": 0.3208, "step": 82900 }, { "epoch": 1.1129973333333334, "grad_norm": 11.6475248336792, "learning_rate": 5.5901604278074875e-06, "loss": 0.3656, "step": 83000 }, { "epoch": 1.1135306666666667, "grad_norm": 12.75544548034668, "learning_rate": 5.5848128342245985e-06, "loss": 0.3497, "step": 83100 }, { "epoch": 1.114064, "grad_norm": 14.13318157196045, "learning_rate": 5.579465240641712e-06, "loss": 0.3605, "step": 83200 }, { "epoch": 1.1145973333333332, "grad_norm": 10.178326606750488, "learning_rate": 5.574117647058825e-06, "loss": 0.361, "step": 83300 }, { "epoch": 1.1151306666666667, "grad_norm": 10.557178497314453, "learning_rate": 5.568770053475936e-06, "loss": 0.3364, "step": 83400 }, { "epoch": 1.115664, "grad_norm": 7.469850063323975, "learning_rate": 5.563422459893048e-06, "loss": 0.3315, "step": 83500 }, { "epoch": 1.1161973333333333, "grad_norm": 10.68677043914795, "learning_rate": 5.558074866310162e-06, "loss": 0.3303, "step": 83600 }, { "epoch": 1.1167306666666668, "grad_norm": 5.957833766937256, "learning_rate": 5.552727272727273e-06, "loss": 0.3603, "step": 83700 }, { "epoch": 1.117264, "grad_norm": 10.615058898925781, "learning_rate": 5.547379679144385e-06, "loss": 0.3285, "step": 83800 }, { "epoch": 1.1177973333333333, "grad_norm": 9.704463005065918, "learning_rate": 5.542032085561497e-06, "loss": 0.3767, "step": 83900 }, { "epoch": 1.1183306666666666, "grad_norm": 9.90696907043457, "learning_rate": 5.53668449197861e-06, "loss": 0.3264, "step": 84000 }, { "epoch": 1.1183306666666666, "eval_test1_cer": 0.041629322578235865, "eval_test1_cer_norm": 0.027363315484908876, "eval_test1_loss": 0.17611142992973328, "eval_test1_runtime": 2661.1205, "eval_test1_samples_per_second": 0.939, "eval_test1_steps_per_second": 0.235, "eval_test1_wer": 0.13210297676317093, "eval_test1_wer_norm": 0.07396475642187089, "step": 84000 }, { "epoch": 1.1183306666666666, "eval_test2_cer": 0.09565274200171725, "eval_test2_cer_norm": 0.07518593120545398, "eval_test2_loss": 0.3062795102596283, "eval_test2_runtime": 2726.1479, "eval_test2_samples_per_second": 0.917, "eval_test2_steps_per_second": 0.229, "eval_test2_wer": 0.2178702220187686, "eval_test2_wer_norm": 0.1530770112308045, "step": 84000 }, { "epoch": 1.118864, "grad_norm": 15.535079002380371, "learning_rate": 5.5313368983957225e-06, "loss": 0.3942, "step": 84100 }, { "epoch": 1.1193973333333334, "grad_norm": 10.114559173583984, "learning_rate": 5.525989304812834e-06, "loss": 0.3512, "step": 84200 }, { "epoch": 1.1199306666666666, "grad_norm": 13.750226020812988, "learning_rate": 5.520695187165775e-06, "loss": 0.3572, "step": 84300 }, { "epoch": 1.120464, "grad_norm": 7.692011833190918, "learning_rate": 5.515347593582888e-06, "loss": 0.3384, "step": 84400 }, { "epoch": 1.1209973333333334, "grad_norm": 9.425834655761719, "learning_rate": 5.510000000000001e-06, "loss": 0.3664, "step": 84500 }, { "epoch": 1.1215306666666667, "grad_norm": 10.21385669708252, "learning_rate": 5.504652406417112e-06, "loss": 0.3463, "step": 84600 }, { "epoch": 1.122064, "grad_norm": 8.388919830322266, "learning_rate": 5.499304812834225e-06, "loss": 0.3698, "step": 84700 }, { "epoch": 1.1225973333333332, "grad_norm": 7.960059642791748, "learning_rate": 5.493957219251337e-06, "loss": 0.3544, "step": 84800 }, { "epoch": 1.1231306666666667, "grad_norm": 13.299338340759277, "learning_rate": 5.4886096256684495e-06, "loss": 0.368, "step": 84900 }, { "epoch": 1.123664, "grad_norm": 11.450257301330566, "learning_rate": 5.483262032085562e-06, "loss": 0.3726, "step": 85000 }, { "epoch": 1.1241973333333333, "grad_norm": 5.443023204803467, "learning_rate": 5.477914438502674e-06, "loss": 0.3436, "step": 85100 }, { "epoch": 1.1247306666666668, "grad_norm": 8.407721519470215, "learning_rate": 5.472566844919787e-06, "loss": 0.3236, "step": 85200 }, { "epoch": 1.125264, "grad_norm": 5.793272972106934, "learning_rate": 5.467219251336899e-06, "loss": 0.3239, "step": 85300 }, { "epoch": 1.1257973333333333, "grad_norm": 9.791266441345215, "learning_rate": 5.461871657754011e-06, "loss": 0.3244, "step": 85400 }, { "epoch": 1.1263306666666666, "grad_norm": 11.078914642333984, "learning_rate": 5.456577540106952e-06, "loss": 0.3339, "step": 85500 }, { "epoch": 1.126864, "grad_norm": 16.480493545532227, "learning_rate": 5.451229946524065e-06, "loss": 0.3758, "step": 85600 }, { "epoch": 1.1273973333333334, "grad_norm": 5.808441162109375, "learning_rate": 5.445882352941177e-06, "loss": 0.3309, "step": 85700 }, { "epoch": 1.1279306666666666, "grad_norm": 12.499751091003418, "learning_rate": 5.440534759358289e-06, "loss": 0.3602, "step": 85800 }, { "epoch": 1.128464, "grad_norm": 10.482662200927734, "learning_rate": 5.435187165775402e-06, "loss": 0.3764, "step": 85900 }, { "epoch": 1.1289973333333334, "grad_norm": 9.726727485656738, "learning_rate": 5.429839572192514e-06, "loss": 0.3571, "step": 86000 }, { "epoch": 1.1295306666666667, "grad_norm": 4.967637062072754, "learning_rate": 5.424491978609626e-06, "loss": 0.3321, "step": 86100 }, { "epoch": 1.130064, "grad_norm": 8.93745231628418, "learning_rate": 5.419144385026739e-06, "loss": 0.354, "step": 86200 }, { "epoch": 1.1305973333333332, "grad_norm": 17.383033752441406, "learning_rate": 5.413796791443851e-06, "loss": 0.3272, "step": 86300 }, { "epoch": 1.1311306666666667, "grad_norm": 16.366558074951172, "learning_rate": 5.4084491978609635e-06, "loss": 0.3703, "step": 86400 }, { "epoch": 1.131664, "grad_norm": 21.088577270507812, "learning_rate": 5.4031016042780744e-06, "loss": 0.3735, "step": 86500 }, { "epoch": 1.1321973333333333, "grad_norm": 5.6454572677612305, "learning_rate": 5.397754010695188e-06, "loss": 0.3562, "step": 86600 }, { "epoch": 1.1327306666666668, "grad_norm": 3.681288242340088, "learning_rate": 5.392406417112301e-06, "loss": 0.3482, "step": 86700 }, { "epoch": 1.133264, "grad_norm": 8.351349830627441, "learning_rate": 5.3870588235294116e-06, "loss": 0.3439, "step": 86800 }, { "epoch": 1.1337973333333333, "grad_norm": 9.239534378051758, "learning_rate": 5.381711229946524e-06, "loss": 0.353, "step": 86900 }, { "epoch": 1.1343306666666666, "grad_norm": 9.00024700164795, "learning_rate": 5.376363636363638e-06, "loss": 0.3577, "step": 87000 }, { "epoch": 1.134864, "grad_norm": 5.382028579711914, "learning_rate": 5.371016042780749e-06, "loss": 0.3799, "step": 87100 }, { "epoch": 1.1353973333333334, "grad_norm": 9.432782173156738, "learning_rate": 5.365668449197861e-06, "loss": 0.3449, "step": 87200 }, { "epoch": 1.1359306666666666, "grad_norm": 10.193337440490723, "learning_rate": 5.360320855614973e-06, "loss": 0.3254, "step": 87300 }, { "epoch": 1.136464, "grad_norm": 10.101122856140137, "learning_rate": 5.354973262032086e-06, "loss": 0.3297, "step": 87400 }, { "epoch": 1.1369973333333334, "grad_norm": 9.72788143157959, "learning_rate": 5.3496256684491984e-06, "loss": 0.3454, "step": 87500 }, { "epoch": 1.1375306666666667, "grad_norm": 7.303418159484863, "learning_rate": 5.34427807486631e-06, "loss": 0.3717, "step": 87600 }, { "epoch": 1.138064, "grad_norm": 6.37116813659668, "learning_rate": 5.338930481283423e-06, "loss": 0.3687, "step": 87700 }, { "epoch": 1.1385973333333332, "grad_norm": 13.624775886535645, "learning_rate": 5.333582887700535e-06, "loss": 0.3454, "step": 87800 }, { "epoch": 1.1391306666666667, "grad_norm": 7.932929515838623, "learning_rate": 5.328235294117647e-06, "loss": 0.3391, "step": 87900 }, { "epoch": 1.139664, "grad_norm": 11.023009300231934, "learning_rate": 5.32288770053476e-06, "loss": 0.3399, "step": 88000 }, { "epoch": 1.1401973333333333, "grad_norm": 8.641016960144043, "learning_rate": 5.317540106951872e-06, "loss": 0.3892, "step": 88100 }, { "epoch": 1.1407306666666668, "grad_norm": 6.953176975250244, "learning_rate": 5.3121925133689845e-06, "loss": 0.3093, "step": 88200 }, { "epoch": 1.141264, "grad_norm": 9.46671199798584, "learning_rate": 5.3068983957219255e-06, "loss": 0.3519, "step": 88300 }, { "epoch": 1.1417973333333333, "grad_norm": 11.87191104888916, "learning_rate": 5.301550802139038e-06, "loss": 0.3771, "step": 88400 }, { "epoch": 1.1423306666666666, "grad_norm": 8.078207015991211, "learning_rate": 5.29620320855615e-06, "loss": 0.3439, "step": 88500 }, { "epoch": 1.1428639999999999, "grad_norm": 10.926892280578613, "learning_rate": 5.290855614973263e-06, "loss": 0.3501, "step": 88600 }, { "epoch": 1.1433973333333334, "grad_norm": 19.918514251708984, "learning_rate": 5.2855080213903744e-06, "loss": 0.3725, "step": 88700 }, { "epoch": 1.1439306666666667, "grad_norm": 16.84016227722168, "learning_rate": 5.280160427807487e-06, "loss": 0.3514, "step": 88800 }, { "epoch": 1.144464, "grad_norm": 5.819028377532959, "learning_rate": 5.2748128342246e-06, "loss": 0.3234, "step": 88900 }, { "epoch": 1.1449973333333334, "grad_norm": 8.165422439575195, "learning_rate": 5.2694652406417115e-06, "loss": 0.3466, "step": 89000 }, { "epoch": 1.1455306666666667, "grad_norm": 10.064723014831543, "learning_rate": 5.264117647058824e-06, "loss": 0.3413, "step": 89100 }, { "epoch": 1.146064, "grad_norm": 11.779644966125488, "learning_rate": 5.258770053475937e-06, "loss": 0.3182, "step": 89200 }, { "epoch": 1.1465973333333332, "grad_norm": 14.346098899841309, "learning_rate": 5.253422459893049e-06, "loss": 0.3378, "step": 89300 }, { "epoch": 1.1471306666666667, "grad_norm": 15.305849075317383, "learning_rate": 5.248074866310161e-06, "loss": 0.3133, "step": 89400 }, { "epoch": 1.147664, "grad_norm": 9.197249412536621, "learning_rate": 5.242727272727272e-06, "loss": 0.3272, "step": 89500 }, { "epoch": 1.1481973333333333, "grad_norm": 10.118295669555664, "learning_rate": 5.237379679144386e-06, "loss": 0.3225, "step": 89600 }, { "epoch": 1.1487306666666668, "grad_norm": 18.50217056274414, "learning_rate": 5.2320320855614984e-06, "loss": 0.334, "step": 89700 }, { "epoch": 1.149264, "grad_norm": 11.819570541381836, "learning_rate": 5.226684491978609e-06, "loss": 0.3373, "step": 89800 }, { "epoch": 1.1497973333333333, "grad_norm": 13.821433067321777, "learning_rate": 5.221336898395722e-06, "loss": 0.3363, "step": 89900 }, { "epoch": 1.1503306666666666, "grad_norm": 8.438305854797363, "learning_rate": 5.2159893048128355e-06, "loss": 0.3408, "step": 90000 }, { "epoch": 1.1508639999999999, "grad_norm": 8.696316719055176, "learning_rate": 5.2106417112299465e-06, "loss": 0.3231, "step": 90100 }, { "epoch": 1.1513973333333334, "grad_norm": 7.3780412673950195, "learning_rate": 5.205294117647059e-06, "loss": 0.3815, "step": 90200 }, { "epoch": 1.1519306666666667, "grad_norm": 6.767165660858154, "learning_rate": 5.199946524064171e-06, "loss": 0.3353, "step": 90300 }, { "epoch": 1.152464, "grad_norm": 11.88164234161377, "learning_rate": 5.194598930481284e-06, "loss": 0.348, "step": 90400 }, { "epoch": 1.1529973333333334, "grad_norm": 17.015487670898438, "learning_rate": 5.189251336898396e-06, "loss": 0.3387, "step": 90500 }, { "epoch": 1.1535306666666667, "grad_norm": 11.698856353759766, "learning_rate": 5.183903743315508e-06, "loss": 0.3675, "step": 90600 }, { "epoch": 1.154064, "grad_norm": 10.695415496826172, "learning_rate": 5.178556149732621e-06, "loss": 0.3213, "step": 90700 }, { "epoch": 1.1545973333333333, "grad_norm": 12.256574630737305, "learning_rate": 5.1732085561497325e-06, "loss": 0.3564, "step": 90800 }, { "epoch": 1.1551306666666667, "grad_norm": 10.597017288208008, "learning_rate": 5.167860962566845e-06, "loss": 0.3232, "step": 90900 }, { "epoch": 1.155664, "grad_norm": 11.704337120056152, "learning_rate": 5.162513368983958e-06, "loss": 0.3122, "step": 91000 }, { "epoch": 1.1561973333333333, "grad_norm": 13.438742637634277, "learning_rate": 5.15716577540107e-06, "loss": 0.3601, "step": 91100 }, { "epoch": 1.1567306666666666, "grad_norm": 18.186397552490234, "learning_rate": 5.151818181818182e-06, "loss": 0.3407, "step": 91200 }, { "epoch": 1.157264, "grad_norm": 14.308591842651367, "learning_rate": 5.146470588235295e-06, "loss": 0.3281, "step": 91300 }, { "epoch": 1.1577973333333333, "grad_norm": 9.62307071685791, "learning_rate": 5.141176470588236e-06, "loss": 0.3736, "step": 91400 }, { "epoch": 1.1583306666666666, "grad_norm": 8.753824234008789, "learning_rate": 5.135828877005348e-06, "loss": 0.3355, "step": 91500 }, { "epoch": 1.158864, "grad_norm": 14.060680389404297, "learning_rate": 5.1304812834224605e-06, "loss": 0.3541, "step": 91600 }, { "epoch": 1.1593973333333334, "grad_norm": 2.7192270755767822, "learning_rate": 5.125133689839573e-06, "loss": 0.3345, "step": 91700 }, { "epoch": 1.1599306666666667, "grad_norm": 11.3392915725708, "learning_rate": 5.119786096256685e-06, "loss": 0.3292, "step": 91800 }, { "epoch": 1.160464, "grad_norm": 8.979974746704102, "learning_rate": 5.1144385026737976e-06, "loss": 0.3058, "step": 91900 }, { "epoch": 1.1609973333333334, "grad_norm": 14.111490249633789, "learning_rate": 5.109090909090909e-06, "loss": 0.3571, "step": 92000 }, { "epoch": 1.1615306666666667, "grad_norm": 7.31318473815918, "learning_rate": 5.103743315508022e-06, "loss": 0.3527, "step": 92100 }, { "epoch": 1.162064, "grad_norm": 8.115880012512207, "learning_rate": 5.098395721925135e-06, "loss": 0.3716, "step": 92200 }, { "epoch": 1.1625973333333333, "grad_norm": 9.817439079284668, "learning_rate": 5.0930481283422465e-06, "loss": 0.3449, "step": 92300 }, { "epoch": 1.1631306666666668, "grad_norm": 8.663187026977539, "learning_rate": 5.087700534759359e-06, "loss": 0.3409, "step": 92400 }, { "epoch": 1.163664, "grad_norm": 14.941423416137695, "learning_rate": 5.08235294117647e-06, "loss": 0.3434, "step": 92500 }, { "epoch": 1.1641973333333333, "grad_norm": 7.525819301605225, "learning_rate": 5.077005347593584e-06, "loss": 0.3203, "step": 92600 }, { "epoch": 1.1647306666666666, "grad_norm": 9.998177528381348, "learning_rate": 5.071657754010696e-06, "loss": 0.3075, "step": 92700 }, { "epoch": 1.165264, "grad_norm": 14.0291166305542, "learning_rate": 5.066310160427807e-06, "loss": 0.3505, "step": 92800 }, { "epoch": 1.1657973333333334, "grad_norm": 8.48881721496582, "learning_rate": 5.06096256684492e-06, "loss": 0.3009, "step": 92900 }, { "epoch": 1.1663306666666666, "grad_norm": 16.851951599121094, "learning_rate": 5.055614973262033e-06, "loss": 0.3466, "step": 93000 }, { "epoch": 1.166864, "grad_norm": 10.34169864654541, "learning_rate": 5.050267379679144e-06, "loss": 0.3194, "step": 93100 }, { "epoch": 1.1673973333333334, "grad_norm": 5.032399654388428, "learning_rate": 5.044919786096257e-06, "loss": 0.3163, "step": 93200 }, { "epoch": 1.1679306666666667, "grad_norm": 11.556829452514648, "learning_rate": 5.039572192513369e-06, "loss": 0.3593, "step": 93300 }, { "epoch": 1.168464, "grad_norm": 6.8605875968933105, "learning_rate": 5.0342245989304815e-06, "loss": 0.355, "step": 93400 }, { "epoch": 1.1689973333333334, "grad_norm": 7.054134368896484, "learning_rate": 5.028877005347594e-06, "loss": 0.3103, "step": 93500 }, { "epoch": 1.1695306666666667, "grad_norm": 11.485513687133789, "learning_rate": 5.023529411764706e-06, "loss": 0.361, "step": 93600 }, { "epoch": 1.170064, "grad_norm": 13.46220588684082, "learning_rate": 5.018235294117647e-06, "loss": 0.3418, "step": 93700 }, { "epoch": 1.1705973333333333, "grad_norm": 12.032635688781738, "learning_rate": 5.01288770053476e-06, "loss": 0.3383, "step": 93800 }, { "epoch": 1.1711306666666665, "grad_norm": 15.39465045928955, "learning_rate": 5.007540106951872e-06, "loss": 0.3371, "step": 93900 }, { "epoch": 1.171664, "grad_norm": 8.07787799835205, "learning_rate": 5.002192513368984e-06, "loss": 0.3319, "step": 94000 }, { "epoch": 1.1721973333333333, "grad_norm": 6.786063194274902, "learning_rate": 4.996844919786097e-06, "loss": 0.3826, "step": 94100 }, { "epoch": 1.1727306666666666, "grad_norm": 12.732209205627441, "learning_rate": 4.991497326203209e-06, "loss": 0.333, "step": 94200 }, { "epoch": 1.173264, "grad_norm": 8.506951332092285, "learning_rate": 4.986149732620321e-06, "loss": 0.3123, "step": 94300 }, { "epoch": 1.1737973333333334, "grad_norm": 20.778947830200195, "learning_rate": 4.980802139037433e-06, "loss": 0.3356, "step": 94400 }, { "epoch": 1.1743306666666666, "grad_norm": 7.753083229064941, "learning_rate": 4.9754545454545465e-06, "loss": 0.3667, "step": 94500 }, { "epoch": 1.174864, "grad_norm": 16.333051681518555, "learning_rate": 4.970106951871658e-06, "loss": 0.3855, "step": 94600 }, { "epoch": 1.1753973333333334, "grad_norm": 16.790176391601562, "learning_rate": 4.96475935828877e-06, "loss": 0.3701, "step": 94700 }, { "epoch": 1.1759306666666667, "grad_norm": 12.841607093811035, "learning_rate": 4.959411764705883e-06, "loss": 0.3531, "step": 94800 }, { "epoch": 1.176464, "grad_norm": 8.098129272460938, "learning_rate": 4.954064171122995e-06, "loss": 0.3231, "step": 94900 }, { "epoch": 1.1769973333333335, "grad_norm": 10.505544662475586, "learning_rate": 4.948716577540107e-06, "loss": 0.3445, "step": 95000 }, { "epoch": 1.1775306666666667, "grad_norm": 10.765769958496094, "learning_rate": 4.94336898395722e-06, "loss": 0.3616, "step": 95100 }, { "epoch": 1.178064, "grad_norm": 6.759228706359863, "learning_rate": 4.938021390374332e-06, "loss": 0.3795, "step": 95200 }, { "epoch": 1.1785973333333333, "grad_norm": 8.83088207244873, "learning_rate": 4.932673796791444e-06, "loss": 0.3342, "step": 95300 }, { "epoch": 1.1791306666666665, "grad_norm": 10.472076416015625, "learning_rate": 4.927326203208557e-06, "loss": 0.3415, "step": 95400 }, { "epoch": 1.179664, "grad_norm": 12.180051803588867, "learning_rate": 4.921978609625669e-06, "loss": 0.3458, "step": 95500 }, { "epoch": 1.1801973333333333, "grad_norm": 13.321828842163086, "learning_rate": 4.9166310160427814e-06, "loss": 0.3871, "step": 95600 }, { "epoch": 1.1807306666666666, "grad_norm": 9.128779411315918, "learning_rate": 4.911283422459893e-06, "loss": 0.391, "step": 95700 }, { "epoch": 1.181264, "grad_norm": 17.999147415161133, "learning_rate": 4.905935828877006e-06, "loss": 0.3336, "step": 95800 }, { "epoch": 1.1817973333333334, "grad_norm": 12.168710708618164, "learning_rate": 4.900588235294118e-06, "loss": 0.3091, "step": 95900 }, { "epoch": 1.1823306666666666, "grad_norm": 4.617045879364014, "learning_rate": 4.89524064171123e-06, "loss": 0.3252, "step": 96000 }, { "epoch": 1.1823306666666666, "eval_test1_cer": 0.04604526103517813, "eval_test1_cer_norm": 0.03185343482123562, "eval_test1_loss": 0.17349030077457428, "eval_test1_runtime": 1693.7081, "eval_test1_samples_per_second": 1.476, "eval_test1_steps_per_second": 0.369, "eval_test1_wer": 0.14014985859646054, "eval_test1_wer_norm": 0.08194278032671908, "step": 96000 }, { "epoch": 1.1823306666666666, "eval_test2_cer": 0.09231623548736327, "eval_test2_cer_norm": 0.07055217694453052, "eval_test2_loss": 0.3014395236968994, "eval_test2_runtime": 1719.3639, "eval_test2_samples_per_second": 1.454, "eval_test2_steps_per_second": 0.364, "eval_test2_wer": 0.20488097962920576, "eval_test2_wer_norm": 0.1411872564749026, "step": 96000 }, { "epoch": 1.182864, "grad_norm": 8.073538780212402, "learning_rate": 4.889893048128342e-06, "loss": 0.37, "step": 96100 }, { "epoch": 1.1833973333333334, "grad_norm": 10.131933212280273, "learning_rate": 4.884598930481284e-06, "loss": 0.3628, "step": 96200 }, { "epoch": 1.1839306666666667, "grad_norm": 5.991183757781982, "learning_rate": 4.879251336898396e-06, "loss": 0.3118, "step": 96300 }, { "epoch": 1.184464, "grad_norm": 10.759864807128906, "learning_rate": 4.8739037433155085e-06, "loss": 0.3269, "step": 96400 }, { "epoch": 1.1849973333333335, "grad_norm": 9.46058464050293, "learning_rate": 4.86855614973262e-06, "loss": 0.3345, "step": 96500 }, { "epoch": 1.1855306666666667, "grad_norm": 8.995725631713867, "learning_rate": 4.863208556149733e-06, "loss": 0.3312, "step": 96600 }, { "epoch": 1.186064, "grad_norm": 10.27829647064209, "learning_rate": 4.857860962566846e-06, "loss": 0.3268, "step": 96700 }, { "epoch": 1.1865973333333333, "grad_norm": 14.952675819396973, "learning_rate": 4.8525133689839574e-06, "loss": 0.3884, "step": 96800 }, { "epoch": 1.1871306666666666, "grad_norm": 19.68575668334961, "learning_rate": 4.84716577540107e-06, "loss": 0.3759, "step": 96900 }, { "epoch": 1.187664, "grad_norm": 10.079627990722656, "learning_rate": 4.841818181818182e-06, "loss": 0.3268, "step": 97000 }, { "epoch": 1.1881973333333333, "grad_norm": 9.353432655334473, "learning_rate": 4.8364705882352945e-06, "loss": 0.3542, "step": 97100 }, { "epoch": 1.1887306666666666, "grad_norm": 12.890203475952148, "learning_rate": 4.831122994652407e-06, "loss": 0.3501, "step": 97200 }, { "epoch": 1.189264, "grad_norm": 5.788824081420898, "learning_rate": 4.825775401069519e-06, "loss": 0.3318, "step": 97300 }, { "epoch": 1.1897973333333334, "grad_norm": 8.230916976928711, "learning_rate": 4.820427807486631e-06, "loss": 0.2951, "step": 97400 }, { "epoch": 1.1903306666666666, "grad_norm": 15.061379432678223, "learning_rate": 4.815080213903744e-06, "loss": 0.3214, "step": 97500 }, { "epoch": 1.190864, "grad_norm": 5.0525031089782715, "learning_rate": 4.809732620320856e-06, "loss": 0.336, "step": 97600 }, { "epoch": 1.1913973333333334, "grad_norm": 7.6284379959106445, "learning_rate": 4.804385026737968e-06, "loss": 0.3123, "step": 97700 }, { "epoch": 1.1919306666666667, "grad_norm": 14.588769912719727, "learning_rate": 4.799037433155081e-06, "loss": 0.3318, "step": 97800 }, { "epoch": 1.192464, "grad_norm": 13.447883605957031, "learning_rate": 4.793689839572193e-06, "loss": 0.3472, "step": 97900 }, { "epoch": 1.1929973333333332, "grad_norm": 8.883147239685059, "learning_rate": 4.788342245989305e-06, "loss": 0.2746, "step": 98000 }, { "epoch": 1.1935306666666667, "grad_norm": 7.637491703033447, "learning_rate": 4.782994652406418e-06, "loss": 0.3294, "step": 98100 }, { "epoch": 1.194064, "grad_norm": 9.250743865966797, "learning_rate": 4.7776470588235295e-06, "loss": 0.3658, "step": 98200 }, { "epoch": 1.1945973333333333, "grad_norm": 14.013143539428711, "learning_rate": 4.772299465240642e-06, "loss": 0.3232, "step": 98300 }, { "epoch": 1.1951306666666666, "grad_norm": 7.120253562927246, "learning_rate": 4.766951871657755e-06, "loss": 0.3039, "step": 98400 }, { "epoch": 1.195664, "grad_norm": 17.069250106811523, "learning_rate": 4.761604278074867e-06, "loss": 0.3459, "step": 98500 }, { "epoch": 1.1961973333333333, "grad_norm": 7.1160759925842285, "learning_rate": 4.756256684491979e-06, "loss": 0.3397, "step": 98600 }, { "epoch": 1.1967306666666666, "grad_norm": 10.957855224609375, "learning_rate": 4.750909090909091e-06, "loss": 0.3155, "step": 98700 }, { "epoch": 1.197264, "grad_norm": 11.113825798034668, "learning_rate": 4.745561497326204e-06, "loss": 0.3067, "step": 98800 }, { "epoch": 1.1977973333333334, "grad_norm": 12.741155624389648, "learning_rate": 4.7402139037433155e-06, "loss": 0.3213, "step": 98900 }, { "epoch": 1.1983306666666667, "grad_norm": 6.829225540161133, "learning_rate": 4.734866310160428e-06, "loss": 0.3231, "step": 99000 }, { "epoch": 1.198864, "grad_norm": 12.997426986694336, "learning_rate": 4.72951871657754e-06, "loss": 0.345, "step": 99100 }, { "epoch": 1.1993973333333334, "grad_norm": 12.10572624206543, "learning_rate": 4.724171122994653e-06, "loss": 0.3217, "step": 99200 }, { "epoch": 1.1999306666666667, "grad_norm": 7.332038402557373, "learning_rate": 4.718823529411765e-06, "loss": 0.321, "step": 99300 }, { "epoch": 1.200464, "grad_norm": 15.553889274597168, "learning_rate": 4.713475935828877e-06, "loss": 0.3431, "step": 99400 }, { "epoch": 1.2009973333333333, "grad_norm": 9.44472885131836, "learning_rate": 4.70812834224599e-06, "loss": 0.3254, "step": 99500 }, { "epoch": 1.2015306666666667, "grad_norm": 13.733304977416992, "learning_rate": 4.7027807486631024e-06, "loss": 0.3119, "step": 99600 }, { "epoch": 1.202064, "grad_norm": 12.160194396972656, "learning_rate": 4.697433155080214e-06, "loss": 0.3516, "step": 99700 }, { "epoch": 1.2025973333333333, "grad_norm": 11.34959888458252, "learning_rate": 4.692085561497327e-06, "loss": 0.3375, "step": 99800 }, { "epoch": 1.2031306666666666, "grad_norm": 14.383028984069824, "learning_rate": 4.686737967914439e-06, "loss": 0.3488, "step": 99900 }, { "epoch": 1.203664, "grad_norm": 11.675944328308105, "learning_rate": 4.681390374331551e-06, "loss": 0.2982, "step": 100000 }, { "epoch": 1.2041973333333333, "grad_norm": 10.173127174377441, "learning_rate": 4.676042780748663e-06, "loss": 0.3278, "step": 100100 }, { "epoch": 1.2047306666666666, "grad_norm": 12.922964096069336, "learning_rate": 4.670748663101605e-06, "loss": 0.3247, "step": 100200 }, { "epoch": 1.2052640000000001, "grad_norm": 10.559286117553711, "learning_rate": 4.665401069518717e-06, "loss": 0.3197, "step": 100300 }, { "epoch": 1.2057973333333334, "grad_norm": 8.67289924621582, "learning_rate": 4.660053475935829e-06, "loss": 0.3381, "step": 100400 }, { "epoch": 1.2063306666666667, "grad_norm": 8.398300170898438, "learning_rate": 4.654705882352942e-06, "loss": 0.3516, "step": 100500 }, { "epoch": 1.206864, "grad_norm": 19.365968704223633, "learning_rate": 4.649358288770054e-06, "loss": 0.3329, "step": 100600 }, { "epoch": 1.2073973333333332, "grad_norm": 9.815202713012695, "learning_rate": 4.644010695187166e-06, "loss": 0.3224, "step": 100700 }, { "epoch": 1.2079306666666667, "grad_norm": 18.586198806762695, "learning_rate": 4.638663101604278e-06, "loss": 0.3449, "step": 100800 }, { "epoch": 1.208464, "grad_norm": 10.353617668151855, "learning_rate": 4.63336898395722e-06, "loss": 0.3124, "step": 100900 }, { "epoch": 1.2089973333333333, "grad_norm": 13.675280570983887, "learning_rate": 4.628021390374332e-06, "loss": 0.3379, "step": 101000 }, { "epoch": 1.2095306666666668, "grad_norm": 4.386348247528076, "learning_rate": 4.622673796791444e-06, "loss": 0.3112, "step": 101100 }, { "epoch": 1.210064, "grad_norm": 7.7129693031311035, "learning_rate": 4.6173262032085566e-06, "loss": 0.3353, "step": 101200 }, { "epoch": 1.2105973333333333, "grad_norm": 24.956186294555664, "learning_rate": 4.611978609625668e-06, "loss": 0.3173, "step": 101300 }, { "epoch": 1.2111306666666666, "grad_norm": 8.797530174255371, "learning_rate": 4.606631016042781e-06, "loss": 0.3309, "step": 101400 }, { "epoch": 1.211664, "grad_norm": 7.962009906768799, "learning_rate": 4.601283422459894e-06, "loss": 0.3113, "step": 101500 }, { "epoch": 1.2121973333333333, "grad_norm": 8.013172149658203, "learning_rate": 4.5959358288770055e-06, "loss": 0.3755, "step": 101600 }, { "epoch": 1.2127306666666666, "grad_norm": 12.246475219726562, "learning_rate": 4.590588235294118e-06, "loss": 0.3639, "step": 101700 }, { "epoch": 1.2132640000000001, "grad_norm": 8.23342227935791, "learning_rate": 4.585240641711231e-06, "loss": 0.3334, "step": 101800 }, { "epoch": 1.2137973333333334, "grad_norm": 14.955002784729004, "learning_rate": 4.579893048128343e-06, "loss": 0.3285, "step": 101900 }, { "epoch": 1.2143306666666667, "grad_norm": 14.135103225708008, "learning_rate": 4.574545454545455e-06, "loss": 0.3389, "step": 102000 }, { "epoch": 1.214864, "grad_norm": 11.44263744354248, "learning_rate": 4.569197860962567e-06, "loss": 0.3334, "step": 102100 }, { "epoch": 1.2153973333333332, "grad_norm": 7.289438724517822, "learning_rate": 4.56385026737968e-06, "loss": 0.3201, "step": 102200 }, { "epoch": 1.2159306666666667, "grad_norm": 3.9036967754364014, "learning_rate": 4.5585026737967915e-06, "loss": 0.3268, "step": 102300 }, { "epoch": 1.216464, "grad_norm": 17.62165641784668, "learning_rate": 4.553155080213904e-06, "loss": 0.3618, "step": 102400 }, { "epoch": 1.2169973333333333, "grad_norm": 10.74637222290039, "learning_rate": 4.547807486631016e-06, "loss": 0.3316, "step": 102500 }, { "epoch": 1.2175306666666668, "grad_norm": 8.694232940673828, "learning_rate": 4.542459893048129e-06, "loss": 0.3454, "step": 102600 }, { "epoch": 1.218064, "grad_norm": 7.4203290939331055, "learning_rate": 4.537112299465241e-06, "loss": 0.2783, "step": 102700 }, { "epoch": 1.2185973333333333, "grad_norm": 16.57901954650879, "learning_rate": 4.531764705882353e-06, "loss": 0.336, "step": 102800 }, { "epoch": 1.2191306666666666, "grad_norm": 5.874678134918213, "learning_rate": 4.526417112299466e-06, "loss": 0.3478, "step": 102900 }, { "epoch": 1.219664, "grad_norm": 13.462739944458008, "learning_rate": 4.521069518716578e-06, "loss": 0.3398, "step": 103000 }, { "epoch": 1.2201973333333334, "grad_norm": 4.236706733703613, "learning_rate": 4.51572192513369e-06, "loss": 0.328, "step": 103100 }, { "epoch": 1.2207306666666666, "grad_norm": 29.089107513427734, "learning_rate": 4.510374331550803e-06, "loss": 0.342, "step": 103200 }, { "epoch": 1.221264, "grad_norm": 11.8292236328125, "learning_rate": 4.505026737967915e-06, "loss": 0.348, "step": 103300 }, { "epoch": 1.2217973333333334, "grad_norm": 9.604569435119629, "learning_rate": 4.4996791443850265e-06, "loss": 0.3179, "step": 103400 }, { "epoch": 1.2223306666666667, "grad_norm": 9.382440567016602, "learning_rate": 4.49433155080214e-06, "loss": 0.3179, "step": 103500 }, { "epoch": 1.222864, "grad_norm": 12.052559852600098, "learning_rate": 4.488983957219252e-06, "loss": 0.3191, "step": 103600 }, { "epoch": 1.2233973333333332, "grad_norm": 15.452615737915039, "learning_rate": 4.483636363636364e-06, "loss": 0.3363, "step": 103700 }, { "epoch": 1.2239306666666667, "grad_norm": 9.162357330322266, "learning_rate": 4.478288770053476e-06, "loss": 0.2915, "step": 103800 }, { "epoch": 1.224464, "grad_norm": 14.852408409118652, "learning_rate": 4.472941176470589e-06, "loss": 0.3009, "step": 103900 }, { "epoch": 1.2249973333333333, "grad_norm": 10.53067684173584, "learning_rate": 4.467593582887701e-06, "loss": 0.3111, "step": 104000 }, { "epoch": 1.2255306666666668, "grad_norm": 6.967195987701416, "learning_rate": 4.462245989304813e-06, "loss": 0.3217, "step": 104100 }, { "epoch": 1.226064, "grad_norm": 9.723194122314453, "learning_rate": 4.456898395721925e-06, "loss": 0.3415, "step": 104200 }, { "epoch": 1.2265973333333333, "grad_norm": 21.014995574951172, "learning_rate": 4.451550802139038e-06, "loss": 0.3373, "step": 104300 }, { "epoch": 1.2271306666666666, "grad_norm": 16.64194679260254, "learning_rate": 4.4462032085561505e-06, "loss": 0.3702, "step": 104400 }, { "epoch": 1.227664, "grad_norm": 14.489302635192871, "learning_rate": 4.440855614973262e-06, "loss": 0.3316, "step": 104500 }, { "epoch": 1.2281973333333334, "grad_norm": 11.109329223632812, "learning_rate": 4.435508021390374e-06, "loss": 0.2884, "step": 104600 }, { "epoch": 1.2287306666666666, "grad_norm": 8.914104461669922, "learning_rate": 4.430160427807488e-06, "loss": 0.344, "step": 104700 }, { "epoch": 1.229264, "grad_norm": 10.91256332397461, "learning_rate": 4.424812834224599e-06, "loss": 0.324, "step": 104800 }, { "epoch": 1.2297973333333334, "grad_norm": 16.979461669921875, "learning_rate": 4.41957219251337e-06, "loss": 0.3448, "step": 104900 }, { "epoch": 1.2303306666666667, "grad_norm": 7.320171356201172, "learning_rate": 4.4142245989304815e-06, "loss": 0.2895, "step": 105000 }, { "epoch": 1.230864, "grad_norm": 8.792394638061523, "learning_rate": 4.408877005347594e-06, "loss": 0.2978, "step": 105100 }, { "epoch": 1.2313973333333332, "grad_norm": 21.190940856933594, "learning_rate": 4.403529411764707e-06, "loss": 0.3304, "step": 105200 }, { "epoch": 1.2319306666666667, "grad_norm": 6.8981523513793945, "learning_rate": 4.398181818181819e-06, "loss": 0.3278, "step": 105300 }, { "epoch": 1.232464, "grad_norm": 13.66107177734375, "learning_rate": 4.392834224598931e-06, "loss": 0.3098, "step": 105400 }, { "epoch": 1.2329973333333333, "grad_norm": 2.468859910964966, "learning_rate": 4.387486631016043e-06, "loss": 0.3275, "step": 105500 }, { "epoch": 1.2335306666666668, "grad_norm": 26.944923400878906, "learning_rate": 4.382139037433155e-06, "loss": 0.3063, "step": 105600 }, { "epoch": 1.234064, "grad_norm": 10.95156192779541, "learning_rate": 4.3767914438502675e-06, "loss": 0.3344, "step": 105700 }, { "epoch": 1.2345973333333333, "grad_norm": 7.066481113433838, "learning_rate": 4.37144385026738e-06, "loss": 0.3248, "step": 105800 }, { "epoch": 1.2351306666666666, "grad_norm": 7.9246931076049805, "learning_rate": 4.366096256684492e-06, "loss": 0.3157, "step": 105900 }, { "epoch": 1.235664, "grad_norm": 8.712078094482422, "learning_rate": 4.360748663101605e-06, "loss": 0.3229, "step": 106000 }, { "epoch": 1.2361973333333334, "grad_norm": 6.390163421630859, "learning_rate": 4.355401069518717e-06, "loss": 0.335, "step": 106100 }, { "epoch": 1.2367306666666666, "grad_norm": 4.526826858520508, "learning_rate": 4.350053475935829e-06, "loss": 0.2708, "step": 106200 }, { "epoch": 1.237264, "grad_norm": 7.827445983886719, "learning_rate": 4.344705882352942e-06, "loss": 0.3219, "step": 106300 }, { "epoch": 1.2377973333333334, "grad_norm": 9.743833541870117, "learning_rate": 4.3393582887700535e-06, "loss": 0.3209, "step": 106400 }, { "epoch": 1.2383306666666667, "grad_norm": 10.438488006591797, "learning_rate": 4.334010695187166e-06, "loss": 0.342, "step": 106500 }, { "epoch": 1.238864, "grad_norm": 11.334918022155762, "learning_rate": 4.328663101604279e-06, "loss": 0.3491, "step": 106600 }, { "epoch": 1.2393973333333332, "grad_norm": 13.053474426269531, "learning_rate": 4.323315508021391e-06, "loss": 0.3316, "step": 106700 }, { "epoch": 1.2399306666666667, "grad_norm": 8.366547584533691, "learning_rate": 4.3179679144385025e-06, "loss": 0.3027, "step": 106800 }, { "epoch": 1.240464, "grad_norm": 4.866960525512695, "learning_rate": 4.312620320855616e-06, "loss": 0.3324, "step": 106900 }, { "epoch": 1.2409973333333333, "grad_norm": 17.218528747558594, "learning_rate": 4.307272727272728e-06, "loss": 0.343, "step": 107000 }, { "epoch": 1.2415306666666668, "grad_norm": 10.58595085144043, "learning_rate": 4.3019251336898396e-06, "loss": 0.3214, "step": 107100 }, { "epoch": 1.242064, "grad_norm": 3.7969906330108643, "learning_rate": 4.296577540106952e-06, "loss": 0.339, "step": 107200 }, { "epoch": 1.2425973333333333, "grad_norm": 9.382950782775879, "learning_rate": 4.291229946524065e-06, "loss": 0.3198, "step": 107300 }, { "epoch": 1.2431306666666666, "grad_norm": 6.936860084533691, "learning_rate": 4.285882352941177e-06, "loss": 0.3442, "step": 107400 }, { "epoch": 1.2436639999999999, "grad_norm": 10.476288795471191, "learning_rate": 4.280534759358289e-06, "loss": 0.3147, "step": 107500 }, { "epoch": 1.2441973333333334, "grad_norm": 13.39519214630127, "learning_rate": 4.275187165775401e-06, "loss": 0.3325, "step": 107600 }, { "epoch": 1.2447306666666667, "grad_norm": 11.964447021484375, "learning_rate": 4.269839572192514e-06, "loss": 0.2888, "step": 107700 }, { "epoch": 1.245264, "grad_norm": 8.74453353881836, "learning_rate": 4.2644919786096265e-06, "loss": 0.3283, "step": 107800 }, { "epoch": 1.2457973333333334, "grad_norm": 15.627389907836914, "learning_rate": 4.259144385026738e-06, "loss": 0.3339, "step": 107900 }, { "epoch": 1.2463306666666667, "grad_norm": 16.418254852294922, "learning_rate": 4.25379679144385e-06, "loss": 0.3055, "step": 108000 }, { "epoch": 1.2463306666666667, "eval_test1_cer": 0.046745462693255656, "eval_test1_cer_norm": 0.030633659087089107, "eval_test1_loss": 0.17000414431095123, "eval_test1_runtime": 1710.2097, "eval_test1_samples_per_second": 1.462, "eval_test1_steps_per_second": 0.365, "eval_test1_wer": 0.13764249686579783, "eval_test1_wer_norm": 0.0798971331716298, "step": 108000 }, { "epoch": 1.2463306666666667, "eval_test2_cer": 0.09140161272258931, "eval_test2_cer_norm": 0.07005829718004339, "eval_test2_loss": 0.29700642824172974, "eval_test2_runtime": 1723.4652, "eval_test2_samples_per_second": 1.451, "eval_test2_steps_per_second": 0.363, "eval_test2_wer": 0.20519569695582512, "eval_test2_wer_norm": 0.14041370616548246, "step": 108000 }, { "epoch": 1.246864, "grad_norm": 7.127627849578857, "learning_rate": 4.248449197860963e-06, "loss": 0.3194, "step": 108100 }, { "epoch": 1.2473973333333332, "grad_norm": 19.257863998413086, "learning_rate": 4.243155080213905e-06, "loss": 0.3181, "step": 108200 }, { "epoch": 1.2479306666666667, "grad_norm": 11.324082374572754, "learning_rate": 4.237807486631016e-06, "loss": 0.2956, "step": 108300 }, { "epoch": 1.248464, "grad_norm": 7.751729965209961, "learning_rate": 4.232459893048129e-06, "loss": 0.3016, "step": 108400 }, { "epoch": 1.2489973333333333, "grad_norm": 12.564445495605469, "learning_rate": 4.227112299465241e-06, "loss": 0.3173, "step": 108500 }, { "epoch": 1.2495306666666668, "grad_norm": 5.902596950531006, "learning_rate": 4.2217647058823535e-06, "loss": 0.2533, "step": 108600 }, { "epoch": 1.250064, "grad_norm": 5.696156978607178, "learning_rate": 4.216417112299465e-06, "loss": 0.3061, "step": 108700 }, { "epoch": 1.2505973333333333, "grad_norm": 11.039697647094727, "learning_rate": 4.211069518716578e-06, "loss": 0.3441, "step": 108800 }, { "epoch": 1.2511306666666666, "grad_norm": 17.546037673950195, "learning_rate": 4.20572192513369e-06, "loss": 0.3143, "step": 108900 }, { "epoch": 1.2516639999999999, "grad_norm": 6.108237266540527, "learning_rate": 4.2003743315508024e-06, "loss": 0.3137, "step": 109000 }, { "epoch": 1.2521973333333334, "grad_norm": 8.145423889160156, "learning_rate": 4.195026737967915e-06, "loss": 0.3108, "step": 109100 }, { "epoch": 1.2527306666666667, "grad_norm": 13.573811531066895, "learning_rate": 4.189679144385027e-06, "loss": 0.3227, "step": 109200 }, { "epoch": 1.253264, "grad_norm": 6.896111011505127, "learning_rate": 4.1843315508021396e-06, "loss": 0.3221, "step": 109300 }, { "epoch": 1.2537973333333334, "grad_norm": 12.382010459899902, "learning_rate": 4.178983957219251e-06, "loss": 0.3191, "step": 109400 }, { "epoch": 1.2543306666666667, "grad_norm": 11.4068021774292, "learning_rate": 4.173636363636364e-06, "loss": 0.3209, "step": 109500 }, { "epoch": 1.254864, "grad_norm": 5.06055212020874, "learning_rate": 4.168288770053477e-06, "loss": 0.3201, "step": 109600 }, { "epoch": 1.2553973333333333, "grad_norm": 5.917312145233154, "learning_rate": 4.1629411764705885e-06, "loss": 0.3156, "step": 109700 }, { "epoch": 1.2559306666666665, "grad_norm": 7.352837085723877, "learning_rate": 4.1575935828877e-06, "loss": 0.3252, "step": 109800 }, { "epoch": 1.256464, "grad_norm": 10.092731475830078, "learning_rate": 4.152245989304814e-06, "loss": 0.2916, "step": 109900 }, { "epoch": 1.2569973333333333, "grad_norm": 4.762884140014648, "learning_rate": 4.146898395721926e-06, "loss": 0.3459, "step": 110000 }, { "epoch": 1.2575306666666668, "grad_norm": 9.212899208068848, "learning_rate": 4.141550802139037e-06, "loss": 0.2907, "step": 110100 }, { "epoch": 1.258064, "grad_norm": 8.38918685913086, "learning_rate": 4.13620320855615e-06, "loss": 0.2848, "step": 110200 }, { "epoch": 1.2585973333333333, "grad_norm": 7.14320707321167, "learning_rate": 4.130855614973263e-06, "loss": 0.2877, "step": 110300 }, { "epoch": 1.2591306666666666, "grad_norm": 4.512439250946045, "learning_rate": 4.1255080213903745e-06, "loss": 0.3188, "step": 110400 }, { "epoch": 1.259664, "grad_norm": 6.765574932098389, "learning_rate": 4.120160427807487e-06, "loss": 0.3028, "step": 110500 }, { "epoch": 1.2601973333333334, "grad_norm": 15.689046859741211, "learning_rate": 4.114812834224599e-06, "loss": 0.2753, "step": 110600 }, { "epoch": 1.2607306666666667, "grad_norm": 19.041475296020508, "learning_rate": 4.109465240641712e-06, "loss": 0.3048, "step": 110700 }, { "epoch": 1.261264, "grad_norm": 11.397161483764648, "learning_rate": 4.104171122994653e-06, "loss": 0.3323, "step": 110800 }, { "epoch": 1.2617973333333334, "grad_norm": 17.572757720947266, "learning_rate": 4.098823529411765e-06, "loss": 0.3057, "step": 110900 }, { "epoch": 1.2623306666666667, "grad_norm": 5.697168350219727, "learning_rate": 4.093475935828877e-06, "loss": 0.3749, "step": 111000 }, { "epoch": 1.262864, "grad_norm": 8.028691291809082, "learning_rate": 4.08812834224599e-06, "loss": 0.3098, "step": 111100 }, { "epoch": 1.2633973333333333, "grad_norm": 8.13394832611084, "learning_rate": 4.0827807486631024e-06, "loss": 0.3172, "step": 111200 }, { "epoch": 1.2639306666666665, "grad_norm": 6.210150241851807, "learning_rate": 4.077433155080214e-06, "loss": 0.3001, "step": 111300 }, { "epoch": 1.264464, "grad_norm": 2.5567028522491455, "learning_rate": 4.072085561497327e-06, "loss": 0.3044, "step": 111400 }, { "epoch": 1.2649973333333333, "grad_norm": 10.826966285705566, "learning_rate": 4.066737967914439e-06, "loss": 0.3232, "step": 111500 }, { "epoch": 1.2655306666666668, "grad_norm": 12.530364990234375, "learning_rate": 4.061390374331551e-06, "loss": 0.3056, "step": 111600 }, { "epoch": 1.266064, "grad_norm": 13.355042457580566, "learning_rate": 4.056042780748663e-06, "loss": 0.3025, "step": 111700 }, { "epoch": 1.2665973333333334, "grad_norm": 14.566484451293945, "learning_rate": 4.050695187165776e-06, "loss": 0.3443, "step": 111800 }, { "epoch": 1.2671306666666666, "grad_norm": 12.729494094848633, "learning_rate": 4.045347593582888e-06, "loss": 0.3021, "step": 111900 }, { "epoch": 1.267664, "grad_norm": 11.642380714416504, "learning_rate": 4.04e-06, "loss": 0.3506, "step": 112000 }, { "epoch": 1.2681973333333334, "grad_norm": 12.514439582824707, "learning_rate": 4.034652406417113e-06, "loss": 0.2946, "step": 112100 }, { "epoch": 1.2687306666666667, "grad_norm": 18.96164894104004, "learning_rate": 4.029304812834225e-06, "loss": 0.3542, "step": 112200 }, { "epoch": 1.269264, "grad_norm": 24.150043487548828, "learning_rate": 4.023957219251337e-06, "loss": 0.3094, "step": 112300 }, { "epoch": 1.2697973333333334, "grad_norm": 6.965526580810547, "learning_rate": 4.018609625668449e-06, "loss": 0.2933, "step": 112400 }, { "epoch": 1.2703306666666667, "grad_norm": 9.139363288879395, "learning_rate": 4.013262032085562e-06, "loss": 0.3181, "step": 112500 }, { "epoch": 1.270864, "grad_norm": 9.594560623168945, "learning_rate": 4.0079144385026745e-06, "loss": 0.2924, "step": 112600 }, { "epoch": 1.2713973333333333, "grad_norm": 11.14815902709961, "learning_rate": 4.002566844919786e-06, "loss": 0.3427, "step": 112700 }, { "epoch": 1.2719306666666665, "grad_norm": 9.663122177124023, "learning_rate": 3.997219251336898e-06, "loss": 0.3356, "step": 112800 }, { "epoch": 1.272464, "grad_norm": 9.755457878112793, "learning_rate": 3.991871657754011e-06, "loss": 0.3047, "step": 112900 }, { "epoch": 1.2729973333333333, "grad_norm": 6.521635055541992, "learning_rate": 3.9865240641711234e-06, "loss": 0.3441, "step": 113000 }, { "epoch": 1.2735306666666666, "grad_norm": 14.216236114501953, "learning_rate": 3.981176470588235e-06, "loss": 0.3164, "step": 113100 }, { "epoch": 1.274064, "grad_norm": 5.638237953186035, "learning_rate": 3.975828877005348e-06, "loss": 0.2764, "step": 113200 }, { "epoch": 1.2745973333333334, "grad_norm": 9.243534088134766, "learning_rate": 3.9704812834224606e-06, "loss": 0.2953, "step": 113300 }, { "epoch": 1.2751306666666666, "grad_norm": 7.644172191619873, "learning_rate": 3.965133689839572e-06, "loss": 0.3321, "step": 113400 }, { "epoch": 1.275664, "grad_norm": 10.616632461547852, "learning_rate": 3.959786096256685e-06, "loss": 0.3319, "step": 113500 }, { "epoch": 1.2761973333333334, "grad_norm": 10.845112800598145, "learning_rate": 3.954438502673797e-06, "loss": 0.3537, "step": 113600 }, { "epoch": 1.2767306666666667, "grad_norm": 11.135124206542969, "learning_rate": 3.9490909090909095e-06, "loss": 0.3429, "step": 113700 }, { "epoch": 1.277264, "grad_norm": 16.762256622314453, "learning_rate": 3.943743315508022e-06, "loss": 0.3153, "step": 113800 }, { "epoch": 1.2777973333333335, "grad_norm": 7.200631141662598, "learning_rate": 3.938395721925134e-06, "loss": 0.3264, "step": 113900 }, { "epoch": 1.2783306666666667, "grad_norm": 15.699965476989746, "learning_rate": 3.933048128342246e-06, "loss": 0.3139, "step": 114000 }, { "epoch": 1.278864, "grad_norm": 6.7796854972839355, "learning_rate": 3.927700534759359e-06, "loss": 0.3136, "step": 114100 }, { "epoch": 1.2793973333333333, "grad_norm": 7.011054992675781, "learning_rate": 3.922352941176471e-06, "loss": 0.3113, "step": 114200 }, { "epoch": 1.2799306666666665, "grad_norm": 6.469366073608398, "learning_rate": 3.917005347593583e-06, "loss": 0.3197, "step": 114300 }, { "epoch": 1.280464, "grad_norm": 7.729615211486816, "learning_rate": 3.9116577540106955e-06, "loss": 0.3343, "step": 114400 }, { "epoch": 1.2809973333333333, "grad_norm": 7.437357425689697, "learning_rate": 3.9063636363636365e-06, "loss": 0.3157, "step": 114500 }, { "epoch": 1.2815306666666666, "grad_norm": 8.373348236083984, "learning_rate": 3.901016042780749e-06, "loss": 0.2966, "step": 114600 }, { "epoch": 1.282064, "grad_norm": 9.871039390563965, "learning_rate": 3.895668449197861e-06, "loss": 0.3253, "step": 114700 }, { "epoch": 1.2825973333333334, "grad_norm": 7.155500411987305, "learning_rate": 3.890320855614974e-06, "loss": 0.2946, "step": 114800 }, { "epoch": 1.2831306666666666, "grad_norm": 7.002528667449951, "learning_rate": 3.8849732620320855e-06, "loss": 0.3091, "step": 114900 }, { "epoch": 1.283664, "grad_norm": 6.733940601348877, "learning_rate": 3.879625668449198e-06, "loss": 0.3401, "step": 115000 }, { "epoch": 1.2841973333333334, "grad_norm": 8.078216552734375, "learning_rate": 3.874278074866311e-06, "loss": 0.3093, "step": 115100 }, { "epoch": 1.2847306666666667, "grad_norm": 13.788070678710938, "learning_rate": 3.868930481283423e-06, "loss": 0.3067, "step": 115200 }, { "epoch": 1.285264, "grad_norm": 14.186759948730469, "learning_rate": 3.863582887700535e-06, "loss": 0.2802, "step": 115300 }, { "epoch": 1.2857973333333335, "grad_norm": 4.945133686065674, "learning_rate": 3.858235294117648e-06, "loss": 0.2771, "step": 115400 }, { "epoch": 1.2863306666666667, "grad_norm": 5.545900821685791, "learning_rate": 3.85288770053476e-06, "loss": 0.2805, "step": 115500 }, { "epoch": 1.286864, "grad_norm": 10.216639518737793, "learning_rate": 3.847540106951872e-06, "loss": 0.2895, "step": 115600 }, { "epoch": 1.2873973333333333, "grad_norm": 9.317610740661621, "learning_rate": 3.842192513368984e-06, "loss": 0.2884, "step": 115700 }, { "epoch": 1.2879306666666666, "grad_norm": 25.066299438476562, "learning_rate": 3.836844919786096e-06, "loss": 0.3365, "step": 115800 }, { "epoch": 1.288464, "grad_norm": 6.602483749389648, "learning_rate": 3.831497326203209e-06, "loss": 0.3309, "step": 115900 }, { "epoch": 1.2889973333333333, "grad_norm": 12.600339889526367, "learning_rate": 3.826149732620321e-06, "loss": 0.3018, "step": 116000 }, { "epoch": 1.2895306666666666, "grad_norm": 11.42183780670166, "learning_rate": 3.820802139037433e-06, "loss": 0.3433, "step": 116100 }, { "epoch": 1.290064, "grad_norm": 8.798749923706055, "learning_rate": 3.815454545454546e-06, "loss": 0.3132, "step": 116200 }, { "epoch": 1.2905973333333334, "grad_norm": 9.973285675048828, "learning_rate": 3.8101069518716584e-06, "loss": 0.2912, "step": 116300 }, { "epoch": 1.2911306666666666, "grad_norm": 9.887733459472656, "learning_rate": 3.8047593582887706e-06, "loss": 0.3007, "step": 116400 }, { "epoch": 1.291664, "grad_norm": 7.659307479858398, "learning_rate": 3.7994652406417116e-06, "loss": 0.3563, "step": 116500 }, { "epoch": 1.2921973333333332, "grad_norm": 10.660703659057617, "learning_rate": 3.794117647058824e-06, "loss": 0.3303, "step": 116600 }, { "epoch": 1.2927306666666667, "grad_norm": 17.017602920532227, "learning_rate": 3.7887700534759365e-06, "loss": 0.2865, "step": 116700 }, { "epoch": 1.293264, "grad_norm": 12.125261306762695, "learning_rate": 3.7834224598930488e-06, "loss": 0.3411, "step": 116800 }, { "epoch": 1.2937973333333335, "grad_norm": 5.759032249450684, "learning_rate": 3.7780748663101606e-06, "loss": 0.3279, "step": 116900 }, { "epoch": 1.2943306666666667, "grad_norm": 8.0045747756958, "learning_rate": 3.772727272727273e-06, "loss": 0.3067, "step": 117000 }, { "epoch": 1.294864, "grad_norm": 12.408676147460938, "learning_rate": 3.767379679144385e-06, "loss": 0.3008, "step": 117100 }, { "epoch": 1.2953973333333333, "grad_norm": 11.896954536437988, "learning_rate": 3.7620320855614977e-06, "loss": 0.313, "step": 117200 }, { "epoch": 1.2959306666666666, "grad_norm": 10.993172645568848, "learning_rate": 3.75668449197861e-06, "loss": 0.3027, "step": 117300 }, { "epoch": 1.296464, "grad_norm": 12.108036041259766, "learning_rate": 3.751336898395722e-06, "loss": 0.3225, "step": 117400 }, { "epoch": 1.2969973333333333, "grad_norm": 12.278324127197266, "learning_rate": 3.7459893048128344e-06, "loss": 0.3182, "step": 117500 }, { "epoch": 1.2975306666666666, "grad_norm": 4.987984657287598, "learning_rate": 3.740641711229947e-06, "loss": 0.3012, "step": 117600 }, { "epoch": 1.298064, "grad_norm": 7.8109517097473145, "learning_rate": 3.7352941176470593e-06, "loss": 0.2983, "step": 117700 }, { "epoch": 1.2985973333333334, "grad_norm": 7.489900588989258, "learning_rate": 3.7299465240641715e-06, "loss": 0.2938, "step": 117800 }, { "epoch": 1.2991306666666667, "grad_norm": 13.556317329406738, "learning_rate": 3.7245989304812837e-06, "loss": 0.3332, "step": 117900 }, { "epoch": 1.299664, "grad_norm": 12.495691299438477, "learning_rate": 3.7192513368983964e-06, "loss": 0.2846, "step": 118000 }, { "epoch": 1.3001973333333332, "grad_norm": 9.107158660888672, "learning_rate": 3.7139037433155086e-06, "loss": 0.292, "step": 118100 }, { "epoch": 1.3007306666666667, "grad_norm": 18.844675064086914, "learning_rate": 3.7085561497326204e-06, "loss": 0.3019, "step": 118200 }, { "epoch": 1.301264, "grad_norm": 15.54864501953125, "learning_rate": 3.7032085561497326e-06, "loss": 0.3301, "step": 118300 }, { "epoch": 1.3017973333333333, "grad_norm": 9.015207290649414, "learning_rate": 3.6978609625668453e-06, "loss": 0.3002, "step": 118400 }, { "epoch": 1.3023306666666667, "grad_norm": 8.86280345916748, "learning_rate": 3.6925133689839575e-06, "loss": 0.3118, "step": 118500 }, { "epoch": 1.302864, "grad_norm": 10.500102996826172, "learning_rate": 3.6871657754010698e-06, "loss": 0.2981, "step": 118600 }, { "epoch": 1.3033973333333333, "grad_norm": 11.42728042602539, "learning_rate": 3.681818181818182e-06, "loss": 0.2915, "step": 118700 }, { "epoch": 1.3039306666666666, "grad_norm": 4.238334655761719, "learning_rate": 3.676524064171123e-06, "loss": 0.3308, "step": 118800 }, { "epoch": 1.304464, "grad_norm": 10.400212287902832, "learning_rate": 3.6711764705882357e-06, "loss": 0.2966, "step": 118900 }, { "epoch": 1.3049973333333333, "grad_norm": 6.6525187492370605, "learning_rate": 3.665828877005348e-06, "loss": 0.3071, "step": 119000 }, { "epoch": 1.3055306666666666, "grad_norm": 7.601672649383545, "learning_rate": 3.66048128342246e-06, "loss": 0.2774, "step": 119100 }, { "epoch": 1.3060640000000001, "grad_norm": 8.093502044677734, "learning_rate": 3.6551336898395724e-06, "loss": 0.2991, "step": 119200 }, { "epoch": 1.3065973333333334, "grad_norm": 10.748820304870605, "learning_rate": 3.649786096256685e-06, "loss": 0.3083, "step": 119300 }, { "epoch": 1.3071306666666667, "grad_norm": 4.307931423187256, "learning_rate": 3.6444385026737972e-06, "loss": 0.3182, "step": 119400 }, { "epoch": 1.307664, "grad_norm": 11.890705108642578, "learning_rate": 3.6390909090909095e-06, "loss": 0.3045, "step": 119500 }, { "epoch": 1.3081973333333332, "grad_norm": 10.586037635803223, "learning_rate": 3.6337433155080217e-06, "loss": 0.2834, "step": 119600 }, { "epoch": 1.3087306666666667, "grad_norm": 11.271493911743164, "learning_rate": 3.6283957219251344e-06, "loss": 0.3132, "step": 119700 }, { "epoch": 1.309264, "grad_norm": 1.2793396711349487, "learning_rate": 3.6230481283422466e-06, "loss": 0.3237, "step": 119800 }, { "epoch": 1.3097973333333333, "grad_norm": 11.776678085327148, "learning_rate": 3.6177005347593584e-06, "loss": 0.3425, "step": 119900 }, { "epoch": 1.3103306666666668, "grad_norm": 8.148585319519043, "learning_rate": 3.6123529411764706e-06, "loss": 0.2886, "step": 120000 }, { "epoch": 1.3103306666666668, "eval_test1_cer": 0.04016823511838076, "eval_test1_cer_norm": 0.02641246668427498, "eval_test1_loss": 0.16869130730628967, "eval_test1_runtime": 2668.1922, "eval_test1_samples_per_second": 0.937, "eval_test1_steps_per_second": 0.234, "eval_test1_wer": 0.12807953584652615, "eval_test1_wer_norm": 0.07101317981238493, "step": 120000 }, { "epoch": 1.3103306666666668, "eval_test2_cer": 0.08095344756785007, "eval_test2_cer_norm": 0.0630132475983886, "eval_test2_loss": 0.29371923208236694, "eval_test2_runtime": 2692.632, "eval_test2_samples_per_second": 0.928, "eval_test2_steps_per_second": 0.232, "eval_test2_wer": 0.18842984664682993, "eval_test2_wer_norm": 0.1237393994957598, "step": 120000 }, { "epoch": 1.310864, "grad_norm": 6.063900947570801, "learning_rate": 3.6070053475935833e-06, "loss": 0.3185, "step": 120100 }, { "epoch": 1.3113973333333333, "grad_norm": 11.05594539642334, "learning_rate": 3.6016577540106955e-06, "loss": 0.2892, "step": 120200 }, { "epoch": 1.3119306666666666, "grad_norm": 11.134530067443848, "learning_rate": 3.5963101604278077e-06, "loss": 0.3148, "step": 120300 }, { "epoch": 1.312464, "grad_norm": 7.773560047149658, "learning_rate": 3.59096256684492e-06, "loss": 0.3468, "step": 120400 }, { "epoch": 1.3129973333333333, "grad_norm": 9.294329643249512, "learning_rate": 3.585614973262032e-06, "loss": 0.3226, "step": 120500 }, { "epoch": 1.3135306666666666, "grad_norm": 13.86751651763916, "learning_rate": 3.580267379679145e-06, "loss": 0.2701, "step": 120600 }, { "epoch": 1.3140640000000001, "grad_norm": 6.337131023406982, "learning_rate": 3.574919786096257e-06, "loss": 0.3118, "step": 120700 }, { "epoch": 1.3145973333333334, "grad_norm": 10.323579788208008, "learning_rate": 3.5695721925133693e-06, "loss": 0.3014, "step": 120800 }, { "epoch": 1.3151306666666667, "grad_norm": 6.5028886795043945, "learning_rate": 3.564224598930481e-06, "loss": 0.305, "step": 120900 }, { "epoch": 1.315664, "grad_norm": 7.1288604736328125, "learning_rate": 3.558877005347594e-06, "loss": 0.3065, "step": 121000 }, { "epoch": 1.3161973333333332, "grad_norm": 8.463421821594238, "learning_rate": 3.5535294117647064e-06, "loss": 0.2999, "step": 121100 }, { "epoch": 1.3167306666666667, "grad_norm": 12.202735900878906, "learning_rate": 3.5481818181818182e-06, "loss": 0.3205, "step": 121200 }, { "epoch": 1.317264, "grad_norm": 7.654930114746094, "learning_rate": 3.5428877005347597e-06, "loss": 0.3172, "step": 121300 }, { "epoch": 1.3177973333333333, "grad_norm": 5.559797763824463, "learning_rate": 3.5375401069518724e-06, "loss": 0.3117, "step": 121400 }, { "epoch": 1.3183306666666668, "grad_norm": 7.945643424987793, "learning_rate": 3.5321925133689846e-06, "loss": 0.3162, "step": 121500 }, { "epoch": 1.318864, "grad_norm": 4.290308475494385, "learning_rate": 3.5268449197860964e-06, "loss": 0.3127, "step": 121600 }, { "epoch": 1.3193973333333333, "grad_norm": 6.875506401062012, "learning_rate": 3.5214973262032086e-06, "loss": 0.2854, "step": 121700 }, { "epoch": 1.3199306666666666, "grad_norm": 9.860490798950195, "learning_rate": 3.516149732620321e-06, "loss": 0.307, "step": 121800 }, { "epoch": 1.320464, "grad_norm": 13.061542510986328, "learning_rate": 3.5108021390374335e-06, "loss": 0.2913, "step": 121900 }, { "epoch": 1.3209973333333334, "grad_norm": 8.080313682556152, "learning_rate": 3.5054545454545457e-06, "loss": 0.2879, "step": 122000 }, { "epoch": 1.3215306666666666, "grad_norm": 5.935614585876465, "learning_rate": 3.500106951871658e-06, "loss": 0.2743, "step": 122100 }, { "epoch": 1.3220640000000001, "grad_norm": 8.318488121032715, "learning_rate": 3.49475935828877e-06, "loss": 0.3099, "step": 122200 }, { "epoch": 1.3225973333333334, "grad_norm": 12.58419418334961, "learning_rate": 3.489411764705883e-06, "loss": 0.3042, "step": 122300 }, { "epoch": 1.3231306666666667, "grad_norm": 5.484549522399902, "learning_rate": 3.484064171122995e-06, "loss": 0.2565, "step": 122400 }, { "epoch": 1.323664, "grad_norm": 12.654871940612793, "learning_rate": 3.4787165775401073e-06, "loss": 0.3233, "step": 122500 }, { "epoch": 1.3241973333333332, "grad_norm": 4.316012382507324, "learning_rate": 3.4733689839572195e-06, "loss": 0.3197, "step": 122600 }, { "epoch": 1.3247306666666667, "grad_norm": 14.1438627243042, "learning_rate": 3.468021390374332e-06, "loss": 0.3369, "step": 122700 }, { "epoch": 1.325264, "grad_norm": 6.512611389160156, "learning_rate": 3.4626737967914444e-06, "loss": 0.2933, "step": 122800 }, { "epoch": 1.3257973333333333, "grad_norm": 10.386069297790527, "learning_rate": 3.4573262032085562e-06, "loss": 0.3222, "step": 122900 }, { "epoch": 1.3263306666666668, "grad_norm": 8.745896339416504, "learning_rate": 3.4519786096256685e-06, "loss": 0.3049, "step": 123000 }, { "epoch": 1.326864, "grad_norm": 8.660828590393066, "learning_rate": 3.446631016042781e-06, "loss": 0.3168, "step": 123100 }, { "epoch": 1.3273973333333333, "grad_norm": 9.68034839630127, "learning_rate": 3.4412834224598933e-06, "loss": 0.3263, "step": 123200 }, { "epoch": 1.3279306666666666, "grad_norm": 14.108439445495605, "learning_rate": 3.4359358288770056e-06, "loss": 0.2943, "step": 123300 }, { "epoch": 1.3284639999999999, "grad_norm": 9.587782859802246, "learning_rate": 3.430588235294118e-06, "loss": 0.2565, "step": 123400 }, { "epoch": 1.3289973333333334, "grad_norm": 7.092198848724365, "learning_rate": 3.4252406417112305e-06, "loss": 0.2988, "step": 123500 }, { "epoch": 1.3295306666666666, "grad_norm": 8.889711380004883, "learning_rate": 3.4198930481283427e-06, "loss": 0.2956, "step": 123600 }, { "epoch": 2.0003946666666668, "grad_norm": 8.30831527709961, "learning_rate": 3.414545454545455e-06, "loss": 0.3141, "step": 123700 }, { "epoch": 2.000928, "grad_norm": 20.964359283447266, "learning_rate": 3.409197860962567e-06, "loss": 0.3039, "step": 123800 }, { "epoch": 2.0014613333333333, "grad_norm": 3.7360033988952637, "learning_rate": 3.403850267379679e-06, "loss": 0.2902, "step": 123900 }, { "epoch": 2.0019946666666666, "grad_norm": 8.115029335021973, "learning_rate": 3.398502673796792e-06, "loss": 0.2756, "step": 124000 }, { "epoch": 2.002528, "grad_norm": 14.973184585571289, "learning_rate": 3.393155080213904e-06, "loss": 0.276, "step": 124100 }, { "epoch": 2.003061333333333, "grad_norm": 9.159042358398438, "learning_rate": 3.387807486631016e-06, "loss": 0.3118, "step": 124200 }, { "epoch": 2.003594666666667, "grad_norm": 6.770198822021484, "learning_rate": 3.3825133689839575e-06, "loss": 0.2778, "step": 124300 }, { "epoch": 2.004128, "grad_norm": 8.212747573852539, "learning_rate": 3.37716577540107e-06, "loss": 0.2809, "step": 124400 }, { "epoch": 2.0046613333333334, "grad_norm": 6.6272993087768555, "learning_rate": 3.3718181818181824e-06, "loss": 0.3501, "step": 124500 }, { "epoch": 2.0051946666666667, "grad_norm": 9.557974815368652, "learning_rate": 3.3664705882352942e-06, "loss": 0.2829, "step": 124600 }, { "epoch": 2.005728, "grad_norm": 5.735389232635498, "learning_rate": 3.3611229946524065e-06, "loss": 0.3229, "step": 124700 }, { "epoch": 2.0062613333333332, "grad_norm": 7.76618766784668, "learning_rate": 3.355775401069519e-06, "loss": 0.2765, "step": 124800 }, { "epoch": 2.0067946666666665, "grad_norm": 11.016231536865234, "learning_rate": 3.3504278074866313e-06, "loss": 0.2571, "step": 124900 }, { "epoch": 2.007328, "grad_norm": 4.176055431365967, "learning_rate": 3.3450802139037436e-06, "loss": 0.2725, "step": 125000 }, { "epoch": 2.0078613333333335, "grad_norm": 7.434291839599609, "learning_rate": 3.339732620320856e-06, "loss": 0.2761, "step": 125100 }, { "epoch": 2.0083946666666668, "grad_norm": 9.580822944641113, "learning_rate": 3.334385026737968e-06, "loss": 0.2617, "step": 125200 }, { "epoch": 2.008928, "grad_norm": 5.100543022155762, "learning_rate": 3.3290374331550807e-06, "loss": 0.2716, "step": 125300 }, { "epoch": 2.0094613333333333, "grad_norm": 7.802529335021973, "learning_rate": 3.323689839572193e-06, "loss": 0.3059, "step": 125400 }, { "epoch": 2.0099946666666666, "grad_norm": 5.677967071533203, "learning_rate": 3.318342245989305e-06, "loss": 0.292, "step": 125500 }, { "epoch": 2.010528, "grad_norm": 4.4582977294921875, "learning_rate": 3.312994652406417e-06, "loss": 0.2659, "step": 125600 }, { "epoch": 2.011061333333333, "grad_norm": 9.830044746398926, "learning_rate": 3.30764705882353e-06, "loss": 0.2664, "step": 125700 }, { "epoch": 2.011594666666667, "grad_norm": 16.158796310424805, "learning_rate": 3.302299465240642e-06, "loss": 0.2668, "step": 125800 }, { "epoch": 2.012128, "grad_norm": 8.691771507263184, "learning_rate": 3.296951871657754e-06, "loss": 0.2645, "step": 125900 }, { "epoch": 2.0126613333333334, "grad_norm": 2.3978371620178223, "learning_rate": 3.2916042780748663e-06, "loss": 0.2737, "step": 126000 }, { "epoch": 2.0131946666666667, "grad_norm": 18.426654815673828, "learning_rate": 3.286256684491979e-06, "loss": 0.2935, "step": 126100 }, { "epoch": 2.013728, "grad_norm": 12.391684532165527, "learning_rate": 3.280909090909091e-06, "loss": 0.2798, "step": 126200 }, { "epoch": 2.0142613333333332, "grad_norm": 6.699799537658691, "learning_rate": 3.2755614973262034e-06, "loss": 0.2733, "step": 126300 }, { "epoch": 2.0147946666666665, "grad_norm": 9.111023902893066, "learning_rate": 3.2702139037433156e-06, "loss": 0.268, "step": 126400 }, { "epoch": 2.015328, "grad_norm": 6.3130598068237305, "learning_rate": 3.2648663101604283e-06, "loss": 0.2977, "step": 126500 }, { "epoch": 2.0158613333333335, "grad_norm": 7.004066467285156, "learning_rate": 3.2595187165775405e-06, "loss": 0.2601, "step": 126600 }, { "epoch": 2.016394666666667, "grad_norm": 12.201000213623047, "learning_rate": 3.2541711229946528e-06, "loss": 0.2655, "step": 126700 }, { "epoch": 2.016928, "grad_norm": 20.903759002685547, "learning_rate": 3.248823529411765e-06, "loss": 0.2725, "step": 126800 }, { "epoch": 2.0174613333333333, "grad_norm": 8.136113166809082, "learning_rate": 3.2434759358288776e-06, "loss": 0.2621, "step": 126900 }, { "epoch": 2.0179946666666666, "grad_norm": 6.159198760986328, "learning_rate": 3.23812834224599e-06, "loss": 0.271, "step": 127000 }, { "epoch": 2.018528, "grad_norm": 6.747727870941162, "learning_rate": 3.232834224598931e-06, "loss": 0.2746, "step": 127100 }, { "epoch": 2.019061333333333, "grad_norm": 8.00680160522461, "learning_rate": 3.227486631016043e-06, "loss": 0.2922, "step": 127200 }, { "epoch": 2.019594666666667, "grad_norm": 4.709404468536377, "learning_rate": 3.222139037433155e-06, "loss": 0.2509, "step": 127300 }, { "epoch": 2.020128, "grad_norm": 5.00091028213501, "learning_rate": 3.216791443850268e-06, "loss": 0.2741, "step": 127400 }, { "epoch": 2.0206613333333334, "grad_norm": 9.505927085876465, "learning_rate": 3.21144385026738e-06, "loss": 0.3067, "step": 127500 }, { "epoch": 2.0211946666666667, "grad_norm": 7.574983596801758, "learning_rate": 3.206096256684492e-06, "loss": 0.2755, "step": 127600 }, { "epoch": 2.021728, "grad_norm": 5.800495147705078, "learning_rate": 3.2007486631016043e-06, "loss": 0.2357, "step": 127700 }, { "epoch": 2.0222613333333332, "grad_norm": 7.580172061920166, "learning_rate": 3.195401069518717e-06, "loss": 0.2848, "step": 127800 }, { "epoch": 2.0227946666666665, "grad_norm": 18.45042610168457, "learning_rate": 3.190053475935829e-06, "loss": 0.2794, "step": 127900 }, { "epoch": 2.023328, "grad_norm": 7.750545978546143, "learning_rate": 3.1847058823529414e-06, "loss": 0.2778, "step": 128000 }, { "epoch": 2.0238613333333335, "grad_norm": 9.160516738891602, "learning_rate": 3.1793582887700536e-06, "loss": 0.2646, "step": 128100 }, { "epoch": 2.024394666666667, "grad_norm": 6.772854804992676, "learning_rate": 3.174010695187166e-06, "loss": 0.2954, "step": 128200 }, { "epoch": 2.024928, "grad_norm": 6.446855068206787, "learning_rate": 3.1686631016042785e-06, "loss": 0.2749, "step": 128300 }, { "epoch": 2.0254613333333333, "grad_norm": 8.357845306396484, "learning_rate": 3.1633155080213907e-06, "loss": 0.262, "step": 128400 }, { "epoch": 2.0259946666666666, "grad_norm": 10.004444122314453, "learning_rate": 3.157967914438503e-06, "loss": 0.2454, "step": 128500 }, { "epoch": 2.026528, "grad_norm": 7.3765387535095215, "learning_rate": 3.1526203208556148e-06, "loss": 0.2654, "step": 128600 }, { "epoch": 2.027061333333333, "grad_norm": 6.695378303527832, "learning_rate": 3.147272727272728e-06, "loss": 0.2971, "step": 128700 }, { "epoch": 2.027594666666667, "grad_norm": 4.258591175079346, "learning_rate": 3.1419251336898397e-06, "loss": 0.278, "step": 128800 }, { "epoch": 2.028128, "grad_norm": 6.994195461273193, "learning_rate": 3.136577540106952e-06, "loss": 0.2663, "step": 128900 }, { "epoch": 2.0286613333333334, "grad_norm": 9.301597595214844, "learning_rate": 3.131229946524064e-06, "loss": 0.2786, "step": 129000 }, { "epoch": 2.0291946666666667, "grad_norm": 4.949365615844727, "learning_rate": 3.1258823529411768e-06, "loss": 0.2806, "step": 129100 }, { "epoch": 2.029728, "grad_norm": 6.057010173797607, "learning_rate": 3.120534759358289e-06, "loss": 0.2543, "step": 129200 }, { "epoch": 2.0302613333333333, "grad_norm": 10.202611923217773, "learning_rate": 3.1151871657754012e-06, "loss": 0.2597, "step": 129300 }, { "epoch": 2.0307946666666665, "grad_norm": 32.154483795166016, "learning_rate": 3.1098930481283423e-06, "loss": 0.2769, "step": 129400 }, { "epoch": 2.031328, "grad_norm": 8.417098999023438, "learning_rate": 3.1045454545454545e-06, "loss": 0.2755, "step": 129500 }, { "epoch": 2.0318613333333335, "grad_norm": 9.617804527282715, "learning_rate": 3.099197860962567e-06, "loss": 0.2712, "step": 129600 }, { "epoch": 2.032394666666667, "grad_norm": 4.91211462020874, "learning_rate": 3.0938502673796794e-06, "loss": 0.2797, "step": 129700 }, { "epoch": 2.032928, "grad_norm": 6.764735698699951, "learning_rate": 3.0885026737967916e-06, "loss": 0.2718, "step": 129800 }, { "epoch": 2.0334613333333333, "grad_norm": 5.931708335876465, "learning_rate": 3.083155080213904e-06, "loss": 0.2497, "step": 129900 }, { "epoch": 2.0339946666666666, "grad_norm": 5.572037220001221, "learning_rate": 3.0778074866310165e-06, "loss": 0.2556, "step": 130000 }, { "epoch": 2.034528, "grad_norm": 12.130525588989258, "learning_rate": 3.0724598930481287e-06, "loss": 0.2732, "step": 130100 }, { "epoch": 2.035061333333333, "grad_norm": 10.279794692993164, "learning_rate": 3.067112299465241e-06, "loss": 0.2817, "step": 130200 }, { "epoch": 2.0355946666666664, "grad_norm": 7.773774147033691, "learning_rate": 3.0617647058823528e-06, "loss": 0.2922, "step": 130300 }, { "epoch": 2.036128, "grad_norm": 10.147696495056152, "learning_rate": 3.056417112299466e-06, "loss": 0.2845, "step": 130400 }, { "epoch": 2.0366613333333334, "grad_norm": 9.108769416809082, "learning_rate": 3.0510695187165777e-06, "loss": 0.2734, "step": 130500 }, { "epoch": 2.0371946666666667, "grad_norm": 5.410663604736328, "learning_rate": 3.04572192513369e-06, "loss": 0.2462, "step": 130600 }, { "epoch": 2.037728, "grad_norm": 6.593864917755127, "learning_rate": 3.040374331550802e-06, "loss": 0.2715, "step": 130700 }, { "epoch": 2.0382613333333333, "grad_norm": 6.3404927253723145, "learning_rate": 3.0350267379679148e-06, "loss": 0.2626, "step": 130800 }, { "epoch": 2.0387946666666665, "grad_norm": 15.649771690368652, "learning_rate": 3.029679144385027e-06, "loss": 0.2569, "step": 130900 }, { "epoch": 2.039328, "grad_norm": 8.056966781616211, "learning_rate": 3.0243315508021392e-06, "loss": 0.2403, "step": 131000 }, { "epoch": 2.0398613333333335, "grad_norm": 3.89754056930542, "learning_rate": 3.0189839572192515e-06, "loss": 0.2443, "step": 131100 }, { "epoch": 2.040394666666667, "grad_norm": 14.275724411010742, "learning_rate": 3.013636363636364e-06, "loss": 0.2405, "step": 131200 }, { "epoch": 2.040928, "grad_norm": 9.884306907653809, "learning_rate": 3.0082887700534764e-06, "loss": 0.2614, "step": 131300 }, { "epoch": 2.0414613333333334, "grad_norm": 6.568662166595459, "learning_rate": 3.0029411764705886e-06, "loss": 0.268, "step": 131400 }, { "epoch": 2.0419946666666666, "grad_norm": 10.294089317321777, "learning_rate": 2.997593582887701e-06, "loss": 0.243, "step": 131500 }, { "epoch": 2.042528, "grad_norm": 12.111979484558105, "learning_rate": 2.9922459893048126e-06, "loss": 0.2728, "step": 131600 }, { "epoch": 2.043061333333333, "grad_norm": 6.430063724517822, "learning_rate": 2.9868983957219257e-06, "loss": 0.2609, "step": 131700 }, { "epoch": 2.0435946666666664, "grad_norm": 10.856860160827637, "learning_rate": 2.9815508021390375e-06, "loss": 0.2645, "step": 131800 }, { "epoch": 2.044128, "grad_norm": 12.103190422058105, "learning_rate": 2.9762032085561497e-06, "loss": 0.2654, "step": 131900 }, { "epoch": 2.0446613333333334, "grad_norm": 12.51089859008789, "learning_rate": 2.970855614973262e-06, "loss": 0.2592, "step": 132000 }, { "epoch": 2.0446613333333334, "eval_test1_cer": 0.04895343192172679, "eval_test1_cer_norm": 0.0320839436213893, "eval_test1_loss": 0.16834402084350586, "eval_test1_runtime": 2699.3319, "eval_test1_samples_per_second": 0.926, "eval_test1_steps_per_second": 0.232, "eval_test1_wer": 0.14006239248957694, "eval_test1_wer_norm": 0.08220579210380198, "step": 132000 }, { "epoch": 2.0446613333333334, "eval_test2_cer": 0.0838139769291074, "eval_test2_cer_norm": 0.06455783235202975, "eval_test2_loss": 0.29568561911582947, "eval_test2_runtime": 2710.3459, "eval_test2_samples_per_second": 0.922, "eval_test2_steps_per_second": 0.231, "eval_test2_wer": 0.18888761730373083, "eval_test2_wer_norm": 0.12462754985101994, "step": 132000 }, { "epoch": 2.0451946666666667, "grad_norm": 12.412470817565918, "learning_rate": 2.9655080213903746e-06, "loss": 0.2789, "step": 132100 }, { "epoch": 2.045728, "grad_norm": 12.757892608642578, "learning_rate": 2.960160427807487e-06, "loss": 0.2522, "step": 132200 }, { "epoch": 2.0462613333333333, "grad_norm": 8.112143516540527, "learning_rate": 2.954812834224599e-06, "loss": 0.2415, "step": 132300 }, { "epoch": 2.0467946666666665, "grad_norm": 8.559292793273926, "learning_rate": 2.94951871657754e-06, "loss": 0.2384, "step": 132400 }, { "epoch": 2.047328, "grad_norm": 7.405971527099609, "learning_rate": 2.9441711229946528e-06, "loss": 0.2574, "step": 132500 }, { "epoch": 2.0478613333333335, "grad_norm": 5.761473655700684, "learning_rate": 2.938823529411765e-06, "loss": 0.25, "step": 132600 }, { "epoch": 2.048394666666667, "grad_norm": 13.89209270477295, "learning_rate": 2.9334759358288772e-06, "loss": 0.2699, "step": 132700 }, { "epoch": 2.048928, "grad_norm": 9.827019691467285, "learning_rate": 2.9281283422459895e-06, "loss": 0.2641, "step": 132800 }, { "epoch": 2.0494613333333334, "grad_norm": 12.331426620483398, "learning_rate": 2.9227807486631017e-06, "loss": 0.2752, "step": 132900 }, { "epoch": 2.0499946666666666, "grad_norm": 9.961935043334961, "learning_rate": 2.9174331550802143e-06, "loss": 0.2797, "step": 133000 }, { "epoch": 2.050528, "grad_norm": 10.992859840393066, "learning_rate": 2.9120855614973266e-06, "loss": 0.2764, "step": 133100 }, { "epoch": 2.051061333333333, "grad_norm": 5.54823112487793, "learning_rate": 2.906737967914439e-06, "loss": 0.2774, "step": 133200 }, { "epoch": 2.0515946666666665, "grad_norm": 3.5500264167785645, "learning_rate": 2.9013903743315506e-06, "loss": 0.2365, "step": 133300 }, { "epoch": 2.052128, "grad_norm": 11.125758171081543, "learning_rate": 2.8960427807486637e-06, "loss": 0.3002, "step": 133400 }, { "epoch": 2.0526613333333334, "grad_norm": 16.441911697387695, "learning_rate": 2.8906951871657755e-06, "loss": 0.2598, "step": 133500 }, { "epoch": 2.0531946666666667, "grad_norm": 17.566251754760742, "learning_rate": 2.8853475935828877e-06, "loss": 0.2787, "step": 133600 }, { "epoch": 2.053728, "grad_norm": 11.897130966186523, "learning_rate": 2.88e-06, "loss": 0.2523, "step": 133700 }, { "epoch": 2.0542613333333333, "grad_norm": 12.928265571594238, "learning_rate": 2.8746524064171126e-06, "loss": 0.2699, "step": 133800 }, { "epoch": 2.0547946666666665, "grad_norm": 10.264710426330566, "learning_rate": 2.869304812834225e-06, "loss": 0.2658, "step": 133900 }, { "epoch": 2.055328, "grad_norm": 8.080851554870605, "learning_rate": 2.863957219251337e-06, "loss": 0.2308, "step": 134000 }, { "epoch": 2.0558613333333335, "grad_norm": 9.574499130249023, "learning_rate": 2.8586096256684493e-06, "loss": 0.2626, "step": 134100 }, { "epoch": 2.056394666666667, "grad_norm": 11.961541175842285, "learning_rate": 2.853262032085562e-06, "loss": 0.2692, "step": 134200 }, { "epoch": 2.056928, "grad_norm": 14.26484489440918, "learning_rate": 2.847914438502674e-06, "loss": 0.2449, "step": 134300 }, { "epoch": 2.0574613333333334, "grad_norm": 8.064934730529785, "learning_rate": 2.8425668449197864e-06, "loss": 0.262, "step": 134400 }, { "epoch": 2.0579946666666666, "grad_norm": 8.649343490600586, "learning_rate": 2.8372727272727274e-06, "loss": 0.2377, "step": 134500 }, { "epoch": 2.058528, "grad_norm": 7.180487155914307, "learning_rate": 2.8319251336898397e-06, "loss": 0.2578, "step": 134600 }, { "epoch": 2.059061333333333, "grad_norm": 13.179899215698242, "learning_rate": 2.8265775401069523e-06, "loss": 0.2503, "step": 134700 }, { "epoch": 2.0595946666666665, "grad_norm": 10.658390045166016, "learning_rate": 2.8212299465240646e-06, "loss": 0.2398, "step": 134800 }, { "epoch": 2.060128, "grad_norm": 9.47397518157959, "learning_rate": 2.815882352941177e-06, "loss": 0.273, "step": 134900 }, { "epoch": 2.0606613333333335, "grad_norm": 15.279340744018555, "learning_rate": 2.8105347593582886e-06, "loss": 0.2441, "step": 135000 }, { "epoch": 2.0611946666666667, "grad_norm": 8.68983268737793, "learning_rate": 2.8051871657754017e-06, "loss": 0.2568, "step": 135100 }, { "epoch": 2.061728, "grad_norm": 14.162593841552734, "learning_rate": 2.7998395721925135e-06, "loss": 0.2578, "step": 135200 }, { "epoch": 2.0622613333333333, "grad_norm": 7.918008327484131, "learning_rate": 2.7944919786096257e-06, "loss": 0.2502, "step": 135300 }, { "epoch": 2.0627946666666666, "grad_norm": 12.660669326782227, "learning_rate": 2.789144385026738e-06, "loss": 0.2572, "step": 135400 }, { "epoch": 2.063328, "grad_norm": 6.70175838470459, "learning_rate": 2.7837967914438506e-06, "loss": 0.2651, "step": 135500 }, { "epoch": 2.0638613333333335, "grad_norm": 9.6471529006958, "learning_rate": 2.778449197860963e-06, "loss": 0.2682, "step": 135600 }, { "epoch": 2.064394666666667, "grad_norm": 6.70587158203125, "learning_rate": 2.773101604278075e-06, "loss": 0.2428, "step": 135700 }, { "epoch": 2.064928, "grad_norm": 14.934929847717285, "learning_rate": 2.7677540106951873e-06, "loss": 0.2646, "step": 135800 }, { "epoch": 2.0654613333333334, "grad_norm": 8.352704048156738, "learning_rate": 2.7624064171123e-06, "loss": 0.2617, "step": 135900 }, { "epoch": 2.0659946666666666, "grad_norm": 12.871698379516602, "learning_rate": 2.757058823529412e-06, "loss": 0.2697, "step": 136000 }, { "epoch": 2.066528, "grad_norm": 6.50486421585083, "learning_rate": 2.7517112299465244e-06, "loss": 0.2258, "step": 136100 }, { "epoch": 2.067061333333333, "grad_norm": 15.829752922058105, "learning_rate": 2.7463636363636366e-06, "loss": 0.2702, "step": 136200 }, { "epoch": 2.0675946666666665, "grad_norm": 5.64918851852417, "learning_rate": 2.7410160427807484e-06, "loss": 0.2683, "step": 136300 }, { "epoch": 2.068128, "grad_norm": 11.441001892089844, "learning_rate": 2.7356684491978615e-06, "loss": 0.2811, "step": 136400 }, { "epoch": 2.0686613333333335, "grad_norm": 10.176900863647461, "learning_rate": 2.7303208556149733e-06, "loss": 0.2583, "step": 136500 }, { "epoch": 2.0691946666666667, "grad_norm": 13.278491973876953, "learning_rate": 2.7249732620320856e-06, "loss": 0.2583, "step": 136600 }, { "epoch": 2.069728, "grad_norm": 14.00743579864502, "learning_rate": 2.7196256684491978e-06, "loss": 0.2722, "step": 136700 }, { "epoch": 2.0702613333333333, "grad_norm": 10.239465713500977, "learning_rate": 2.7142780748663104e-06, "loss": 0.261, "step": 136800 }, { "epoch": 2.0707946666666666, "grad_norm": 8.596717834472656, "learning_rate": 2.7089839572192515e-06, "loss": 0.246, "step": 136900 }, { "epoch": 2.071328, "grad_norm": 3.669482946395874, "learning_rate": 2.7036363636363637e-06, "loss": 0.25, "step": 137000 }, { "epoch": 2.0718613333333336, "grad_norm": 11.252618789672852, "learning_rate": 2.698288770053476e-06, "loss": 0.25, "step": 137100 }, { "epoch": 2.072394666666667, "grad_norm": 10.2298002243042, "learning_rate": 2.6929411764705886e-06, "loss": 0.2194, "step": 137200 }, { "epoch": 2.072928, "grad_norm": 14.401735305786133, "learning_rate": 2.687593582887701e-06, "loss": 0.2779, "step": 137300 }, { "epoch": 2.0734613333333334, "grad_norm": 9.53612995147705, "learning_rate": 2.682245989304813e-06, "loss": 0.2431, "step": 137400 }, { "epoch": 2.0739946666666667, "grad_norm": 23.011119842529297, "learning_rate": 2.6768983957219253e-06, "loss": 0.2549, "step": 137500 }, { "epoch": 2.074528, "grad_norm": 7.123078346252441, "learning_rate": 2.6715508021390375e-06, "loss": 0.269, "step": 137600 }, { "epoch": 2.075061333333333, "grad_norm": 7.065475940704346, "learning_rate": 2.66620320855615e-06, "loss": 0.2837, "step": 137700 }, { "epoch": 2.0755946666666665, "grad_norm": 9.332853317260742, "learning_rate": 2.6608556149732624e-06, "loss": 0.2482, "step": 137800 }, { "epoch": 2.076128, "grad_norm": 10.998539924621582, "learning_rate": 2.6555080213903746e-06, "loss": 0.244, "step": 137900 }, { "epoch": 2.0766613333333335, "grad_norm": 9.765246391296387, "learning_rate": 2.6501604278074864e-06, "loss": 0.2493, "step": 138000 }, { "epoch": 2.0771946666666667, "grad_norm": 16.2503604888916, "learning_rate": 2.6448128342245995e-06, "loss": 0.2421, "step": 138100 }, { "epoch": 2.077728, "grad_norm": 17.454763412475586, "learning_rate": 2.6394652406417113e-06, "loss": 0.2962, "step": 138200 }, { "epoch": 2.0782613333333333, "grad_norm": 5.48462438583374, "learning_rate": 2.6341176470588235e-06, "loss": 0.2527, "step": 138300 }, { "epoch": 2.0787946666666666, "grad_norm": 7.6557416915893555, "learning_rate": 2.6287700534759358e-06, "loss": 0.2542, "step": 138400 }, { "epoch": 2.079328, "grad_norm": 6.084134578704834, "learning_rate": 2.6234224598930484e-06, "loss": 0.2555, "step": 138500 }, { "epoch": 2.0798613333333336, "grad_norm": 11.797647476196289, "learning_rate": 2.6180748663101607e-06, "loss": 0.2487, "step": 138600 }, { "epoch": 2.080394666666667, "grad_norm": 10.526240348815918, "learning_rate": 2.612727272727273e-06, "loss": 0.2502, "step": 138700 }, { "epoch": 2.080928, "grad_norm": 6.191641807556152, "learning_rate": 2.607379679144385e-06, "loss": 0.2694, "step": 138800 }, { "epoch": 2.0814613333333334, "grad_norm": 6.513887405395508, "learning_rate": 2.6020320855614978e-06, "loss": 0.2702, "step": 138900 }, { "epoch": 2.0819946666666667, "grad_norm": 6.6874237060546875, "learning_rate": 2.59668449197861e-06, "loss": 0.2454, "step": 139000 }, { "epoch": 2.082528, "grad_norm": 7.005324840545654, "learning_rate": 2.5913368983957222e-06, "loss": 0.2763, "step": 139100 }, { "epoch": 2.083061333333333, "grad_norm": 8.269804954528809, "learning_rate": 2.5859893048128345e-06, "loss": 0.2423, "step": 139200 }, { "epoch": 2.0835946666666665, "grad_norm": 16.40113639831543, "learning_rate": 2.580641711229947e-06, "loss": 0.2423, "step": 139300 }, { "epoch": 2.084128, "grad_norm": 8.58166217803955, "learning_rate": 2.5752941176470594e-06, "loss": 0.2527, "step": 139400 }, { "epoch": 2.0846613333333335, "grad_norm": 5.66722297668457, "learning_rate": 2.569946524064171e-06, "loss": 0.2662, "step": 139500 }, { "epoch": 2.0851946666666668, "grad_norm": 5.2375030517578125, "learning_rate": 2.5645989304812834e-06, "loss": 0.2558, "step": 139600 }, { "epoch": 2.085728, "grad_norm": 3.5982563495635986, "learning_rate": 2.5592513368983956e-06, "loss": 0.2529, "step": 139700 }, { "epoch": 2.0862613333333333, "grad_norm": Infinity, "learning_rate": 2.5539572192513375e-06, "loss": 0.2536, "step": 139800 }, { "epoch": 2.0867946666666666, "grad_norm": 10.866579055786133, "learning_rate": 2.5486096256684493e-06, "loss": 0.2572, "step": 139900 }, { "epoch": 2.087328, "grad_norm": 12.908426284790039, "learning_rate": 2.5432620320855615e-06, "loss": 0.2525, "step": 140000 }, { "epoch": 2.087861333333333, "grad_norm": 9.946547508239746, "learning_rate": 2.5379144385026738e-06, "loss": 0.2708, "step": 140100 }, { "epoch": 2.088394666666667, "grad_norm": 6.067025184631348, "learning_rate": 2.5325668449197864e-06, "loss": 0.2292, "step": 140200 }, { "epoch": 2.088928, "grad_norm": 8.509516716003418, "learning_rate": 2.5272192513368986e-06, "loss": 0.2538, "step": 140300 }, { "epoch": 2.0894613333333334, "grad_norm": 7.129268169403076, "learning_rate": 2.521871657754011e-06, "loss": 0.2074, "step": 140400 }, { "epoch": 2.0899946666666667, "grad_norm": 15.266408920288086, "learning_rate": 2.516524064171123e-06, "loss": 0.2476, "step": 140500 }, { "epoch": 2.090528, "grad_norm": 10.149209022521973, "learning_rate": 2.5111764705882358e-06, "loss": 0.2341, "step": 140600 }, { "epoch": 2.091061333333333, "grad_norm": 8.391693115234375, "learning_rate": 2.505828877005348e-06, "loss": 0.2508, "step": 140700 }, { "epoch": 2.0915946666666665, "grad_norm": 10.443544387817383, "learning_rate": 2.5004812834224602e-06, "loss": 0.2689, "step": 140800 }, { "epoch": 2.092128, "grad_norm": 12.323334693908691, "learning_rate": 2.4951336898395725e-06, "loss": 0.285, "step": 140900 }, { "epoch": 2.0926613333333335, "grad_norm": 13.510546684265137, "learning_rate": 2.4897860962566847e-06, "loss": 0.2396, "step": 141000 }, { "epoch": 2.0931946666666668, "grad_norm": 9.745351791381836, "learning_rate": 2.484438502673797e-06, "loss": 0.2432, "step": 141100 }, { "epoch": 2.093728, "grad_norm": 11.289131164550781, "learning_rate": 2.479090909090909e-06, "loss": 0.2429, "step": 141200 }, { "epoch": 2.0942613333333333, "grad_norm": 7.235909938812256, "learning_rate": 2.4737433155080214e-06, "loss": 0.2409, "step": 141300 }, { "epoch": 2.0947946666666666, "grad_norm": 11.234665870666504, "learning_rate": 2.468395721925134e-06, "loss": 0.2484, "step": 141400 }, { "epoch": 2.095328, "grad_norm": 6.991249084472656, "learning_rate": 2.4630481283422463e-06, "loss": 0.2771, "step": 141500 }, { "epoch": 2.095861333333333, "grad_norm": 5.987100124359131, "learning_rate": 2.4577005347593585e-06, "loss": 0.2681, "step": 141600 }, { "epoch": 2.096394666666667, "grad_norm": 13.472906112670898, "learning_rate": 2.4523529411764707e-06, "loss": 0.2442, "step": 141700 }, { "epoch": 2.096928, "grad_norm": 5.170924186706543, "learning_rate": 2.447005347593583e-06, "loss": 0.2458, "step": 141800 }, { "epoch": 2.0974613333333334, "grad_norm": 10.084118843078613, "learning_rate": 2.441657754010695e-06, "loss": 0.2325, "step": 141900 }, { "epoch": 2.0979946666666667, "grad_norm": 13.672666549682617, "learning_rate": 2.4363636363636366e-06, "loss": 0.248, "step": 142000 }, { "epoch": 2.098528, "grad_norm": 19.528696060180664, "learning_rate": 2.431016042780749e-06, "loss": 0.2798, "step": 142100 }, { "epoch": 2.0990613333333332, "grad_norm": 9.165569305419922, "learning_rate": 2.425668449197861e-06, "loss": 0.2569, "step": 142200 }, { "epoch": 2.0995946666666665, "grad_norm": 6.099190711975098, "learning_rate": 2.4203208556149733e-06, "loss": 0.2461, "step": 142300 }, { "epoch": 2.1001279999999998, "grad_norm": 14.109368324279785, "learning_rate": 2.4149732620320856e-06, "loss": 0.2372, "step": 142400 }, { "epoch": 2.1006613333333335, "grad_norm": 7.679204940795898, "learning_rate": 2.4096256684491982e-06, "loss": 0.2507, "step": 142500 }, { "epoch": 2.1011946666666668, "grad_norm": 3.0747745037078857, "learning_rate": 2.4042780748663104e-06, "loss": 0.2506, "step": 142600 }, { "epoch": 2.101728, "grad_norm": 16.13155174255371, "learning_rate": 2.3989304812834227e-06, "loss": 0.2627, "step": 142700 }, { "epoch": 2.1022613333333333, "grad_norm": 11.035439491271973, "learning_rate": 2.393582887700535e-06, "loss": 0.2211, "step": 142800 }, { "epoch": 2.1027946666666666, "grad_norm": 13.775737762451172, "learning_rate": 2.388235294117647e-06, "loss": 0.2378, "step": 142900 }, { "epoch": 2.103328, "grad_norm": 10.398784637451172, "learning_rate": 2.3828877005347594e-06, "loss": 0.2546, "step": 143000 }, { "epoch": 2.103861333333333, "grad_norm": 12.837084770202637, "learning_rate": 2.377540106951872e-06, "loss": 0.2267, "step": 143100 }, { "epoch": 2.104394666666667, "grad_norm": 3.3864798545837402, "learning_rate": 2.3721925133689843e-06, "loss": 0.2402, "step": 143200 }, { "epoch": 2.104928, "grad_norm": 7.129687309265137, "learning_rate": 2.3668449197860965e-06, "loss": 0.2627, "step": 143300 }, { "epoch": 2.1054613333333334, "grad_norm": 8.431574821472168, "learning_rate": 2.3614973262032087e-06, "loss": 0.2415, "step": 143400 }, { "epoch": 2.1059946666666667, "grad_norm": 14.868566513061523, "learning_rate": 2.356149732620321e-06, "loss": 0.248, "step": 143500 }, { "epoch": 2.106528, "grad_norm": 3.495256185531616, "learning_rate": 2.350802139037433e-06, "loss": 0.2351, "step": 143600 }, { "epoch": 2.1070613333333332, "grad_norm": 4.422831058502197, "learning_rate": 2.345454545454546e-06, "loss": 0.251, "step": 143700 }, { "epoch": 2.1075946666666665, "grad_norm": 10.112110137939453, "learning_rate": 2.340106951871658e-06, "loss": 0.2578, "step": 143800 }, { "epoch": 2.108128, "grad_norm": 10.589584350585938, "learning_rate": 2.3347593582887703e-06, "loss": 0.2513, "step": 143900 }, { "epoch": 2.1086613333333335, "grad_norm": 9.917288780212402, "learning_rate": 2.3294117647058825e-06, "loss": 0.2343, "step": 144000 }, { "epoch": 2.1086613333333335, "eval_test1_cer": 0.03963141384718799, "eval_test1_cer_norm": 0.025821787883881193, "eval_test1_loss": 0.16842637956142426, "eval_test1_runtime": 2694.9124, "eval_test1_samples_per_second": 0.928, "eval_test1_steps_per_second": 0.232, "eval_test1_wer": 0.12391031808507537, "eval_test1_wer_norm": 0.06671732078669745, "step": 144000 }, { "epoch": 2.1086613333333335, "eval_test2_cer": 0.08560122447455855, "eval_test2_cer_norm": 0.0666011388286334, "eval_test2_loss": 0.2973191440105438, "eval_test2_runtime": 2710.521, "eval_test2_samples_per_second": 0.922, "eval_test2_steps_per_second": 0.231, "eval_test2_wer": 0.19280727855344473, "eval_test2_wer_norm": 0.12898235159294064, "step": 144000 } ], "logging_steps": 100, "max_steps": 187500, "num_input_tokens_seen": 0, "num_train_epochs": 9223372036854775807, "save_steps": 12000, "stateful_callbacks": { "TrainerControl": { "args": { "should_epoch_stop": false, "should_evaluate": false, "should_log": false, "should_save": true, "should_training_stop": false }, "attributes": {} } }, "total_flos": 5.878623031020749e+20, "train_batch_size": 4, "trial_name": null, "trial_params": null }