kreas commited on
Commit
a57ce45
·
verified ·
1 Parent(s): a323160

Upload /gemma-2b/int8_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
gemma-2b/int8_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json ADDED
@@ -0,0 +1,552 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "prefill": {
3
+ "memory": {
4
+ "unit": "MB",
5
+ "max_ram": 1423.818752,
6
+ "max_vram": 4257.21856,
7
+ "max_reserved": 3764.38784,
8
+ "max_allocated": 3508.004352
9
+ },
10
+ "latency": {
11
+ "unit": "s",
12
+ "mean": 0.04286323381081605,
13
+ "stdev": 0.000656232047182085,
14
+ "values": [
15
+ 0.0505134391784668,
16
+ 0.04533657455444336,
17
+ 0.04497100830078125,
18
+ 0.044565502166748046,
19
+ 0.04431257629394531,
20
+ 0.04437094497680664,
21
+ 0.04474265670776367,
22
+ 0.04444384002685547,
23
+ 0.0444815673828125,
24
+ 0.04461772918701172,
25
+ 0.04460236740112305,
26
+ 0.043878398895263675,
27
+ 0.04398489761352539,
28
+ 0.04345446395874023,
29
+ 0.04287078475952148,
30
+ 0.042608638763427735,
31
+ 0.0425615348815918,
32
+ 0.04250009536743164,
33
+ 0.04266393661499023,
34
+ 0.04250431823730469,
35
+ 0.04270182418823242,
36
+ 0.04260659027099609,
37
+ 0.042608638763427735,
38
+ 0.04252569580078125,
39
+ 0.04266393661499023,
40
+ 0.04261068725585938,
41
+ 0.042559486389160156,
42
+ 0.04261171340942383,
43
+ 0.04253286361694336,
44
+ 0.04257894515991211,
45
+ 0.04250009536743164,
46
+ 0.04264038467407227,
47
+ 0.04261785507202148,
48
+ 0.04275404739379883,
49
+ 0.042654720306396485,
50
+ 0.04260464096069336,
51
+ 0.0425984001159668,
52
+ 0.042649600982666014,
53
+ 0.04270182418823242,
54
+ 0.04271104049682617,
55
+ 0.042659839630126956,
56
+ 0.042799102783203126,
57
+ 0.04271615982055664,
58
+ 0.042560672760009764,
59
+ 0.04260454559326172,
60
+ 0.04265267181396484,
61
+ 0.04253696060180664,
62
+ 0.0426956787109375,
63
+ 0.04271206283569336,
64
+ 0.04274585723876953,
65
+ 0.04262809753417969,
66
+ 0.04266291046142578,
67
+ 0.042589183807373046,
68
+ 0.042613761901855465,
69
+ 0.042587135314941404,
70
+ 0.04259651184082031,
71
+ 0.04278579330444336,
72
+ 0.042850303649902347,
73
+ 0.04276428985595703,
74
+ 0.04276326370239258,
75
+ 0.042676223754882815,
76
+ 0.04270489501953125,
77
+ 0.04269875335693359,
78
+ 0.042891265869140625,
79
+ 0.0427509765625,
80
+ 0.04275711822509766,
81
+ 0.042889217376708984,
82
+ 0.04270182418823242,
83
+ 0.04268134307861328,
84
+ 0.042646526336669925,
85
+ 0.042782718658447266,
86
+ 0.04276838302612305,
87
+ 0.04274176025390625,
88
+ 0.04274790573120117,
89
+ 0.042726398468017575,
90
+ 0.042831871032714845,
91
+ 0.042823680877685545,
92
+ 0.04273561477661133,
93
+ 0.04283087921142578,
94
+ 0.04281753540039063,
95
+ 0.0427470703125,
96
+ 0.04268032073974609,
97
+ 0.04280627059936523,
98
+ 0.04269363021850586,
99
+ 0.04283391952514649,
100
+ 0.04278374481201172,
101
+ 0.04267724609375,
102
+ 0.042777599334716795,
103
+ 0.04269465637207031,
104
+ 0.042671104431152344,
105
+ 0.04271308898925781,
106
+ 0.04274687957763672,
107
+ 0.042641407012939454,
108
+ 0.04270694351196289,
109
+ 0.042726398468017575,
110
+ 0.042821632385253904,
111
+ 0.042673152923583986,
112
+ 0.04267007827758789,
113
+ 0.04262911987304688,
114
+ 0.04268851089477539,
115
+ 0.04268646240234375,
116
+ 0.04269055938720703,
117
+ 0.04262604904174805,
118
+ 0.04266495895385742,
119
+ 0.04266291046142578,
120
+ 0.042643455505371096,
121
+ 0.04258816146850586,
122
+ 0.042602497100830077,
123
+ 0.042722305297851565,
124
+ 0.04276736068725586,
125
+ 0.04278988647460937,
126
+ 0.04261395263671875,
127
+ 0.04253593444824219,
128
+ 0.042517505645751956,
129
+ 0.042742942810058596,
130
+ 0.04272435379028321,
131
+ 0.04267520141601563,
132
+ 0.042771457672119144,
133
+ 0.04271718215942383,
134
+ 0.042651649475097655,
135
+ 0.04262604904174805,
136
+ 0.042687488555908204,
137
+ 0.04273152160644531,
138
+ 0.04275302505493164,
139
+ 0.04270182418823242,
140
+ 0.04261580657958984,
141
+ 0.04272435379028321,
142
+ 0.04262297439575195,
143
+ 0.042665985107421874,
144
+ 0.04257894515991211,
145
+ 0.042703872680664064,
146
+ 0.04265574264526367,
147
+ 0.04274585723876953,
148
+ 0.04276838302612305,
149
+ 0.04268236923217773,
150
+ 0.04266495895385742,
151
+ 0.04276428985595703,
152
+ 0.042643455505371096,
153
+ 0.04256256103515625,
154
+ 0.04258508682250976,
155
+ 0.042807296752929686,
156
+ 0.042656768798828126,
157
+ 0.042638336181640625,
158
+ 0.042554367065429685,
159
+ 0.04266291046142578,
160
+ 0.042635265350341796,
161
+ 0.042600448608398435,
162
+ 0.04242227172851563,
163
+ 0.0425596809387207,
164
+ 0.042420223236083986,
165
+ 0.042641407012939454,
166
+ 0.04266291046142578,
167
+ 0.04285747146606445,
168
+ 0.04269772720336914,
169
+ 0.04276428985595703,
170
+ 0.04269363021850586,
171
+ 0.042543102264404296,
172
+ 0.04262604904174805,
173
+ 0.04257689666748047,
174
+ 0.042728446960449216,
175
+ 0.04267212677001953,
176
+ 0.0427509765625,
177
+ 0.042692607879638675,
178
+ 0.042584064483642575,
179
+ 0.042845184326171876,
180
+ 0.042829822540283204,
181
+ 0.0427694091796875,
182
+ 0.04266499328613281,
183
+ 0.042777599334716795,
184
+ 0.042840065002441405,
185
+ 0.04283494567871094,
186
+ 0.04268032073974609,
187
+ 0.042700801849365234,
188
+ 0.042828800201416016,
189
+ 0.0428328971862793,
190
+ 0.04269158554077149,
191
+ 0.042788864135742184,
192
+ 0.042858497619628906,
193
+ 0.04276326370239258,
194
+ 0.04282572937011719,
195
+ 0.042943489074707034,
196
+ 0.04280115127563477,
197
+ 0.04270182418823242,
198
+ 0.04277657699584961,
199
+ 0.04269977569580078,
200
+ 0.04282275390625,
201
+ 0.04274790573120117,
202
+ 0.04281651306152344,
203
+ 0.042916862487792966,
204
+ 0.04290969467163086,
205
+ 0.04278579330444336,
206
+ 0.04275814437866211,
207
+ 0.04273664093017578,
208
+ 0.042856449127197264,
209
+ 0.04293030548095703,
210
+ 0.042823680877685545,
211
+ 0.04281651306152344,
212
+ 0.04284620666503906,
213
+ 0.04276649475097656,
214
+ 0.042840065002441405,
215
+ 0.04283391952514649,
216
+ 0.04290867233276367,
217
+ 0.04290867233276367,
218
+ 0.042859519958496094,
219
+ 0.042874881744384766,
220
+ 0.042777599334716795,
221
+ 0.042984447479248046,
222
+ 0.04295782470703125,
223
+ 0.04300201416015625,
224
+ 0.042851329803466794,
225
+ 0.04295577621459961,
226
+ 0.042928192138671876,
227
+ 0.042900478363037106,
228
+ 0.04290560150146484,
229
+ 0.04297011184692383,
230
+ 0.04281651306152344,
231
+ 0.042831871032714845,
232
+ 0.04276428985595703,
233
+ 0.04290560150146484,
234
+ 0.042799102783203126,
235
+ 0.04309401702880859,
236
+ 0.04304076766967774,
237
+ 0.04305100631713867,
238
+ 0.042947582244873043,
239
+ 0.04299980926513672,
240
+ 0.04299673461914062,
241
+ 0.04303974533081055,
242
+ 0.0429639663696289,
243
+ 0.042927104949951174,
244
+ 0.04294041442871094,
245
+ 0.042927104949951174,
246
+ 0.04289945602416992,
247
+ 0.042881023406982424,
248
+ 0.04286259078979492
249
+ ]
250
+ },
251
+ "throughput": {
252
+ "unit": "tokens/s",
253
+ "value": 5972.484510382446
254
+ },
255
+ "energy": null,
256
+ "efficiency": null
257
+ },
258
+ "decode": {
259
+ "memory": {
260
+ "unit": "MB",
261
+ "max_ram": 1424.867328,
262
+ "max_vram": 4534.042624,
263
+ "max_reserved": 4041.211904,
264
+ "max_allocated": 3911.199744
265
+ },
266
+ "latency": {
267
+ "unit": "s",
268
+ "mean": 11.125907440185541,
269
+ "stdev": 0,
270
+ "values": [
271
+ 11.125907440185541
272
+ ]
273
+ },
274
+ "throughput": {
275
+ "unit": "tokens/s",
276
+ "value": 22.91947882641629
277
+ },
278
+ "energy": null,
279
+ "efficiency": null
280
+ },
281
+ "per_token": {
282
+ "memory": null,
283
+ "latency": {
284
+ "unit": "s",
285
+ "mean": 0.04363100956935506,
286
+ "stdev": 0.00011434622885004557,
287
+ "values": [
288
+ 0.04358553695678711,
289
+ 0.04352716827392578,
290
+ 0.04343807983398437,
291
+ 0.043655166625976564,
292
+ 0.043483135223388675,
293
+ 0.04352511978149414,
294
+ 0.04334592056274414,
295
+ 0.04340326309204102,
296
+ 0.04347187042236328,
297
+ 0.04380057525634766,
298
+ 0.04369715118408203,
299
+ 0.04368896102905274,
300
+ 0.043619327545166016,
301
+ 0.04357427215576172,
302
+ 0.043469825744628904,
303
+ 0.04353023910522461,
304
+ 0.04353228759765625,
305
+ 0.04357017517089844,
306
+ 0.04354048156738281,
307
+ 0.04357222366333008,
308
+ 0.04342988967895508,
309
+ 0.043561985015869144,
310
+ 0.04352000045776367,
311
+ 0.043512832641601565,
312
+ 0.043340801239013675,
313
+ 0.043410430908203124,
314
+ 0.043630592346191405,
315
+ 0.04350668716430664,
316
+ 0.04342476654052734,
317
+ 0.04359372711181641,
318
+ 0.043633663177490234,
319
+ 0.043614208221435545,
320
+ 0.04370943832397461,
321
+ 0.04362137603759766,
322
+ 0.04351795196533203,
323
+ 0.04354150390625,
324
+ 0.0435865592956543,
325
+ 0.04354662322998047,
326
+ 0.043422721862792966,
327
+ 0.04355379104614258,
328
+ 0.04354355239868164,
329
+ 0.04347903823852539,
330
+ 0.043524097442626954,
331
+ 0.04338790512084961,
332
+ 0.04335718536376953,
333
+ 0.04346060943603516,
334
+ 0.04352102279663086,
335
+ 0.04362547302246094,
336
+ 0.04347903823852539,
337
+ 0.043480064392089846,
338
+ 0.043474945068359375,
339
+ 0.04350668716430664,
340
+ 0.04361011123657227,
341
+ 0.04355788803100586,
342
+ 0.04364287948608398,
343
+ 0.04358041763305664,
344
+ 0.04362444686889649,
345
+ 0.04355686569213867,
346
+ 0.04354048156738281,
347
+ 0.0436121597290039,
348
+ 0.04353433609008789,
349
+ 0.04356710433959961,
350
+ 0.04345446395874023,
351
+ 0.04343500900268555,
352
+ 0.0436121597290039,
353
+ 0.043641857147216793,
354
+ 0.043442176818847655,
355
+ 0.04340019226074219,
356
+ 0.043478015899658204,
357
+ 0.04368281555175781,
358
+ 0.043515903472900394,
359
+ 0.04350259017944336,
360
+ 0.04355686569213867,
361
+ 0.04364287948608398,
362
+ 0.043730945587158204,
363
+ 0.043774974822998046,
364
+ 0.04369203186035156,
365
+ 0.04366950225830078,
366
+ 0.043641857147216793,
367
+ 0.04363673782348633,
368
+ 0.043638782501220705,
369
+ 0.04355276870727539,
370
+ 0.04357222366333008,
371
+ 0.043734016418457033,
372
+ 0.04354764938354492,
373
+ 0.04350371170043945,
374
+ 0.04368783950805664,
375
+ 0.04358041763305664,
376
+ 0.04356095886230469,
377
+ 0.04375961685180664,
378
+ 0.04358758544921875,
379
+ 0.04378009414672852,
380
+ 0.04385996627807617,
381
+ 0.04376166534423828,
382
+ 0.04369715118408203,
383
+ 0.04374835205078125,
384
+ 0.043630592346191405,
385
+ 0.04372582244873047,
386
+ 0.043894783020019534,
387
+ 0.04357120132446289,
388
+ 0.043579391479492184,
389
+ 0.04362444686889649,
390
+ 0.043579391479492184,
391
+ 0.04376268768310547,
392
+ 0.043758590698242186,
393
+ 0.04377804946899414,
394
+ 0.04376166534423828,
395
+ 0.04371148681640625,
396
+ 0.04377395248413086,
397
+ 0.043796478271484376,
398
+ 0.043720703125,
399
+ 0.04374835205078125,
400
+ 0.04365824127197265,
401
+ 0.04379033660888672,
402
+ 0.04374118423461914,
403
+ 0.04387942504882812,
404
+ 0.043757568359375,
405
+ 0.0435865592956543,
406
+ 0.04372889709472656,
407
+ 0.04371865463256836,
408
+ 0.043633663177490234,
409
+ 0.04374220657348633,
410
+ 0.04372480010986328,
411
+ 0.04391424179077148,
412
+ 0.04369203186035156,
413
+ 0.04375449752807617,
414
+ 0.04379955291748047,
415
+ 0.04373299026489258,
416
+ 0.04365311813354492,
417
+ 0.04363673782348633,
418
+ 0.04376678466796875,
419
+ 0.04361625671386719,
420
+ 0.04378726577758789,
421
+ 0.04370534515380859,
422
+ 0.043817985534667966,
423
+ 0.043630592346191405,
424
+ 0.043597824096679685,
425
+ 0.04364595031738281,
426
+ 0.04365926361083984,
427
+ 0.04360396957397461,
428
+ 0.04358041763305664,
429
+ 0.04362854385375976,
430
+ 0.04376166534423828,
431
+ 0.04358246231079101,
432
+ 0.043663360595703124,
433
+ 0.04359884643554687,
434
+ 0.04379238510131836,
435
+ 0.04371353530883789,
436
+ 0.043671550750732424,
437
+ 0.04377088165283203,
438
+ 0.04381081771850586,
439
+ 0.04386918258666992,
440
+ 0.04382515335083008,
441
+ 0.04376166534423828,
442
+ 0.04360806274414063,
443
+ 0.04368998336791992,
444
+ 0.043602943420410156,
445
+ 0.043663360595703124,
446
+ 0.04379852676391602,
447
+ 0.04358246231079101,
448
+ 0.04381388854980469,
449
+ 0.04373196792602539,
450
+ 0.04357529449462891,
451
+ 0.043650047302246094,
452
+ 0.0436234245300293,
453
+ 0.04342476654052734,
454
+ 0.04354662322998047,
455
+ 0.04345139312744141,
456
+ 0.04366950225830078,
457
+ 0.043589630126953126,
458
+ 0.04370431900024414,
459
+ 0.04357120132446289,
460
+ 0.043514881134033206,
461
+ 0.043633663177490234,
462
+ 0.04366233444213867,
463
+ 0.04363980865478516,
464
+ 0.043655166625976564,
465
+ 0.04353433609008789,
466
+ 0.04361523056030273,
467
+ 0.04374745559692383,
468
+ 0.043559806823730465,
469
+ 0.043622398376464845,
470
+ 0.04359884643554687,
471
+ 0.04350668716430664,
472
+ 0.043448318481445314,
473
+ 0.04370841598510742,
474
+ 0.04367769622802734,
475
+ 0.04369305419921875,
476
+ 0.043622398376464845,
477
+ 0.04373811340332031,
478
+ 0.043687934875488284,
479
+ 0.04364297485351563,
480
+ 0.04366019058227539,
481
+ 0.04382310485839844,
482
+ 0.04363161468505859,
483
+ 0.04380057525634766,
484
+ 0.04377190399169922,
485
+ 0.043911167144775394,
486
+ 0.04367871856689453,
487
+ 0.04356403350830078,
488
+ 0.04352511978149414,
489
+ 0.04358860778808594,
490
+ 0.043640830993652346,
491
+ 0.043663360595703124,
492
+ 0.04368281555175781,
493
+ 0.043753471374511715,
494
+ 0.04355583953857422,
495
+ 0.04349747085571289,
496
+ 0.04351078414916992,
497
+ 0.0437391357421875,
498
+ 0.04367462539672851,
499
+ 0.04359987258911133,
500
+ 0.04371353530883789,
501
+ 0.04353023910522461,
502
+ 0.043670528411865236,
503
+ 0.043602943420410156,
504
+ 0.04341145706176758,
505
+ 0.043638782501220705,
506
+ 0.04379955291748047,
507
+ 0.04360704040527344,
508
+ 0.0436940803527832,
509
+ 0.04360396957397461,
510
+ 0.04355276870727539,
511
+ 0.04373503875732422,
512
+ 0.043535358428955076,
513
+ 0.04358041763305664,
514
+ 0.04369100952148437,
515
+ 0.0436234245300293,
516
+ 0.04373503875732422,
517
+ 0.04369612884521484,
518
+ 0.04373196792602539,
519
+ 0.04375551986694336,
520
+ 0.0435968017578125,
521
+ 0.043717632293701174,
522
+ 0.043720703125,
523
+ 0.043676673889160154,
524
+ 0.0436234245300293,
525
+ 0.04373811340332031,
526
+ 0.04362956619262695,
527
+ 0.04354150390625,
528
+ 0.04334284973144531,
529
+ 0.043635711669921876,
530
+ 0.04372684860229492,
531
+ 0.04368281555175781,
532
+ 0.04356915283203125,
533
+ 0.04379852676391602,
534
+ 0.043848705291748044,
535
+ 0.04371558380126953,
536
+ 0.043843582153320314,
537
+ 0.04369919967651367,
538
+ 0.04359270477294922,
539
+ 0.04357734298706055,
540
+ 0.0435230712890625,
541
+ 0.043545600891113284,
542
+ 0.043687934875488284
543
+ ]
544
+ },
545
+ "throughput": {
546
+ "unit": "tokens/s",
547
+ "value": 22.91947882641629
548
+ },
549
+ "energy": null,
550
+ "efficiency": null
551
+ }
552
+ }