Spaces:

radames
/

TinyStories-Candle-Wasm-Magic

Running

App Files Files Community

radames commited on Sep 27, 2023

Commit

43eb4d6

•

1 Parent(s): fca36d1

fix firstToken

Browse files

Files changed (7) hide show

code.js +4 -0
index.html +25 -16
lib/m.d.ts +3 -2
lib/m.js +3 -2
lib/m_bg.wasm +2 -2
lib/m_bg.wasm.d.ts +1 -1
llama2c.worker.js +10 -2

code.js CHANGED Viewed

@@ -87,6 +87,7 @@ async function generateSequence({
   maxSeqLen,
   temp,
   repeatPenalty,
   contentEl,
   controller,
 }) {
@@ -104,6 +105,7 @@ async function generateSequence({
       prompt,
       temp,
       repeatPenalty,
       seed: seed,
       maxSeqLen,
       command: "start",
@@ -201,6 +203,7 @@ async function run(containers, controller) {
   const maxSeqLen = document.querySelector("#max-seq");
   const temp = document.querySelector("#temperature");
   const repeatPenalty = document.querySelector("#repeat-penalty");
   const modelID = document.querySelector("#model");
   const weightsURL = `${MODELS_BASE_URL}/${MODELS[getValue(modelID)].url}`;
@@ -223,6 +226,7 @@ async function run(containers, controller) {
         modelID: getValue(modelID),
         maxSeqLen: getValue(maxSeqLen),
         temp: getValue(temp),
         repeatPenalty: getValue(repeatPenalty),
         contentEl: container,
         controller,

   maxSeqLen,
   temp,
   repeatPenalty,
+  top_p,
   contentEl,
   controller,
 }) {
       prompt,
       temp,
       repeatPenalty,
+      top_p,
       seed: seed,
       maxSeqLen,
       command: "start",
   const maxSeqLen = document.querySelector("#max-seq");
   const temp = document.querySelector("#temperature");
   const repeatPenalty = document.querySelector("#repeat-penalty");
+  const topP = document.querySelector("#top-p");
   const modelID = document.querySelector("#model");
   const weightsURL = `${MODELS_BASE_URL}/${MODELS[getValue(modelID)].url}`;
         modelID: getValue(modelID),
         maxSeqLen: getValue(maxSeqLen),
         temp: getValue(temp),
+        top_p: getValue(topP),
         repeatPenalty: getValue(repeatPenalty),
         contentEl: container,
         controller,

index.html CHANGED Viewed

@@ -3,20 +3,23 @@
     <meta content="text/html;charset=utf-8" http-equiv="Content-Type" />
     <title>TinyStories - Candle Llama.c Rust/WASM</title>
   </head>
   <body></body>
 </html>
-<!doctype html>
 <html>
   <head>
     <meta charset="UTF-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
     <style>
       @import url("https://fonts.googleapis.com/css2?family=IBM+Plex+Mono:wght@200;400;500;700&family=Source+Sans+3:wght@200;400;500;600;700;800;900&display=swap");
       html,
       body {
         font-family: "Source Sans 3", sans-serif;
       }
       .mono {
         font-family: "IBM Plex Mono", monospace;
       }
@@ -44,6 +47,7 @@
     </style>
     <script type="module" src="./code.js"></script>
   </head>
   <body class="container mx-auto max-w-2xl p-4 bg-[#020058]">
     <img src="./imgs/cat.png" class="fixed top-0 left-0 w-20 -z-10" />
     <header class="py-2 mb-6">
@@ -66,20 +70,17 @@
     </header>
     <form
       id="form"
-      class="flex text-normal px-1 py-2 border-2 border-white rounded-md items-center"
-    >
       <input type="submit" hidden="" />
       <input
         type="text"
         id="prompt"
         class="w-full px-3 py-2 mx-1 resize-none outline-none bg-[#020058] text-white"
         placeholder="Add your prompt here..."
-        value="Once upon a time"
-      />
       <button
         id="run"
-        class="bg-white hover:bg-gray-400 text-black font-normal py-2 w-20 rounded disabled:bg-gray-300 disabled:cursor-not-allowed"
-      >
         Create
       </button>
     </form>
@@ -89,8 +90,7 @@
         <label for="model" class="text-sm">Models Options: </label>
         <select
           id="model"
-          class="border-2 border-white rounded-md font-light text-white bg-[#020058] px-1"
-        >
           <option value="stories15M" selected>stories 15M (60.8 MB)</option>
           <option value="stories42M">stories 42M (167 MB)</option>
           <option value="stories110M">stories 110M (438 MB) WARNING</option>
@@ -104,8 +104,7 @@
           max="256"
           step="1"
           value="150"
-          oninput="this.nextElementSibling.value = Number(this.value)"
-        />
         <output class="n-block"> 150</output>
         <label class="text-sm font-medium" for="temperature">Temperature</label>
         <input
@@ -115,23 +114,33 @@
           max="2"
           step="0.01"
           value="0.2"
-          oninput="this.nextElementSibling.value = Number(this.value).toFixed(2)"
-        />
         <output class="n-block">0.2</output>
         <label class="text-sm font-medium" for="repeat_penalty"
           >Repeat Penalty</label
         >
         <input
           type="range"
           id="repeat-penalty"
-          min="-2"
           max="2"
           step="0.01"
           value="1.10"
-          oninput="this.nextElementSibling.value = Number(this.value).toFixed(2)"
-        />
         <output class="n-block">1.10</output>
       </div>
     </details>
     <div class="text-base grid gap-3 py-5" id="container"></div>

     <meta content="text/html;charset=utf-8" http-equiv="Content-Type" />
     <title>TinyStories - Candle Llama.c Rust/WASM</title>
   </head>
   <body></body>
 </html>
+<!DOCTYPE html>
 <html>
   <head>
     <meta charset="UTF-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
     <style>
       @import url("https://fonts.googleapis.com/css2?family=IBM+Plex+Mono:wght@200;400;500;700&family=Source+Sans+3:wght@200;400;500;600;700;800;900&display=swap");
       html,
       body {
         font-family: "Source Sans 3", sans-serif;
       }
       .mono {
         font-family: "IBM Plex Mono", monospace;
       }
     </style>
     <script type="module" src="./code.js"></script>
   </head>
   <body class="container mx-auto max-w-2xl p-4 bg-[#020058]">
     <img src="./imgs/cat.png" class="fixed top-0 left-0 w-20 -z-10" />
     <header class="py-2 mb-6">
     </header>
     <form
       id="form"
+      class="flex text-normal px-1 py-2 border-2 border-white rounded-md items-center">
       <input type="submit" hidden="" />
       <input
         type="text"
         id="prompt"
         class="w-full px-3 py-2 mx-1 resize-none outline-none bg-[#020058] text-white"
         placeholder="Add your prompt here..."
+        value="Once upon a time" />
       <button
         id="run"
+        class="bg-white hover:bg-gray-400 text-black font-normal py-2 w-20 rounded disabled:bg-gray-300 disabled:cursor-not-allowed">
         Create
       </button>
     </form>
         <label for="model" class="text-sm">Models Options: </label>
         <select
           id="model"
+          class="border-2 border-white rounded-md font-light text-white bg-[#020058] px-1">
           <option value="stories15M" selected>stories 15M (60.8 MB)</option>
           <option value="stories42M">stories 42M (167 MB)</option>
           <option value="stories110M">stories 110M (438 MB) WARNING</option>
           max="256"
           step="1"
           value="150"
+          oninput="this.nextElementSibling.value = Number(this.value)" />
         <output class="n-block"> 150</output>
         <label class="text-sm font-medium" for="temperature">Temperature</label>
         <input
           max="2"
           step="0.01"
           value="0.2"
+          oninput="this.nextElementSibling.value = Number(this.value).toFixed(2)" />
         <output class="n-block">0.2</output>
         <label class="text-sm font-medium" for="repeat_penalty"
           >Repeat Penalty</label
         >
         <input
           type="range"
           id="repeat-penalty"
+          min="1"
           max="2"
           step="0.01"
           value="1.10"
+          oninput="this.nextElementSibling.value = Number(this.value).toFixed(2)" />
         <output class="n-block">1.10</output>
+        <label class="text-sm font-medium" for="top-p">Top P</label>
+        <input
+          type="range"
+          id="top-p"
+          min="0"
+          max="1"
+          step="0.01"
+          value="1.00"
+          oninput="this.nextElementSibling.value = Number(this.value).toFixed(2)" />
+        <output class="n-block">1.00</output>
       </div>
     </details>
     <div class="text-base grid gap-3 py-5" id="container"></div>

lib/m.d.ts CHANGED Viewed

@@ -16,11 +16,12 @@ export class Model {
 /**
 * @param {string} prompt
 * @param {number} temp
 * @param {number} repeat_penalty
 * @param {bigint} seed
 * @returns {string}
 */
-  init_with_prompt(prompt: string, temp: number, repeat_penalty: number, seed: bigint): string;
 /**
 * @returns {string}
 */
@@ -34,7 +35,7 @@ export interface InitOutput {
   readonly __wbg_model_free: (a: number) => void;
   readonly model_new: (a: number, b: number, c: number, d: number, e: number) => void;
   readonly model_get_seq_len: (a: number) => number;
-  readonly model_init_with_prompt: (a: number, b: number, c: number, d: number, e: number, f: number, g: number) => void;
   readonly model_next_token: (a: number, b: number) => void;
   readonly main: (a: number, b: number) => number;
   readonly __wbindgen_add_to_stack_pointer: (a: number) => number;

 /**
 * @param {string} prompt
 * @param {number} temp
+* @param {number} top_p
 * @param {number} repeat_penalty
 * @param {bigint} seed
 * @returns {string}
 */
+  init_with_prompt(prompt: string, temp: number, top_p: number, repeat_penalty: number, seed: bigint): string;
 /**
 * @returns {string}
 */
   readonly __wbg_model_free: (a: number) => void;
   readonly model_new: (a: number, b: number, c: number, d: number, e: number) => void;
   readonly model_get_seq_len: (a: number) => number;
+  readonly model_init_with_prompt: (a: number, b: number, c: number, d: number, e: number, f: number, g: number, h: number) => void;
   readonly model_next_token: (a: number, b: number) => void;
   readonly main: (a: number, b: number) => number;
   readonly __wbindgen_add_to_stack_pointer: (a: number) => number;

lib/m.js CHANGED Viewed

@@ -181,18 +181,19 @@ export class Model {
     /**
     * @param {string} prompt
     * @param {number} temp
     * @param {number} repeat_penalty
     * @param {bigint} seed
     * @returns {string}
     */
-    init_with_prompt(prompt, temp, repeat_penalty, seed) {
         let deferred3_0;
         let deferred3_1;
         try {
             const retptr = wasm.__wbindgen_add_to_stack_pointer(-16);
             const ptr0 = passStringToWasm0(prompt, wasm.__wbindgen_malloc, wasm.__wbindgen_realloc);
             const len0 = WASM_VECTOR_LEN;
-            wasm.model_init_with_prompt(retptr, this.__wbg_ptr, ptr0, len0, temp, repeat_penalty, seed);
             var r0 = getInt32Memory0()[retptr / 4 + 0];
             var r1 = getInt32Memory0()[retptr / 4 + 1];
             var r2 = getInt32Memory0()[retptr / 4 + 2];

     /**
     * @param {string} prompt
     * @param {number} temp
+    * @param {number} top_p
     * @param {number} repeat_penalty
     * @param {bigint} seed
     * @returns {string}
     */
+    init_with_prompt(prompt, temp, top_p, repeat_penalty, seed) {
         let deferred3_0;
         let deferred3_1;
         try {
             const retptr = wasm.__wbindgen_add_to_stack_pointer(-16);
             const ptr0 = passStringToWasm0(prompt, wasm.__wbindgen_malloc, wasm.__wbindgen_realloc);
             const len0 = WASM_VECTOR_LEN;
+            wasm.model_init_with_prompt(retptr, this.__wbg_ptr, ptr0, len0, temp, top_p, repeat_penalty, seed);
             var r0 = getInt32Memory0()[retptr / 4 + 0];
             var r1 = getInt32Memory0()[retptr / 4 + 1];
             var r2 = getInt32Memory0()[retptr / 4 + 2];

lib/m_bg.wasm CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:761e18f3da99de2c2eac0f5bc13dee39fc412c472694d277bfe1cd4b1e5809d7
-size 3725264

 version https://git-lfs.github.com/spec/v1
+oid sha256:b7e872b0d61cb8dc0ea356c867b6082ac50c68639165c63728c7f3ef1a0f5979
+size 3794192

lib/m_bg.wasm.d.ts CHANGED Viewed

@@ -4,7 +4,7 @@ export const memory: WebAssembly.Memory;
 export function __wbg_model_free(a: number): void;
 export function model_new(a: number, b: number, c: number, d: number, e: number): void;
 export function model_get_seq_len(a: number): number;
-export function model_init_with_prompt(a: number, b: number, c: number, d: number, e: number, f: number, g: number): void;
 export function model_next_token(a: number, b: number): void;
 export function main(a: number, b: number): number;
 export function __wbindgen_add_to_stack_pointer(a: number): number;

 export function __wbg_model_free(a: number): void;
 export function model_new(a: number, b: number, c: number, d: number, e: number): void;
 export function model_get_seq_len(a: number): number;
+export function model_init_with_prompt(a: number, b: number, c: number, d: number, e: number, f: number, g: number, h: number): void;
 export function model_next_token(a: number, b: number): void;
 export function main(a: number, b: number): number;
 export function __wbindgen_add_to_stack_pointer(a: number): number;

llama2c.worker.js CHANGED Viewed

@@ -53,20 +53,28 @@ async function generate(data) {
     tokenizerURL,
     prompt,
     temp,
     repeatPenalty,
     seed,
     maxSeqLen,
   } = data;
   try {
     self.postMessage({ status: "loading", message: "Starting llama2.c" });
     const model = await Llama2C.getInstance(weightsURL, modelID, tokenizerURL);
     self.postMessage({ status: "loading", message: "Initializing model" });
-    model.init_with_prompt(prompt, temp, repeatPenalty, seed);
     const seq_len = model.get_seq_len();
-    let sentence = "";
     let maxTokens = maxSeqLen ? maxSeqLen : seq_len - prompt.length - 1;
     let startTime = performance.now();
     let tokensCount = 0;

     tokenizerURL,
     prompt,
     temp,
+    top_p,
     repeatPenalty,
     seed,
     maxSeqLen,
   } = data;
   try {
+    console.log(data);
     self.postMessage({ status: "loading", message: "Starting llama2.c" });
     const model = await Llama2C.getInstance(weightsURL, modelID, tokenizerURL);
     self.postMessage({ status: "loading", message: "Initializing model" });
+    const firstToken = model.init_with_prompt(
+      prompt,
+      temp,
+      top_p,
+      repeatPenalty,
+      seed
+    );
     const seq_len = model.get_seq_len();
+    let sentence = firstToken;
     let maxTokens = maxSeqLen ? maxSeqLen : seq_len - prompt.length - 1;
     let startTime = performance.now();
     let tokensCount = 0;