Neura commited on
Commit
4f4597e
1 Parent(s): 3d32165

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +9 -71
README.md CHANGED
@@ -11,8 +11,7 @@ tags:
11
  datasets:
12
  - common_voice_17_0
13
  ---
14
- # Neura Orca Gemma 7B
15
-
16
 
17
  <p align="center">
18
  <img src="neura_gemma.png" width=512 height=256 />
@@ -33,84 +32,23 @@ datasets:
33
 
34
  ## Uses
35
 
36
- Check out the Google Colab demo to run NeuraOrcaGemma7b on a free-tier Google Colab instance: [![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/drive/1wgiHZIi199MyI4YT3ZBiMj9je2IoA4Jd?usp=sharing)
37
-
38
-
39
  make sure these packages are installed:
40
  ```
41
- !pip install --no-deps xformers accelerate bitsandbytes
42
- !pip install -q -U transformers
43
  ```
44
  ```python
45
- from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
46
- import torch
47
- import os
48
- MODEL_PATH = "Neurai/NeuraOrcaGemma7b"
49
- quantization_config = BitsAndBytesConfig(
50
- load_in_4bit = True,
51
- bnb_4bit_quant_type="nf4",
52
- bnb_4bit_compute_dtype=torch.bfloat16,
53
- bnb_4bit_use_double_quant=True,
54
- )
55
-
56
- model = AutoModelForCausalLM.from_pretrained(
57
- MODEL_PATH,
58
- device_map = "auto",
59
- trust_remote_code = True,
60
- quantization_config=quantization_config,
61
- )
62
 
63
- tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
 
64
 
65
- input_prompt = """
66
- ### Instruction:{}
67
- ### Input:{}
68
- ### Response:{}"""
69
-
70
- input_text = input_prompt.format(
71
- "در مورد سری فوریه بهم توضیح میدی و فرمولش رو برام مینویسی",
72
- "",
73
- ""
74
- )
75
-
76
- inputs = tokenizer([input_text], return_tensors = "pt").to("cuda")
77
- outputs = model.generate(**inputs, max_new_tokens = 300, use_cache = True)
78
- response = tokenizer.batch_decode(outputs)[0]
79
  ```
80
- Generated text :
81
  ```
82
- سری فوریه یک سری ریاضی است که برای نمایش یک تابع پیوسته و متناوب در یک بازه زمانی معین استفاده می شود. این نام از ریاضیدان فرانسوی آگوستین-لویی کوشی گرفته شده است که آن را در سال 1826 معرفی کرد.
83
-
84
- فرمول سری فوریه به صورت زیر است:
85
-
86
- f(x) = a0 + sum(an * cos(n*pi*x/L)) + sum(bn * sin(n*pi*x/L))
87
-
88
- که در آن:
89
-
90
- - f(x) تابع پیوسته و متناوب در بازه زمانی [(-L/2, L/2] است
91
- - a0 مقدار میانگین مربع f(x) در بازه زمانی [(-L/2, L/2] است
92
- - an ضریب سری برای n-th term است
93
- - bn ضریب سری برای n-th term است
94
- - L طول بازه زمانی است
95
- - n یک عدد صحیح مثبت است
96
- - x یک متغیر واقعی است
97
- - pi (pi) یک ثابت ریاضی است
98
-
99
- برای یافتن ضرایب سری، باید f(x) را در بازه زمانی [(-L/2, L/2] با استفاده از فرمول های زیر تجزیه کنیم:
100
-
101
- an = (1/L) * int(-L/2, L/2) f(x) * cos(n*pi*x/L) dx
102
- bn = (1/L) * int(-L/2, L/2) f(x) * sin(n*pi*x/L) dx
103
-
104
- که در آن:
105
-
106
- - int نشان دهنده انتگرال است
107
- - L طول بازه زمانی است
108
- - n یک عدد صحیح مثبت است
109
- - x یک متغیر واقعی است
110
- - f(x) تابع پیوسته و متناوب در بازه زمانی [(-L/2, L/2] است
111
- - pi (pi) یک ثابت ریاضی است
112
 
113
- پس از یافتن ضرایب سری، می توان از فرمول سری فوریه برای نمایش f(x) در بازه زمانی [(-L/2, L/2] استفاده کرد.<eos>
114
  ```
115
 
116
 
 
11
  datasets:
12
  - common_voice_17_0
13
  ---
14
+ # Neura Speech Nemo
 
15
 
16
  <p align="center">
17
  <img src="neura_gemma.png" width=512 height=256 />
 
32
 
33
  ## Uses
34
 
 
 
 
35
  make sure these packages are installed:
36
  ```
37
+ !pip install nemo_toolkit['all']
 
38
  ```
39
  ```python
40
+ import nemo
41
+ print('nemo', nemo.__version__)
42
+ import numpy as np
43
+ import nemo.collections.asr as nemo_asr
 
 
 
 
 
 
 
 
 
 
 
 
 
44
 
45
+ asr_model = nemo_asr.models.EncDecRNNTBPEModel.from_pretrained(model_name="nvidia/stt_en_fastconformer_hybrid_large_streaming_multi")
46
+ asr_model.transcribe(paths2audio_files=['persian_audio.wav', ], batch_size=1)[0]
47
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
48
  ```
49
+ trascribed text :
50
  ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
51
 
 
52
  ```
53
 
54