mert-delibalta commited on
Commit
af0705f
1 Parent(s): 21efdd4

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +20 -34
README.md CHANGED
@@ -93,8 +93,8 @@ model-index:
93
  alt="Orbita LLM" width="500"/>
94
 
95
  # Orbita-v0.1
96
- This model is a Turkish Large Language Model with multiple abilites across different dimensions on the Turkish Language covering a variety of Tasks like Coding,Math,...
97
- This model is an extended version of a Qwen-based Large Language Model (LLM) for Turkish. It was trained on a cleaned Turkish dataset carefully annotated to carry out turkish instructions in an accurate and organized manner. This model was fully finetuned extensively on 8 H100 GPU's for 2 days using a carefully annotated Turkish dataset.
98
  ## Model Details
99
 
100
  - **Base Model**: Qwen 14B based LLM
@@ -113,11 +113,11 @@ model = AutoModelForCausalLM.from_pretrained(
113
  torch_dtype="auto",
114
  device_map="auto"
115
  )
116
- tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen1.5-14B-Chat")
117
 
118
- prompt = "türkiyenin inflasyonu nasıl çözebiliriz?"
119
  messages = [
120
- {"role": "system", "content": "Sen Orbina ai tarafından üretelen bir yapay zekasındır, soruları uygun bir şekilde cevap veriyorsun"},
121
  {"role": "user", "content": prompt}
122
  ]
123
  text = tokenizer.apply_chat_template(
@@ -129,7 +129,11 @@ model_inputs = tokenizer([text], return_tensors="pt").to(device)
129
 
130
  generated_ids = model.generate(
131
  model_inputs.input_ids,
132
- max_new_tokens=512
 
 
 
 
133
  )
134
  generated_ids = [
135
  output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
@@ -141,48 +145,30 @@ response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
141
 
142
  ```
143
  Prompt:
144
-
145
- Türkiyede gezebilecek yelereri saydır
146
 
147
  Cevap:
 
148
 
149
- Türkiye, zengin tarihi ve doğal güzellikleriyle dünya çapında ünlüdür. İşte Türkiye'de gezebileceğiniz beş popüler yer:
150
-
151
- 1. **Ege Bölgesi**: Ege Bölgesi, İzmir ve Ege şehirlerini içerir ve turkuaz suları, güzel plajları ve antik tapınaklarıyla ünlüdür.
152
-
153
- 2. **Anadolu Yarımadası**: Anadolu Yarımadası'nda bulunan Cappadocia bölgesi, volkanik dağlar ve etkileyici manzaralarıyla dikkat çeker. Göreme Kalesi gibi tarihi yapılar bu bölgede bulunur.
154
-
155
- 3. **İzmit**: İzmit bölgesindeki Sakız Adası (Sakız Adası), özellikle yaz aylarında popüler bir tatil beldesidir çünkü güzel plajları ve sıcak iklimi ile bilinir.
156
 
157
- 4. **Bodrum**: Bodrum şehri, eski bir liman şehri olup tarihi anıtlarıyla ünlüdür. Mağara müzelerine sahip olan bu şehir aynı zamanda Bodrum Sarayı'na ev sahipliği yapmaktadır.
158
-
159
- 5. **Antalya**: Antalya kentindeki Alanya kasabası veya Kaşmir bölgesindeki Kemer kasabası gibi yerlerde tatil yapabilirsiniz; burada güzel plajlara ulaşabilirsiniz veya doğayla iç içe olabilirsiniz.
160
-
161
- Bu örneklerden yola çıkarak Türkiye'nin birçok farklı bölgeyi keşfetmek mümkündür; her bir bölge kendine has özelliklere sahip olup ziyaretçilerine unutulmaz deneyimler sunmaktadır
162
  ```
163
 
164
  ```
165
  Prompt:
166
-
167
- bana bir python hello world kod yaz
168
 
169
  Cevap:
170
-
171
-
172
- Python'da "Hello, World!" yazmak için aşağıdaki basit kodu kullanabilirsiniz:
173
 
174
  ``python
175
-
176
- print("Hello, World!")
177
- ``
178
-
179
- Bu kodu bir Python dosyasına yapıştırarak ve ardından bu dosyayı çalıştırarak ekrana "Hello, World!" yazısını görebilirsiniz. Örneğin, `hello_world.py` adında bir dosya oluşturup içine bu kodu kopyalayıp kaydettikten sonra komut satırında (terminalde) şu komutu kullanarak çalıştırabilirsiniz:
180
-
181
- ``bash
182
- python hello_world.py
183
  ``
184
 
185
- Eğer Python yüklü değilse veya farklı bir Python sürümü kullanıyorsanız (örneğin Python 2), uygun olan komutları kullanmalısınız.
186
  ```
187
 
188
  # [Open LLM Turkish Leaderboard Evaluation Results](https://huggingface.co/spaces/malhajar/OpenLLMTurkishLeaderboard)
 
93
  alt="Orbita LLM" width="500"/>
94
 
95
  # Orbita-v0.1
96
+ This model is a Turkish Large Language Model with multiple abilites across different dimensions on the Turkish Language covering a variety of Tasks like Coding, Math, etc...
97
+ This model is an extended version of a Qwen-based Large Language Model (LLM) for Turkish. It was trained on a cleaned Turkish dataset carefully annotated to carry out turkish instructions in an accurate and organized manner. This model was fully finetuned extensively on 8x H100 GPU's for 2 days using a carefully annotated Turkish dataset.
98
  ## Model Details
99
 
100
  - **Base Model**: Qwen 14B based LLM
 
113
  torch_dtype="auto",
114
  device_map="auto"
115
  )
116
+ tokenizer = AutoTokenizer.from_pretrained("Orbina/Orbita-v0.1")
117
 
118
+ prompt = "Python'da ekrana 'Merhaba Dünya' nasıl yazılır?"
119
  messages = [
120
+ {"role": "system", "content": "Sen, Orbina AI tarafından üretilen ve verilen talimatları takip ederek en iyi cevabı üretmeye çalışan yardımcı bir yapay zekasın."},
121
  {"role": "user", "content": prompt}
122
  ]
123
  text = tokenizer.apply_chat_template(
 
129
 
130
  generated_ids = model.generate(
131
  model_inputs.input_ids,
132
+ temperature=0.3,
133
+ top_k=50,
134
+ top_p=0.9,
135
+ max_new_tokens=512,
136
+ repetition_penalty=1,
137
  )
138
  generated_ids = [
139
  output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
 
145
 
146
  ```
147
  Prompt:
148
+ Türkiye'deki finansal kurumlar, yapay zeka ile birlikte gelen veri güvenliği risklerini nasıl yönetiyor, 3 örnek verir misin?
 
149
 
150
  Cevap:
151
+ Türkiye'deki finansal kurumlar, yapay zeka (AI) teknolojilerinin getirdiği veri güvenliği riskleri çeşitli yöntemlerle ele almakta ve bu riskleri azaltmaya çalışmaktadır. İşte üç örnek:
152
 
153
+ 1. **Veri Şifreleme:** Finansal kuruluşlar, müşteri bilgileri gibi hassas verileri şifrelemeyi kullanarak veri ihlallerine karşı koruma sağlar. AES (Advanced Encryption Standard), RSA (Rivest-Shamir-Adleman) veya ECC (Elliptik Eğri Kriptografisi) gibi güçlü şifreleme algoritmaları, verilerin okunmasını engelleyebilir.
154
+ 2. **Anomali Tespit Sistemleri:** Yapay zeka destekli anomali tespit sistemleri, beklenmedik davranışları algılayabilir ve güvenlik ekiplerini uyarır. Bu sistemler, makine öğrenimi modelleri sayesinde zaman içinde daha etkili hale gelebilir ve dolandırıcılık faaliyetlerini önlemede önemli rol oynar.
155
+ 3. **Sürekli İzleme ve Güvenlik Politikası Uygulama:** Türkiye'deki finansal kurumlar, sürekli izleme ve güvenlik politikalarını uygularak veri güvenliğini sürdürür. Bu süreçlerde düzenli güvenlik denetimleri yapılır ve tüm personelin güvenlik konusunda eğitildiği göz önünde bulundurulur. Ayrıca, müşterilere de güvenlik protokollerini anlatan eğitimler sunulur.
 
 
 
 
156
 
157
+ Bu örnekler, Türkiye'deki finansal kurumların yapay zeka ile ilgili veri güvenliği risklerini yönetmek için kullandıkları bazı stratejileri göstermektedir. Ancak herhangi bir güvenlik sistemi mükemmel değildir ve bu nedenle kurumlar da sürekli olarak güvenlik durumlarını değerlendirip iyileştirmeler yapmaktadırlar.
 
 
 
 
158
  ```
159
 
160
  ```
161
  Prompt:
162
+ Python'da ekrana "Merhaba Dünya" nasıl yazılır?
 
163
 
164
  Cevap:
165
+ Python'da ekrana "Merhaba Dünya" yazmak için `print` fonksiyonunu kullanabilirsiniz. İşte basit bir örnek:
 
 
166
 
167
  ``python
168
+ print("Merhaba Dünya")
 
 
 
 
 
 
 
169
  ``
170
 
171
+ Bu kodu çalıştırdığınızda, konsol ekranında "Merhaba Dünya" metnini göreceksiniz. `print` fonksiyonu, verilen argümanı (bu durumda "Merhaba Dünya") alır ve onu çıktı olarak verir.
172
  ```
173
 
174
  # [Open LLM Turkish Leaderboard Evaluation Results](https://huggingface.co/spaces/malhajar/OpenLLMTurkishLeaderboard)