• الحمدللہ محدث فورم کو نئےسافٹ ویئر زین فورو 2.1.7 پر کامیابی سے منتقل کر لیا گیا ہے۔ شکایات و مسائل درج کروانے کے لئے یہاں کلک کریں۔
  • آئیے! مجلس التحقیق الاسلامی کے زیر اہتمام جاری عظیم الشان دعوتی واصلاحی ویب سائٹس کے ساتھ ماہانہ تعاون کریں اور انٹر نیٹ کے میدان میں اسلام کے عالمگیر پیغام کو عام کرنے میں محدث ٹیم کے دست وبازو بنیں ۔تفصیلات جاننے کے لئے یہاں کلک کریں۔

اردو سپیچ ٹو ٹیکسٹ کارپس

مظاہر امیر

مشہور رکن
شمولیت
جولائی 15، 2016
پیغامات
1,427
ری ایکشن اسکور
411
پوائنٹ
190
بولیں اور ٹائپ کریں :

Phonetically Rich Urdu Speech Corpus​

  • A step towards Large Vocabulary Urdu Speech Recognition
The Urdu Phonetically Rich Speech Corpus consists of 70 minutes of transcribed read speech consisting of 708 greedily created sentences representing all phonemic and triphonemic combinations in Urdu (based on an 18 million word corpus of Urdu news articles). It consists of 10,101 tokens with 5,656 unique words. In addition to providing phonetic cover for Urdu, the corpus is also phonemically balanced. It also provides triphonemic cover however it is not completely balanced for triphonemes. It contains 60 unique phones and 42,289 phone occurrences. The sentences contained in this corpus are all manually created by trained linguists following a greedy approach to accommodate the words (which were selected using a set cover algorithm) and to prevent additional words as much as possible. Therefore, while correct grammatically, there are some instances where the choice of words in the sentences is unusual.
About us
The Urdu Phonetically Rich Speech Corpus is released by Center for Speech and Language Technologies (CSaLT) at Information Technology University, Lahore.
Credits
Project Supervisor: Dr. Sarmad Hussain
Researcher: Agha Ali Raza
Team: Huda Sarfraz, Inaam Ullah, Zahid Sarfraz
 

مظاہر امیر

مشہور رکن
شمولیت
جولائی 15، 2016
پیغامات
1,427
ری ایکشن اسکور
411
پوائنٹ
190
@عبدالرحیم رحمانی بھائی، السلام عليكم ورحمة الله وبركاته۔
یہ سوفٹوئر نہیں ہے ، کارپس ہے ( یعنی کوڈ ہے ) یا کوڈ کے کچھ حصے ہیں ، پروگرامرز اور ڈیولپرز کے لئے ۔ اس پر ابھی کام ہورہا ہے ۔
اسطرح کا آپ اگر نمونہ دیکھنا چاہتے ہیں تو گوگل ڈاکس پر جائیں ، وہاں نیا ڈاکومنٹ بنائیں ، ٹولز میں سے سپیچ ٹو ٹیکسٹ سلیکٹ کریں اور زبان ہندی سلیکٹ کریں ۔پھر بولتے جائیں وہ ٹائپ کرتا جائے گا ( آپ تو ہندی پڑھ لیں گے) جو ہندی نہ جانتے ہوں وہ اس ٹیکسٹ کو گوگل ٹرانسلیشن سے کنورٹ کرلیں ۔
جزاک اللہ خیرا کثیرا ۔
 
Top