Feb 24, 2016
بسم الله الرحمـن الرحيم
عال )تعريب الحاسبات(428عنوان البحث
) تحويل النصوص العربية إلى صوت (
أسماء المجموعة:منصور العثمانياسر النخليماجد الشمري
مقدمة
ما هو برنامج تحويل النصإلى صوت؟
-Text-To"تحويل النص إلى صوت Speech ويمكن اختصارها إلى
TTS هو برنامج حاسوبي يقوم بقراءة النص و من ثم نطق
النص بصوت مرتفع ، سواء تم إدخال النص من المستخدم
مباشرة أو عن طريق تمرير ملف نصي سبق كتابته باستخدام
برامج الكتابة النصية المختلفة."
TTSتاريخ برامج التحويل
1 -Apple : أول النظم التي تدعم OكانتTTS و م باستخدام برنامج 1984ذلك في سنة
MacInTalk و تم تطويرها بإضافة عينات صوتية أكثر جودة و حاليا تم االعتماد على
Mac في أنظمة تشغيل VoiceOverبرنامج OS X.
2 -Microsoft : طريق برامج Oكانت بدايتها عن( Oالثالث OالطرفAdd-On و كان ذلك لنظام )
و من إصدار Win 98 و Win 95التشغيل Win2000 Oأصبح ال TTS.النظام Oجزء من
؟TTSمن يستخدم برامج :من يعاني من مشكلة القراءة
.المكفوفين )1.الذين يعانون من ضعف النظر )2
.)Dyslexia( من يعاني من اضطراب القراءة )3.األميين )4
:من يستخدمها للتسهيل في العمل سماع الملف أثناء االنشغال بأمور أخرى مثل: )1
.)القيادة , العمل اليدوي .... الخ(.للذين ترهقهم القراءة لفترة طويلة )2
؟TTSمن يستخدم برامج
:من يستخدمونها تجاريا( بعض الشركات تستخدم هذه البرامج 1
للرد اآللي )هاتف خدمة العمالـء(.
( استخدام بعض الشركات لهذه البرامج 2 من شركة Kindleلتطوير أجهزتها )جهاز
Amazon.)
TTSأبرز المشاكل و الصعوبات التي ظهرت لدى
حروف تنطق وال تكتب و حروف 1(تكتب وال تنطق.
عالمات الضبط بالشكل.2(قراءة األرقام.3(االختصارات.4(النطق الصحيح للكلمة 5(
Pronunciation.
المراحل التي تمر بها عملية تحويل النصوص إلى صوت
واألدوات المستخدمة.
المرحلة األولى : تحليل النص
المرحلة الثانية: توليد الكالم
المرحلة األولى: تحليل النص
:Text Normalization- تطبيع النص 1
تقسيم الجملة إلى عدة كلمات معمراعاة الفارق الزمني.
.تفسير األرقام أو الرموز .عزل الكلمات ضمن النص.معالجة عالمات الترقيم مراعاة ما إذا كان هناك الم شمسية أو
شدة أو مد ... إلخ.
المرحلة األولى: تحليل النص2 إزالة الغموض الكتابي - Homograph
Disambiguation:
.إعراب الكلمة بشكل صحيح
:Word Pronunciation- نطق الكلمة 3
انتاج سلسلة من المقاطع الصوتية )الترميزات (.phonemesالصوتية
المرحلة األولى: تحليل النص4 العروض - Prosody: العروض هو عبارة عن تحديد حدة وسرعة "
وحجم الصوت الذي يستخدم لنطق المقاطع " الصوتية والكلمات والجمل
. البحث عن عالمات الترقيم.تركيب وترتيب هذه المعلومات مع بعضها.توليد النص الكلي الناتج النهائي: قائمة من الترميزات الصوتية مع
الحدة والسرعة والحجم لكل مقطع.
المرحلة الثانية: توليد الكالم 1 تشغيل الصوت - play Audio :
:طريقة تسجيل الترميزات الصوتيةالمشكلة:
حدة وسرعة الصوت عند نهاية الكلمة تختلف عنها في حال ورود الفونيم في بداية الكلمة.
التقليل من الخلل عن طريق دمج حواف الحل: المقطعين.
المرحلة الثانية: توليد الكالم
:المشكلة الصوت المنطوق لكل فونيم
)ترميز صوتي( يتأثر بشكل واضح بالترميزات الصوتية المحيطة به.
:الحل تسجيل جميع المقاطع الصوتية
الممكنة لكل ترميز
المرحلة الثانية: توليد الكالم
2 توليد الصوت - Generating the Voice:
قراءة مقاطع نصية تحتوي على جميعاالحتماالت الممكنة للفونيمات.
تمرـير النص الناتج إلى برنامج يتعرف علىالصوت.
.تخزين المقاطع الصوتية في قاعدة البيانات
المرحلة الثانية: توليد الكالم3 تحضير التسجيالت الصوتية - Preparing of the
Record:
أ - تسجيل جميع المقاطع الممكنة في الـلغة العربية. مقطع 2000تحتاج إلى تسجيل ما يفوق على من عيوبها:
صوتي لتغطية اللغة .من مميزاتها أنها ذات نتائج دقيقة
ب - تسجيل الحرف والحركة بشكل منفصل ملف صوتي31تسجيل فصل الحركات عن األحرفمن عيوبها: أنها تفتقرإلى الدقة
المرحلة الثانية: توليد الكالم
ج – تسجيل كل حرف مع جميعالحركات الممكنة.
ملف صوتي.115تسجيل
المرحلة الثانية: توليد الكالم
Generating - توليد الترميز الصوتي للنص المنطوق 4 graphemes:
الجدول التالي يوضح الطريقة التي تستخدم في الترميز
المرحلة الثانية: توليد الكالم
:مثال + أ 1*االلف تمثل ب 1*الفتحه تمثل بالرقم 1_1*تصبح النتيجة
O1 الفتحة ب O2 والضمة ب Oوالسكون 3والكسرة ب O4ب
قواعد النطق في اللغة العربية
-الالم القمرية والالم الشمسية :1اذا تليت بأحد الحروف -الالم القمرية: 1.1
االربعة عشر المجموعه في )ابلغ حجك وخف عقيمه(.
اذا تليت بأحد الحروف -الالم الشمسية: 2.2 االربعة عشر وهي )ط، ث، ص، ر، ت، ض،
ذ، ن، د، س، ظ، ز، ش، ل).
قواعد النطق في اللغة العربية
في حالة ورود التنوين على أحد التنوين: -2الحروف ـغير المعتله يمكن تقسيمها
كالتالي: : يستبدل التنوين بضمة يليها تنوين الضم
نون ساكنة.)بيت كبير( تصبح )بيتن كبير (. :يستبدل التنوين بفتحة يليها تنوين الفتح
نون ساكنة. : يستبدل التنوين بكسر يليها تنوين الكسر
نون ساكنة.في حال ورود التنوين على االلف مالحظة:
نقوم بحذف األلف والنون ونستبدلهما بنون ساكنة مثل )سالما( تصبح )سالمن(
قواعد النطق في اللغة العربية
يمكن حذف حرف المد اذا -حروف المد : 3تاله في الكلمة التالية حرف ساكن عند الوقف
عليه مثل )في البيت ( تصبح )فلبيت(. أيضا يمكن حذف المد اذا تاله في الكلمة تنوين
ساكن مثل )فتى ( لتصبح )فتن(.
تقرأ هاء إذا تم الوقف عليها عند -تاء التأنيث: 4النطق . وتنطق تاء اذا تم وصلها في النطق.
قواعد النطق في اللغة العربية
-فك المد والتضعيف :5- الشدة في اللغة الغربية توضح بأنه يجب 5.1
لفظ الحرف مرتين .فيتم استبدال الشدة بحرف ساكن من نفس الحرف ويحافظ
الحرف الذي عليه حركت الشده على حركتة. مثل ” السالم ” تصبح ” السسالم“.
- المد يفك الى عناصره المفردة أي همزة 5.2“مع ألف مدية . مثل ” آمين ” تصبح ”أامين
استحصال الرموز Tokenization
خطوات استحصال الرموز:-مسح كامل النص وتحديد الكلمات.1-وضع فواصل بين الكلمات وتحديد حركة كل 2
حرف .-يوضع سكون للحرف الذي اليملك حركة.3
5 و 2يمكن تطبيق القواعد السابقه رقم على هذه الطريقة.
Graphemeتوليد الترميز الصوتي
تحديد مواضع احرف المد عن طريقمسح مخرجات الخطوة االولى .
4 و 3 و1تطبيق القواعد. يتم تعيين مواضع الوقف بين الكلمات
ليتم توليد الترميز الصوتي ) أسماء الملفات الصوتية ( لكل حرف سيتم
نطقه.
أهم أشهر البرامج في مجال تحويل الصوت.
:البرنامج العربيلألسف الشديد اليوجد برنامج عربي كامل للتحويل ولكن يوجد
هناك طرق يمكن اتباعها لكي نطوع البرامج االجنبية لتلبي احتياجاتنا . ويمكن استخدام البرامج التاليه لكي تساعدنا في
Euler + MBROLAعملية التحويل وهي وخطوات تشغيل اللغة العربيه في هذا البرنامج هي كالتالي:
-تحميل المكتبة الصوتية الخاصه في اللـغة العربيه من خالل 1الرابط التالي
http://tcts.fpms.ac.be/synthesis/mbrola/dba/ar1/ar1-981103.zip
أهم وأشهر برنامج تحويل النص الى صوت
باالضافة الى تحميل المكتبة االخرى من الرابط التاليhttp://
tcts.fpms.ac.be/synthesis/mbrola/dba/ar2/ar2-001015.zip
من MBROLA Toolsبعد ذلك يجب تحميل برنامج الرابط التالي
http://tcts.fpms.ac.be/synthesis/mbrola/mbrolatools.html
بعد التثبيت يتم اضافة قواعد البيانات للمكتبتين الصوتيتين من خالل الضغط على اضافة قاعدة
MBOROLAالموجود في
أهم وأشهر برنامج تحويل النص الى صوت
بعد االنتهاء من تثبيت المكتبتين يمكن االن فتح البرنامجEuler v2.0 ومن ثم كتابة النص الذي تريده والصوره.التاليه توضح الشكل العام للبرنامج بعد تثبيت المكتبات
الصوتية المكتبة اختيار يمكن هنا
تريد الذي النص كتابة يمكن هنا
النص قراءة يمكن هنا من
أهم أشهر البرامج في مجال .تحويل الصوت
البرنامج االنجليزي: لتحويل النص Text Speakerبرنامج
االنجليزي إلى صوت اإلصدار الثالثة ويمكن تحميل نسخه منه عن طريق
http://www.brothersoft.com/text-speaker-173158.html
واجهة البرنامج :
أهم أشهر البرامج في مجال .تحويل الصوت
أهم أشهر البرامج في مجال .تحويل الصوت
أهم مايميز البرنامج :-.استخدامه سهل و بسيط يمكن تغيير الصوت من بين الجنسين و-
تعديل سرعة القراءة و قوة الصوت و حدته. بإمكان البرنامج فتح ملفات بصيغ-
(.pdf , .txt , .doc , .docx , .html و )القراءة منها مباشرتا.
يمكن حفظ الصوت إما بصيغة-MP3 أو WAV
الخالصة من خالل هذا البحث يتضح لنا بعض األمور الجديدة
التي قد تساعد المستخدمين بشكل عام و المبرمجين بشكل خاص على كيفية عمل برامج
التحويل النص إلى صوت و يمكن أيضا االستفادة من هذه المعلومات لعمل برنامج يقوم بتحويل الصوت إلى نص )عملية عكسية تقريبا(. و من
خالل التطور المستمر لهذه البرامج يمكن أن نرى في المستقبل برامج تقارب الواقع إلى حد كبير
في نطق و قراءة النص بدون المشاكل التي ذكرناها سابقا.
ولألسف لم نجد برامج تدعم اللغة العربية ذاتجودة عالية يمكن استخدامها لألعمال اليومية بمستوى البرامج التي تدعم اللغة االنجليزية و نتمنى من الشركات العربية تطوير مثل هذه
البرامج للحفاظ على الطابع العربي في مجال الحاسب و التطور التقني.