قريبًا: مُساعد جوجل سيمتلك صوتًا لا يُمكن تمييزه عن الصوت البشري

تحاول جوجل الاستفادة من تقنيات الذكاء الاصطناعي ضمن أنظمتها المختلفة مثل مساعدها الصوتي الذكي Google Assistant.

تواصل تقنيات الذكاء الاصطناعي Artificial Intellegence تطورها بوتيرة سريعة، بحيث أنها أصبحت تتواجد بشكل واسع ضمن مختلف النواحي اليومية لحياتنا، وذلك كي تساعد التطبيقات والأنظمة والأجهزة المتصلة على أن تصبح أكثر ذكاء وبراعة في أداء عملها.

وبما أن الصوت هو الطريقة الرئيسية للتواصل مع المُساعدات الذكية، يبدو أن جوجل قطعت شوطًا طويلًا فيما يتعلق بتوفير أصوات مشابه إلى حد كبير للصوت البشري، حيث يشير تقريرٌ جديد بأنها أصبحت أقرب إلى تحقيق هذا الأمر من خلال نظامها الجديد Tacotron 2 لتحويل النص إلى كلام.

النظام الجديد Tacotron 2 يوفر دقة تقترب إلى حد كبير من دقة الصوت البشري عند قراءة النصوص، ويعتبر بمثابة الجيل الثاني من أنظمة تحويل النص إلى كلام.

وهو يتألف من شبكتين عصبونيتين عميقتين Deep Neural Networks، إذ تعمل الشبكة الأولى على ترجمة النص إلى طيف، وهي الطريقة البصرية المستعملة لتمثيل الترددات الصوتية، ومن ثم يتم نقل هذا الطيف إلى WaveNet، وهو نظام مطور من قبل مختبر DeepMind للذكاء الاصطناعي التابع لشركة ألفابيت، والذي بدوره يقرأ الرسم البياني ويولد العناصر الصوتية المقابلة لهذا الرسم.

وبحسب جوجل فإن النظام الجديد قادر على التعامل مع الكلمات والأسماء التي يصعب نطقها، إلى جانب قدرته على تغيير طريقة النطق على أساس علامات الترقيم، بحيث حصل النظام على درجة قدرها 4.53 بالمقارنة مع 4.58 درجة التي حصل عليها النص المُسجل بشكل احترافي من قبل عنصر بشري.

وخلافًا لبعض بحوث الذكاء الاصطناعي التي تجريها جوجل، فإن هذه التكنولوجيا سوف تمثل إضافة كبيرة لـ Google Assistant، وخصوصًا عندما نعلم بأنها تستعمل نظام WaveNet لتوليد أصوات أكثر واقعية لمساعدها الذكي.

المصدر

قد يعجبك أيضًا
تعليق واحد
  1. KUN FREEMAN يقول

    الصوت الحالي قريب جدا من الصوت البشري ..

اترك ردًا

لن يتم نشر عنوان بريدك الإلكتروني.