أردرويد

معلومات جديدة حول Majel: لا تقارنها بـ “سيري” … أبداً! (تحليل)

تحدثنا منذ يومين عن Majel, وهو الإسم الكودي لمشروع غوغل الذي تعمل عليه حالياً والذي سينقل الأوامر الصوتية Voice Actions في أندرويد إلى مرحلة جديدة كلياً. اليوم حصل موقع Android and Me الذي سرب المعلومات السابقة على معلومات جديدة جمعها من عدة مصادر, وأضاف إليها معلومات ذكرها علناً بعض مهندسي غوغل سابقاً تساعدنا في تجميع أجزاء اللغز, ويبدو منها أن Majel هذه أكبر مما كنا نتخيل.

يبدو من المعلومات المسربة أن Majel شيء أكبر وأوسع من Siri بكثير, لهذا -يقول الموقع- أننا يجب أن نتوقف عن مقارنة أي شيء من غوغل بها, فمشروع غوغل السري أضخم بكثير مما كنا نتخيل, في البداية دعنا نلخص المعلومات التي حصل عليها الموقع من مصادر متعددة منهم من جربوا شخصياً النسخة التجريبية من المشروع:

يقول من جرب هذه التقنية أنها وبشكلها التجريبي المبدئي توازي أو تتفوق على سيري. فعلى الأقل وبالنسبة لنسخة الحاسب اللوحي التي جربها, يستطيع المستخدم تصفح عدة نتائج عن طريق ما يشبه الصفائح القابلة للإزاحة. على سبيل المثال إن سألتها:”أرِني تمثال الحرية” فستقوم بجلب صورة تمثال الحرية من نتائج Google Images, لكن الصفيحة الثانية قد تعرض لك موقع تمثال الحرية على خرائط غوغل, وصفيحة ثالثة تعرض المعلومات من صفحة Wikipedia. وذكر أنها جيدة جداً في استخلاص الأجوبة الموجزة ومن حيث الواجهة فهي أقوى بكثير من سيري وإن كانت أصعب قليلاً للتصفح لكن لا تنسَ أنه يتحدث عن نسخة تجريبية مبكرة. ويبدو أيضاً بأن مهندسي غوغل مهووسون فعلاً بـ Star Trek حيث ذكر بأنها وأثناء مراحل تطويرها الأولى كان عليك التحدث إليها قائلاً:”أيها الكمبيوتر .. إفعل كذا وكذا” أي يجب البدء بكلمة “Computer” لإعطاء الأمر كي تعمل كما يخاطبون الحواسيب في سلسلة ستار تريك. بالطبع هذه مجرد حركة طريفة من مهندسي غوغل المهووسين أثناء التطوير ولن تكون بهذا الشكل عند إصدارها. إذاً كما نرى يبدو أن الإصدار الأول سيعتمد بشكل كبير على نتائج بحث غوغل, لكنك ستقوم بالبحث بالتحدث بشكل طبيعي وبالمقابل ستقوم Majel ومن خلفها غوغل طبعاً بإعادة نتائج موجزة ومركزة مناسبة لسؤالك بالضبط (وليس صفحات طويلة أو صفحات نتائج).

موظف سابق في غوغل -لم يكشف عن اسمه بالطبع- قال أنه يتم تطوير هذا المشروع ضمن مختبرات غوغل الغامضة فائقة السرية المعروفة بـ Google X والتي كشفت عنها النيويورك تايمز الشهر الماضي. في هذه المختبرات تقوم غوغل بتطوير المشاريع المجنونة ومنها ما ليس له علاقة بالويب أصلاً, في هذه المختبرات ترى الروبوتات بأنواعها وترى مختلف أنواع البحوث العلمية المتطورة وخاصة تلك المتعلقة بالذكاء الصنعي Artificial Intelligence. أحد المشاريع التي تحدث عنها الموظف هو روبوت صممته غوغل وكان حينها قد اجتاز ما نسبته 93% من مرحلة الاختبار وكان قادراً على تبادل الحديث وتمييز الكلام. الروبوت بحد ذاته لم يكن متطوراً من الناحية الميكانيكية لأن التركيز ليس عليها بل على الناحية البرمجية وخاصة تمييز النطق speech recognition. ويصف الموظف الذي جرب الحديث مع الروبوت بأنه أروع شيء شاهده في حياته, فهو ذكي وتستطيع التواصل معه بشكل طبيعي.

ننتقل الآن لنرى ما قاله Mike Cohen مدير تكنولوجيا النطق في غوغل والشريك المؤسس لـ Nuance Communications وهي الشركة التي تقدم بعض التقنيات التي تقف وراء Siri, ما قاله عندما اشترت غوغل شركة Phonetic Arts المتخصصة بتكنولوجيا الصوت:

في ستار تريك, لا يقضون الكثير من الوقت في كتابة الأشياء على لوحة المفاتيح, هم فقط يتحدثون إلى حواسيبهم, وتقوم الحواسيب بالحديث إليهم. إنها طريقة أكثر طبيعية للتواصل, لكن الوصول إلى هناك يتطلب التغلب على مجموعة من المشاكل الصعبة التي تواجهنا في الأبحاث.

لقد حققنا مؤخراً بعض الخطوات بتقنيات النطق والأدوات التي تأخذ الإدخال الصوتي. لكن ماذا حينما يتحدث الكمبيوتر إليك؟ بكلمات أخرى: الإخراج الصوتي؟

لهذا السبب يسرنا أن نعلن شراءنا لـ Phonetic Arts شركة اصطناع الصوت speech synthesis ومركزها في كامبريدج, إنكلترة. يعمل فريق الشركة من الباحثين والمهندسين على تقنيات اصطناع الصوت المتطورة لتطوير تكنولوجيا تقوم بتوليد نطق حاسوبي طبيعي من عينات صغيرة من الصوت المسجل.

نحن متحمسون بالنسبة لتقنيتهم, وبينما لا يوجد لدينا خطط للإعلان عنها الآن, نحن واثقون أننا معاً سننتقل أسرع قليلاً نحو مستقبل ستار تريك.

في فيديو  “تطور البحث” The Evolution of Search الذي نشرته غوغل الشهر الماضي يتحدث إلينا Amit Singhal ليعطينا لمحة عما تسعى إليه غوغل:

لطالما كان حلمي بناء كمبيوتر “ستار تريك”, وفي عالمي المثالي, سأتمكن من المشي باتجاه الكمبيوتر والقول:”مرحبا, ماهو أفضل وقت بالنسبة لي لزرع البذور في الهند, على اعتبار أن الرياح الموسمية جاءت مبكرة هذا العام؟”. وحالما نصبح قادرين على الإجابة على هذا السؤال (وهو ما لا نستطيعه حالياً), سيبدأ الناس بالبحث عن أجوبة على أسئلة أكثر تعقيداً. هذه هي حاجة حقيقية للحصول على المعلومات. إنها أسئلة حقيقية إذا استطعنا في غوغل الإجابة عليها, سيصبح مستخدمينا أكثر معرفة وسيصبحون راضين بشكل أكبر عن سعيهم وراء المعرفة.

كلام طموح جداً, لكن لا شيء مستحيل بالنسبة لغوغل, ومن الواضح أنها لا تسعى إلى تحسين تقنية بحثها فحسب بل تريد وبشكل جاد ربط كل هذا بالأوامر الصوتية والحديث الطبيعي مع الكمبيوتر أو الهاتف.

أخيراً ننتقل إلى اللقاء الأخير مع Matias Duarte الذي أجراه مع موقع The Daily Beast, ماتياس هو خبير “تجربة المستخدم” في أندرويد والمصمم الذي أبدع واجهات أندرويد 4.0, يقول عن التواصل الصوتي مع الهاتف:

سيكون الصوت بكل تأكيد جزء أساسي من واجهة المستخدم. غوغل وأندرويد يعملان على الصوت منذ سنوات. حتى في الآيس كريم ساندوتش قمنا بإصدار تحسينات كبيرة على الطريقة التي يعمل بها الإملاء الصوتي. ما أعتقد أنه سيكون مثيراً بالنسبة للصوت هو محاولة التعامل مع الصوت على أنه شيء يمكن الوصول إليه بشكل شامل في كل تطبيق وألا يكون محدوداً بكونه مجرد وسيلة طريفة أو شيء تستخدمه أثناء قيادة السيارة فقط.

أنا أرغب للحواسيب أن تكون متعددة الوسائط فعلاً. عندما تشاهد برنامجاً للخيال العلمي مثل ستار تريك, يتجه أحدهم إلى الحائط ويبدأ بلمس الأشياء والتحدث إلى الكمبيوتر في نفس الوقت. هذه هي الطريقة التي أعتقد أن واجهاتنا يجب أن تتطور إليها. تحتاج إلى أن تكون قادراً على استخدام البريد الالكتروني, تلمس الأشياء على الشاشة, تتحدث إليه, تلمس المزيد من الأشياء, دون أن يتوجب عليك التفكير بالشكل التالي:”هل أنا أستخدم الصوت الآن أم لا أستخدمه” أنت فقط تستخدم الكمبيوتر بالطريقة الأكثر طبيعية”.

غوغل طموحة للغاية وتسعى إلى دمج الصوت في كامل أجزاء النظام بل من الواضح أنها تخصص مجهوداً كبيراً للوصول إلى هذا بأكمل صورة وأفضل شكل ممكن, تريد أن تصل بك إلى مرحلة لا تقول لنفسك فيها:”حسناً الآن أنا سوف أستخدم الأوامر الصوتية, الآن سوف أقوم بتشغيل البرنامج الخاص بها, الآن أنا أتحدث إلى النظام .. الخ” بل ستدمج التواصل الصوتي بشكل أقرب ما يكون إلى الطبيعي وكأنك تتواصل مع صديق أو شخص قريب. أسلوب سيري هو ربما شيء بسيط مما تطمح إليه غوغل.

مع تطور خوارزميات البحث والذكاء الصنعي الخاصة بغوغل, ومع انصباب اهتمامها على تقنيات الصوت بل ودعم جميع اللغات بمافيها العربية بلهجاتها, كل ذلك يدلنا على مستقبل مبهر لهذه التقنيات في أندرويد, وكما ذكرنا في المقالة السابقة من المتوقع أن نرى شيئاً مبدئياً خلال فترة قريبة جداً بصيغة تحديث على الأوامر الصوتية Voice Actions, لكن لاحقاً سيتم دمج هذا الأمر بشكل أكبر وأوسع في نسخ أندرويد القادمة كما يمكن أن نستنتج.

[Android and Me]

أنس المعراوي

مدوّن حالي، مطوّر ويب سابق، مهووس دائم بالتكنولوجيا والمصادر المفتوحة. مؤسس موقع أردرويد.

عنواني على تويتر: [email protected]

21 من التعليقات

ضع تعليقًا

  • الحلم اصبح حقيقة .. ولكن المشكله الازليه هي بقاء الجهاز لمده لا تدومم حتى يوم او يومين بالكثير ، اعطوا البطاريه حقها فهي الاساس في الجهاز 😛 مالفائده اذا كان الجهاز يقدم لي الوان جميله وسرعه عاليه وكل سي ولكن لوقت محدود ولا يستطيع الصمود !!

    • أتفق معك 100% ، المشكلة أن التكنلوجيا تتطور بشكل سريع جداً لكن ليس متوازي ، مازالت تكنولوجيا البطارية متخلفة نوعاً عن الركب … هل لصعوبة الإستثمار في هذا المجال؟ أو ربما كلفته العالية؟

      • الجواب له شقين.. تقني وتجاري.. تكلفة الاستثمار في هذه التقنية يقابلها مردود ربما ضئيل..
        سمعت او ربما قرأت عن تقنية يجري تطويرها وهي البطارية النووية ..نعم النووية ..تخيل بطارية تعيش ربما اطول من عمرنا؟ لكن هذه التقنية امامها عقبات جمة اهمها التجاري والبيئي

        • البطارية النووية , أو البطارية الذرية إن صح القول … موجودة فعلاً !! وهي المستخدمة حالياً في مركبات الفضاء
          آلية هذ البطارية هي الاعتماد على إشعاعات مواد مشعة تصدر طاقة إشعاعية تتحول إلى كهربائية , والأفضل استخدام مواد عمر النصف الخاص بها طويل وبنفس الوقت الطاقة الصادرة كبيرة , وهكذا حصلنا على الطاقة لمدة طويلة قد تتجاوز آلاف السنين !!!
          سبحان الله “وعلّم الإنسان ما لم يعلم”

          • بالمناسبة البطاريات الذرية تقنية قديمة وليست جديدة ، ورغم التطور المدهش فيها إلا أنها لازالت بعيدة كل البعد عن الإستخدام التجاري لأسباب فنية كثيرة وأهمها التكلفة الباهظة جداً والأمن والسلامة … ولهذا إستخدامها محصور فقط في المركبات الفضائية ، في بعض المحطات الفضائية في المناطق النائية جداً… وبالتالي هي ليست خيار مثالي وواقعي للإستخدام التجاري.

            أعتقد أن الخيار الواقعي أكثر (من الذري) في عالم البطاريات هي المعتمدة على تقنية خلايا وقود الهيدروجين Fuel cell والتي تنتج الكهرباء من خلال تفاعل كهربائي كيميائي باستخدام الهيدروجين والأوكسجين. وقد بداء الإستخدام التجاري لهذه التقنية في بعض المجالات ومنها في بعض السيارات الصديقة للبيئة من شركة هوندا وتيوتا في أمريكا.

    • حقيقة ملاحظتك في الصميم والان يوجد ابحاث كثيره على هذا الموضوع تهتم بكفائة البطارية و طريقة التخلص منها بدون التاثير على الطبيعة اقراء عن تكنولوجيا (نانو كاربون تيوب باتري) وقبل اسبوع قرات انا هناك تكنولوجيا جديده تنتج بطاريات تعمر 10 اضعاف البطاريات العاديه قبل اعادة شحنها ولكن فعلا لايزال العلماء مشغولون باشياء اقل اهميه من البطاريات ما الفائده من صنع سيارة سوبر بدون تنك البنزين يكفيها

  • قوقل .. خارج السرب

    حُذفت كلمة (تغرد) لآنها ترفض أن يشاركها أحد (تويتر) حتى لو في المثل 🙂

  • كلام جداً رائع
    انا كتير متابع لأندرويد ….. و متمني يحتل مكان الحاسب و نخلص من الاحتكار من بعض الشركات
    لازم يكون في منافسة ….. و المستخدم هو الربحان
    لنشوف شو ممكن تكون ردة مايكروسوفت على هذا المشروع
    و نحن الكسبانين
    شكراً أنس

  • هذا مايحدث عندما تعطي GEEK الكثير الكثير الكثير من المال
    سيحذف كلمه خيال من عباره خيال علمي

  • يبدو لي ان فعلا فكرة المقارنة بين ماجيلوسيري ستبداء بالاختفاء بعد هذا الموضوع فماجيل لن يكون مساعد شخصي بل سيكون اشبه بمرشد لك شيء يشبه السوبر كمبيوتر الى حد ما حيث انت تعطيه مثلا المعطيات ارغب بالذهاب لميدان التحرير غدا في الثانية ظهرا بالطبع سيري ستفتح لك الخرائط وترسم المسار وهنا انتهى الامر لكن ماجيل سيقوم اول بمعرفة اذا الوقت مناسب والطقس كيف سيكون واي الطرق افضل ومن اي جهة الدخول وربما يذهب للاخبار ليطمئن ان كان هناك مشاحنات ام لا!
    اذا كنت قد فهمت الفكرة الصحيحة للموضوع:D

  • مجهود رائع مشكور
    بتمنا تجاوبني على سؤالي
    ياترا رح يدعم اللغة العربية ولا لأ متل سيري
    بصراحة الخدمة روعة ولو كانت بالإنكلش
    بنتظار الرد

  • طبعا لن نقارنها ب سيري
    لان سيري هيا الأصل وقوقل كما تحاول دائما مواكبة ابل في براءات اختراعاتها وتقليدها في معظم الوقت .
    لحد الآن لم ار شيئا من قوقل يعتبر انه جديد بعدما نرى منتجات ابل ننظر لقوقل على انها “مقلد” لتكنولوجيا ابل

    وعندما تقول قوقل ان Majel افضل من سيري فلا بأس . لانها استفادت من ابتكارات ابل وحاولت الزياده عليها اما بزيادة صفحة بحث او صورة او ماشابه (زيادات تافهة)
    ولازلت ارى ان ابل في المقدمة 🙂

    • كلامك غير صحيح .. ولو أفترضنا أن ما تقوله صحيح ، حينها يمكنني أن أقول أن آبل أيضاً قلدت تقنية Voice Actions من جوجل وقامت بتطويرها والزيادة عليها (زيادات تافهة) لتسوقها بعدها بإسم سيري!!

  • اذا طلعت الاشاعات صح فيعني ان قوقل ناويه تحاصر ابل من جميع الجهات ولا تترك لها مجال
    اتمنى ان تزيد المنافسه فهذا من صالحنا كمستهلكين

%d bloggers like this: