نستطيع القول إنّ عام 2023 شهد تطوَراً في زيادة إدراك الناس لماهية وقدرات الذكاء الاصطناعي أكثر من أي وقتٍ مضى. فقد انتشرت فيه روبوتات الدردشة على نطاقٍ واسع، كما أن الحكومات بدأت تأخذ مخاطره المحتملة على محمل الجدّ. ولم تكن تلك التطورات عبارة عن ابتكارات بقدر ما هي انعكاس لأفكارٍ وتقنياتٍ كانت قد أخذت فترة طويلة حتى ظهرت بما هي عليه الآن. وفيما يلي نعدّد ثلاثة من المحطات التي سجّلها العام الماضي:
منظمة المجتمع العلمي العربي
تعدّد الوسائط
قد يبدو هذا المفهوم عبارة عن مصطلحٍ عام، لكن الأمر يستحق فَهم ما تعنيه: إنّها قدرة نظام الذكاء الاصطناعي على معالجة الكثير من أنواع البيانات المختلفة – ليس فقط النصوص، ولكن أيضًا الصور والفيديو والصوت وغيرها. وقد شكّل العام الماضي فرصة مهمة ليتمكّن الجمهور من الوصول إلى نماذج الذكاء الاصطناعي متعددة الوسائط. وكان نموذج روبوت الدردشة الآلية "جي بي تي 4" من شركة "أوبن آيه أي" هو الأول من نوعه، حيث سمح للمستخدمين بتحميل الصور بالإضافة إلى إدخال النصوص. ويستطيع جي بي تي 4 "رؤية" محتويات الصورة، والخروج بنتائج. فمثلاً بالإمكان السؤال عما يمكن إعداده من طعام بناءً على صورةٍ ملتقَطة لمحتويات الثلاجة. وفي سبتمبر الماضي، أتاحت "أوبن إيه آي" للمستخدمين إمكانية التفاعل مع تشات جي بي تي عن طريق الصوت بالإضافة إلى النص.
كما يمكن لنموذج "جيميني" (Gemini) والذي أعلنت عنه جوجل في شهر ديسمبر الماضي العمل أيضاً بالصوت والصورة. ونشرت الشركة مقطع فيديو يبيّن قدرات جيميني في عدة تحديات منها التعرّف على البطة، حيث طُلب من النموذج التعرّف على الرسمة من عدة خطوط رسمها بشكلٍ عشوائي على ورقة لتشبه البطة، وقد استطاع البرنامج أن يتعرف على الرسمة من خلال الخطوط. وفي الفيديو نفسه، تظهر ورقة بها مجموعة من النقاط المتباعدة وطُلِب من جيميني ربط النقاط ببعضها والتنبّؤ بماهية الرسمة. وبالفعل فقد استطاع معرفة الرسمة قبل أن يصل كلّ النقاط ببعضها.
"الذكاء الاصطناعي الدستوري"
أحد أكبر الأسئلة التي لم تتمّ الإجابة عليها بشكلٍ وافٍ حتى الآن، هو كيفية مواءمة الذكاء الاصطناعي مع القيم الإنسانية. وفي حال أصبحت هذه الأنظمة "أكثر ذكاءً وقوة من البشر"، فقد تتسبّب بتداعياتٍ على البشرية، لا سيما إذا لم يتمّ وضع ضوابط وتشريعاتٍ لها.
إنّ العملية التي استخدمتها "أوبن إيه آي" لمواءمة "تشات جي بي تي" بغية تفادي السلوكيات العنصرية وما إلى ذلك في النماذج السابقة، قد عملَت بشكلٍ جيدٍ نسبياً، لكنها تطلّبت قدراً كبيراً من التدخّل البشري، وذلك من خلال تقنية تُعرف باسم التعلّم المعزَّز، وهو نوعٌ من نماذج الذكاء الاصطناعي التي تستخدم التغذية الراجعة البشرية لتحديد الاختلال في نماذج الذكاء الاصطناعي التوليدية أو ما يُعرف اختصاراً بـ "RLHF". ولكن نظرًا لأنّ هذه العملية (RLHF) تعتمد بشكلٍ كبيرٍ على العمالة البشرية، فهناك تساؤلاتٍ كبيرة حول مدى قابليتها للتطوّر. إلى جانب أنها تُعدّ عملية مكلفة، وهي تخضع للتحيّزات أو الأخطاء التي يرتكبها العاملون من البشر. وتصبح أكثر عرضة للفشل كلّما كانت قائمة القواعد معقّدة. ومن غير المرجّح أن ينجح هذا الأمر مع أنظمة الذكاء الاصطناعي العامة والتي قد تبدأ في القيام بأشياءٍ لا يستطيع حتى البشر فهمها.
يحاول "الذكاء الاصطناعي الدستوري" – وهي تقنية تدريب وصفها باحثون لأول مرة في ورقةٍ بحثية نُشرت في ديسمبر 2022 – معالجة هذه المشكلات، وتعزيز فكرة أن أنظمة الذكاء الاصطناعي أصبحت الآن قادرة بما يكفي لفهم اللغة الطبيعية. وتكمن الفكرة أولاً في كتابة "دستورٍ" يحدد القيَم التي تود أن تتبعها الأنظمة الذكية، ثم يتم تدريبها على تسجيل الردود بناءً على مدى توافقها مع ذاك الدستور، وتحفيز النموذج لإخراج الردود التي تحصل على درجاتٍ أعلى. وبحسب الباحثين التابعين لشركة "أنثروبيك" فإنّ "هذه الأساليب تجعل من الممكن التحكم في سلوك الذكاء الاصطناعي بدقةٍ أكبر وبعددٍ أقل من التصنيفات البشرية". غير أن تقنية "الذكاء الاصطناعي الدستوري" لا تجيب بشكلٍ شافٍ على سؤالٍ مهم وهو : مع من و/ أو ما يجب أن يتماشى الذكاء الاصطناعي في اعتماد تلك القيم؟
تحويل النص إلى فيديو
لقد سجّل عام 2023 ارتفاعاً سريعاً في عدد أدوات تحويل النص إلى فيديو. ومع أن بداية العام الماضي، بالكاد ظهرت أدوات تحويل النص إلى صورة؛ إلّا أنه مع مرور الأشهر، عرضت العديد من الشركات أدواتٍ لديها القدرة على تحويل النصوص إلى صورٍ متحركة بمستوياتٍ متزايدة من الدقة. وإحدى هذه الشركات كانت "Runway" الأميركية، والتي أنشأت "Gen-2" الذي لا يتيح للمستخدمين إنشاء مقطع فيديو من نص فحسب، بل أيضاً تغيير نمط مقطع فيديو موجود وذلك بناءً على نصٍ موجّه مثل تحويل لقطة من صناديق الحبوب على سطح منضدة إلى مشهدٍ ليلي للمدينة. ونذكر أيضاً شركة أخرى تعمل في مجال تحويل النص إلى فيديو وهي "Pika AI"، ولا يتم عرض هذا النوع من الخدمات على صانعي الأفلام المحترفين وإنّما على المستخدمين العاديين. ونفترض أنّ هذا النوع من الأدوات، سيكون له تأثير على الوظائف الإبداعية، حيث أنّها تعمل على جعل بعض أشكال الخبرة التقنية متقادمة. وبالتالي، فالإبداع يتعلّق أكثر بالتعبير عن الأفكار بمعزلٍ عن المعرفة والمواصفات الفنية لدى المستخدمين.
تواصل مع الكاتب: m.maaz@arsco.org
الآراء الواردة في هذا المقال هي آراء المؤلفين وليست، بالضرورة، آراء منظمة المجتمع العلمي العربي
يسعدنا أن تشاركونا أرائكم وتعليقاتكم حول هذهِ المقالة عبر التعليقات المباشرة بالأسفل أو عبر وسائل التواصل الإجتماعي الخاصة بالمنظمة