الأدوات واستدعاء الدوال · وحدة تعليمية مجّانية في أمن الذكاء الاصطناعي

تمهيد

ماذا لو استطاع النموذج أن يفعل أشياء؟

حتى الآن، الـ LLMs مجرّد آلات تأخذ نصاً وتُعيد نصاً؛ كل ما تفعله أن تتنبّأ بالكلمة التالية. لكن ماذا لو استطاع النموذج، بدلاً من أن يكتفي بالقول إنّ "الطقس في لندن على الأرجح بارد"، أن يتحقّق من الطقس الفعلي؟ وماذا لو أمكنه إرسال رسائل البريد، أو البحث في قواعد البيانات، أو حجز رحلات الطيران؟

هذا ما تتيحه الأدوات، وهي تقلب حسابات المخاطرة رأساً على عقب.

القيد الأساسي للـ LLM

الـ LLM وحده لا يُنتج سوى النص، ويعجز عن:

تصفّح الويب
إجراء حسابات مضمونة الدقّة (يمكنه التفكير في الحساب، لكنه ليس آلة حاسبة دقيقة دائماً)
الوصول إلى قواعد البيانات
إرسال الرسائل
قراءة الملفات
استدعاء الـ APIs

يبقى محصوراً في عالم النص. اسأله "كم حاصل 7,392 × 8,451؟" فقد يخطئ تخمينٌ سريع مبنيّ على الأنماط، وحتى حين يستنتج الإجابة خطوةً خطوة، فهو ليس آلة الحساب المضمونة الدقّة التي تمنحك إياها الأداة. واسأله عن طقس اليوم فسيخمّن استناداً إلى بيانات تدريب مضى عليها أشهر.

الأدوات تحلّ هذا

الأدوات (وتُعرَف أيضاً بـ function calling) تتيح للمطوّرين أن يمنحوا النموذج قائمةً بالإجراءات التي يمكنه اتّخاذها.

الفكرة الجوهرية: النموذج يطلب الإجراء، والتطبيق ينفّذه. لا يمسّ النموذج أي API أو قاعدة بيانات مباشرةً، بل يكتفي بإصدار طلب، وشيفرتك وحدها هي التي تقرّر تشغيله من عدمه.

Tool Calling

1المستخدم يرسل رسالة

«ما حال الطقس في لندن؟»

2النموذج يقرّر استدعاء أداة

يُخرج طلباً منظَّماً مثل get_weather(city="London")

3التطبيق ينفّذ الأداة

التطبيق، لا النموذج، هو من يستدعي الـ API الحقيقي

4نتيجة الأداة تعود إلى النموذج

التطبيق يُدخل النتيجة في الـ context window

5النموذج يردّ على المستخدم

«الجو الآن 15 درجة مئوية وغائم في لندن.»

لاحظ أنّ المسار هنا خطّ مستقيم: المستخدم يسأل، فيستدعي النموذج أداةً واحدة، فيشغّلها التطبيق، ثم يجيب النموذج. جولة ذهاب وإياب واحدة، تبقى فيها شيفرة المطوِّر متحكّمةً من أوّلها إلى آخرها.

مع الأدوات مقابل بدونها

النموذج نفسه، والسؤال نفسه. الأدوات تحوّل التخمين إلى معرفة.

من الـ tool calling إلى الـ agents

يُظهر المخطّط أعلاه استدعاءً واحداً لأداة: سؤال واحد، وأداة واحدة، وإجابة واحدة. لكن ماذا يحدث حين تحتاج المهمّة إلى خطوات متعدّدة؟

"خطِّط رحلةً إلى طوكيو" ليست مجرّد استدعاء API واحد، بل سلسلة خطوات: ابحث عن رحلات طيران، ثم احجز فندقاً، ثم تحقّق من الطقس. يحتاج النموذج إلى استدعاء عدّة أدوات تباعاً، ليقرّر بعد كل نتيجة ما يفعله تالياً.

هنا يبدأ الـ agentic behavior. فبدلاً من ذهاب وإياب واحد، يدور النموذج في حلقة:

الحلقة الـ agentic

1المستخدم يعطي النموذج مهمة

«خطّط رحلة إلى طوكيو: ابحث عن رحلات طيران واحجز فندقاً وتحقّق من الطقس.»

2النموذج يستدعي أداة

ينفّذ search_flights(destination="Tokyo") ليحصل على خيارات الرحلات

3التطبيق ينفّذ الأداة ويعيد النتيجة

يشغّل التطبيق الأداة ثم يُعيد النتيجة

4النموذج يقرّر الخطوة التالية

«حصلت على رحلات الطيران، الآن أحتاج فندقاً» ثم يستدعي book_hotel(...)

5يتكرّر ذلك حتى يقرّر النموذج أنه انتهى

يواصل استدعاء الأدوات وقراءة النتائج واتخاذ القرار، بلا تدخّل بشري في الحلقة

يستدعي أداة أخرى

أترى الفرق؟ مخطّط الـ tool calling خطّ مستقيم. أمّا مخطّط الـ agentic ففيه حلقة، حيث يواصل النموذج المضيّ، مستدعياً أداةً بعد أداة، حتى يقرّر أنّ المهمّة اكتملت.

مشكلة الصلاحيات

هنا تصير الأمور جدّية.

إن منحت النموذج أدواتٍ لإرسال الرسائل وحذف الملفات، ثم خدعه أحدهم فاستدعى تلك الأدوات، فالضرر حقيقي. تُرسَل الرسالة فعلاً، ويُحذَف الملفّ فعلاً.

يتحوّل التلاعب بالنص إلى فعل ملموس في العالم الحقيقي.

وفي الـ agentic loop، يجرّ القرارُ السيّئ الواحد ما بعده. فالنموذج لا يكتفي باستدعاء خاطئ واحد، بل قد يحذف ملفاً، ويرسل محتواه بالبريد إلى الشخص الخطأ، ثم يمحو سجلّ البريد. كل إجراء يغذّي ما يليه، دون تدخّل بشري في الأثناء.

تخيّل نموذجاً يملك هذه الأدوات:

send_email(to, subject, body)
delete_file(path)
query_database(sql)

يتصرّف النموذج بوصفه نائباً، فيتّخذ الإجراءات نيابةً عن المستخدم. لكن إن التبس عليه ما يريده المستخدم حقاً (عبر التلاعب، أو غموض التعليمات، أو بيانات محقونة)، صار نائباً مُضلَّلاً (confused deputy) ينفّذ إجراءات لم يقصدها المستخدم قطّ.

تنبّأ

يملك مساعد الـ LLM وصولاً إلى أدوات send_email وdelete_file وread_file. يطلب منه مستخدم أن 'clean up old files and email me a summary.' ما الذي قد يسوء؟

لماذا يهمّ هذا

تحوّل الأدوات الـ LLMs من ألعاب طريفة إلى أنظمة قوية تتصرّف في العالم الحقيقي. والـ agentic loops تضخّم كل خطر، فتكفي تعليمة واحدة مُتلاعَبٌ بها لإطلاق سلسلة من الإجراءات الحقيقية. وهكذا تتراكم آثارها الأمنية:

كيف تعمل الـ LLMs: النموذج في جوهره يتنبّأ بالنص دون أي فحص مدمج لما هو هذا النص، لذا يمكن خداعه
الـ system prompts: تعليمات المطوِّر غير مُلزِمة؛ يمكن تجاوزها
الـ RAG: البيانات الخارجية تتدفّق إلى الـ prompt، وقد تحمل تعليمات خفيّة
الأدوات + الـ agents: نموذج مخدوع يملك أدوات قوية يُحدِث ضرراً حقيقياً، أمّا المستقلّ منه فيمضي في طريقه بلا توقّف

تبني كل طبقة على ما قبلها، ولهذا احتجت إلى إتقان الأساسيات أولاً.

جاهز لوحدات الأمن

صرت الآن تفهم اللبنات الأربع:

الـ LLMs متنبّئات بالنص، ذات context window محدود
الـ system prompts تُشكّل السلوك لكنها ليست حدوداً أمنية
الـ RAG يحقن مستندات خارجية في الـ prompt
الأدوات تتيح للنموذج إطلاق إجراءات في العالم الحقيقي، والـ agentic loops تتيح له تسلسلها

ستُريك وحدات الأمن كيف تستغلّ كلاً منها، وفي النهاية كيف تدافع عنها.