تحكم المنصات يخنق الـ agentic open source — حلول
بوابات المنصات تكبح مشاريع الـ agentic open source. مخطط عملي—manifests، provenance، sandboxes، قوالب قانونية وCI—لحفظ قابلية النقل.
Platforms Are Treating Agents as Toxic — And They’re Not Wrong About the Risk
بدأت المنصات ترسم خطوطًا حمراء حول المشاريع agentic. وليست خطوطًا افتراضية فقط. سياسات جديدة، تنفيذ هادئ، ومراجعات أشد تشير إلى أن متاجر التطبيقات ومقدمي الـ API وخدمات الاستضافة ينظرون إلى الشفرات الذاتية التشغيل المدفوعة بـ LLM كعامل جذب للمشكلات. إذا قابلت مجتمع الـ open source هذا الضغط بالتمنيات، فسوف ينقسم الفضاء: عروض تمثيلية مُنقّحة على منصات ملتزمة بالقواعد، وأتمتة حقيقية مخفية خلف خدمات مركزية ومغلقة.
سُمّها تحكّم المنصات إن شئت. الضغط حقيقي بالنسبة للمحافظين الذين يصدّرون أي شيء يتصرّف نيابةً عن المستخدم. تدفقات العمل المستقلة تُثير مرشحات السبام. المهام الخلفية تُشبه شبكات بوتات. المتصفحات headless تفعل دفاعات الاحتيال. أوزان النماذج تُعرَض للعلم بسبب غموض التراخيص. مفاتيح الـ API تُسحب بتهمة “سوء الاستخدام” عندما يجرّب الـ agent سير عمل بسرعة أكبر من اللازم. لا ينبغي أن يفاجئ هذا أحدًا. فالـ agents تقصّر المسافة بين النص والفعل — وهذه الانهيار له مدى تأثير واسع.
المنصات تقلق بشأن ثلاثة أمور. أولًا: الامتثال والمسؤولية. يمكن للـ agents إرسال رسائل، إجراء طلبات، الوصول إلى نقاط نهاية منظمة، وتحريك أموال. يمكنهم فعل ذلك على نطاق واسع وفي ساعات غير متوقعة دون دليل ظاهر لوجود إنسان في الحلقة. هذا يبدو كالوصول غير المصرح به واتخاذ قرارات آلية بدون موافقة. ثانيًا: المخاطر التشغيلية. حلقة ضبط سيئة أو غياب حواجز حماية قد يؤدي إلى سيل هائل من الطلبات أو حملة تجريف تحرق حدود معدل المزود. ثالثًا: الضرر السمعة. لا تريد المنصة أن تُتهم بمساعدة agent يتحرش بالمستخدمين، ينتحل علامة تجارية، أو يملأ خدمة بمهملات.
عندما يتكدّس هذا الخوف بتلك الشدة، تصبح الاستجابة قاطعة. متاجر التطبيقات تضيّق تعريف “التنفيذ في الخلفية” وتثنِي عن جلب الشيفرة عن بُعد. شروط الـ API تحظر التفاعلات الآلية مع منصات أخرى دون إذن صريح. المستضيفون يخنقون تنزيلات النماذج ويزيلون الأوزان ذات السجلّ غير الواضح. معالِجو المدفوعات يشدّدون التحقق لأي شيء يبدو كأتمتة غير مرئية. بعض هذا موجود منذ سنوات، لكن الشدة شيء جديد. إصدارات نماذج بارزة مؤخرًا، أدوات مقلدة محمومة، وتدفّق مستمر لتقارير سوء الاستخدام دفعت المراجعين إلى اعتبار “agent” علامة جهد.
النتيجة الصافية: يُعامل الـ agentic AI open source بشكل افتراضي على أنه سام تشغيليًا وقانونيًا. هذا الافتراض سيشقّ المَشترك. الطريقة الوحيدة للحفاظ عليه هي جعل مشاريع الـ agentic قابلة للتدقيق، المحمولة، ومفهومة — بشروط المُحافظ، لا بالتوسّل لتخفيف القواعد، بل بتغليف الضمانات الصحيحة في الشيفرة، البنية، والإصدار.
Gatekeeping Splits the Commons
تحمّلت المجتمعات open source عواصف قبل ذلك. سجّلات الحزم تعرضت لخلافات على العلامات التجارية. مكتبات التشفير اجتازت موجات تنظيمية. لكن الـ agents مختلفة لأنهم يتصرفون عبر الحدود. هذا يطلق نوعًا خاصًا من تأثير التبريد. مطوّر واحد يطلق أداة أتمتة مفيدة. منصة تُعلّم عليها بأنها “سلوك بوت” وتغلق الحساب المرتبط. تصل الرسالة صعودًا: لا تقترب من هذا المجال إلا إذا كان لديك فريق قانوني. هكذا يصبح المشترك زقاقًا مسدودًا.
التجزؤ يظهر بطرق صغيرة ومتوقعة. المساهمون يتجنّبون الميزات الشائكة — استخدام الأدوات الذي يؤدي فعلًا إلى تنفيذ عمل — ويقفون عند مساعدين يعتمدون على الدردشة فقط. المحافِظون يدفنون وظيفة وراء متغيّرات بيئة وعبارات ملطفة. تتكاثر التفريعات مع تعديلات إقليمية، لأن شروط خدمة مزود واحد تقبل الأتمتة headless ومزود آخر لا يقبلها. تنجرف الشفرة من “نفّذ شيئًا” إلى “اقترح شيئًا”، لأن الاقتراحات تمرّ المراجعات وتثير الأفعال الشكوك. تتحول الطاقة من بناء قدرة إلى اجتياز فحص.
كما يظهر في طريقة الشحن. عندما يحذّر مضيف الشيفرة من أن خدمة قطع نماذج تجذب إزالات المحتوى، تتراجع المشاريع إلى تخزين خاص أو استضافة ملكية. عندما يفحص متجر تطبيقات تحديثات عن بُعد، تركز الفرق التنفيذ في خدمة سحابية تسيطر عليها، وتدفع عميلًا رفيعًا إلى المستخدمين. عندما يحظر مزود API التحكم النصِّي في تطبيقات طرف ثالث، ينتقل المشروع إلى حزمة بائع موحّدة تقدم أدوات مُنقّحة مسبقًا. تقل مساحة السطح، ويكبر الاحتكار. تصبح القطعة المفتوحة من النظام واجهة عرض — لقطات جميلة، استقلالية قليلة. الحصان العامل يجلس خلف حاجز مدفوع، تحرسه فريق امتثال شركة واحدة.
هذه الحقيقة المتشعبة تضرّ الفرق الصغيرة أكثر. في اتحاد أو بيئة قطاع عام، حيث تحتاج جهات متعددة إلى الوثوق بنفس agent للعمل عبر أنظمة مشتركة، نادرًا ما يناسب مزوّد مركزي. الفرق في دبي التي تبني خدمات عابرة للجهات تعرف الضغط: متطلبات تدقيق صارمة، حدود بيانات، وضرورة التشغيل عبر منظمات دون منصة واحدة تفرض الشروط. من دون إشارات ثقة قابلة للنقل، يصبح كل نشر تفاوضًا مُفصّلًا. ذلك يقتل السرعة ويقصي الجهات الأصغر التي لا تتحمّل عشرات المراجعات المفصّلة.
الخطر ليس مجرد احتكاك في الاعتماد. إنه الركود. إن انتقلت الأعمال المثيرة إلى خلف التذاكر وصفقات الشركات، يضمحلّ التجريب المفتوح. سننتهي إلى نظام بطبقتين: تجارب “مساعدة” مُنقّحة بعناية على متاجر المنصات، وagents حقيقية في صوامع خاصة. وسيفتح الفاصل بينهما مع كل تعديل سياسي. عندما تُقترح جسور، ستكون مناورة علاقات عامة لا بنية تحتية.
The Fix: Five Interoperable Practices
ما يحافظ على صحة المشترك ليس الخطاب، بل البنية المشتركة والمملة. لمشاريع الـ agentic open source، هذا يعني خمس ممارسات تحول النية إلى آثار يمكن للمنصات استهلاكها. ليست غريبة. هي مماثلة لأشياء يعرفها منظوم البرمجيات: manifests، provenance، sandboxes، قوالب تراخيص، وبوابات CI. تجعل الـ agent مفهومًا ومتوقعًا لأي شخص يحتاج إلى الحكم عليه.
ابدأ بـ manifest للـ agent. اعتبره عقدًا موجزًا قابلاً للقراءة آليًا يصف بالضبط ما سيحاول الـ agent فعله. ليس README. سجل رسمي. يسرد الأدوات المعلنة، مخططات الإدخال والإخراج الخاصة بها، ونطاقات الأذونات التي تحتاجها. يتضمن قواعد خروج البيانات، مثل المجالات أو الخدمات التي يُسمح بالاتصال بها وتحت أي هوية. يسمي النماذج أو نقاط النهاية التي سيستخدمها الـ agent، بما في ذلك البدائل المقبولة. يحدد نقاط تفتيش بشرية، اللحظات التي يجب على الـ agent خلالها عرض قرار للموافقة. يكشف عن التكلفة وحدود المعدل. يعطي للمراجع طريقًا قصيرًا من “ما الذي يفعله هذا الشيء؟” إلى “ما أسوأ ما يمكن أن يفعله هذا الشيء؟” يمكن فحص مثل هذا الـ manifest آليًا (lint)، اختباره في CI، وتغليفه مع الإصدارات. وهو أسهل على مراجعي المتاجر وفرق مخاطر الشركات من قاعدة شيفرة ممتدة بأدوات ديناميكية.
ثانيًا، أضف provenance. ابنِ الـ agent بطريقة تترك أثرًا واضحًا. بناءات محددة النتائج، آثار موقعة، وسجلّ للتبعيات والأوزان المستخدمة. تضمّن فاتورة مكوّنات برمجية (SBOMs) تسرد ملفات النماذج، قوالب الـ prompt، ومكتبات الأدوات مع هاشات وتراخيص. اشحن شهادة (attestation) تربط البناء بمستودع المصدر والـ commit، مستخدمًا آليات توقيع وهوية معيارية. انشر manifest للاتصالات الخارجية التي يمكن للـ agent القيام بها والمجالات التي اختُبر ضدها. لا يمنع كل هذا السلوك السيئ بحد ذاته. لكنه يجعل إخفاءه مكلفًا. هذه جوهرية أمن سلسلة توريد الذكاء الاصطناعي: ليست السيطرة الكاملة، بل إمكانية التتبع.
ثالثًا، شغّل الـ agents في sandboxes مصممة للـ LLMs. تقلق معظم المنصات من الحدود بين التفكير والفعل. لذا اجعل الحد واضحًا. افصل زمن تشغيل النموذج عن الآثار الجانبية. ضع تنفيذ الأدوات خلف وسيط (broker) يفرض قوائم مسموح بها، حدود معدّل، وهوية المستخدم. افترض مبدئيًا عدم وجود وصول للشبكة من عملية النموذج. أعطِ الـ agent مجموعة ضيقة وإعلانية من القدرات التي يمكن تدقيقها وإعادة تشغيلها. إذا كانت هناك قائمة انتظار، ففصّل المستأجرين، حدّ التوازي، واربط الحصص بالهوية بدلًا من ربطها بالـ agent كوحدة موحدة. بيئات تشغيل LLM محاصرة ليست تقنية موضة؛ إنها مبادئ الاحتواء القديمة المطبَّقة على سطح خطر جديد. الهدف ليس التحصين المطلق؛ بل أن تكون أساليب الفشل متوقعة.
رابعًا، غلّف الشيفرة بقوالب قانونية. أول سؤال للمراجع هو: من المسؤول عن ماذا؟ لا تُجبر كل متبنٍّ على اختراع نص سياسة جديد. اشحن سياسة استخدام مقبولة قياسية موجهة للسلوك agentic. بيّن حالات الاستخدام المقصودة والممنوعة. وصف تدفقات الموافقة للعمل نيابة عن المستخدم، كيف تُحفظ السجلات، ولماذا مدتها. قدم خيارات: human-in-the-loop مطلوب، human-on-the-loop مسموح، أو تشغيل مستقل تام في بيئة خاصة. أضف تنبيهات واضحة عن المجالات الحساسة مثل المعاملات المالية والرعاية الصحية. قدّم طريقة بسيطة لعرض وتسجيل موافقة المستخدم في واجهة المستخدم أو CLI. هذه قوالب وليست دروعًا، لكنها تقصّر وقت اتخاذ القرار وتجعل المراجعات أقل عدائية.
خامسًا، طبّق فحوص سلامة في CI تتماشى مع الـ manifest. إذا قال الـ manifest إن الـ agent لا يمكنه إرسال بريد إلكتروني دون نقطة تفتيش، يجب أن يفشل الاختبار إذا أدّى prompt إلى استدعاء أداة بريدية دون موافقة. إذا سرد الـ manifest ثلاث مجالات مسموح بها، يجب أن يحاول إطار الاختبار مكالمات خارج تلك القائمة ويتوقع حظرها. نفّذ هجمات حمراء على الـ prompts واستخدام الأدوات بنفس الطريقة التي نقوم بها بتشويش خدمات الشبكة. تتبّع الانحدارات. اشترط أن تغيّرات الـ prompts وجرد الأدوات تمر بمراجعة شفرة وتولّد شهادات موقعة جديدة. لا يضمن هذا الصلاح بذاته. لكنه يجلب المخاطر إلى دورة البناء والاختبار، حيث يكون التصحيح أرخص وأسهل شرحًا للمنصة.
هذه الممارسات ليست قطع أداء زائدة تستغرق وقتًا. إنها حلقات ضيقة تتناسب مع الطريقة التي تُصدر بها الفرق الشيفرة بالفعل. تجعل الـ agent صعب الفهم الخاطئ وصعب التمثيل الخاطئ. والأهم، تخلق آثارًا يمكن للأنظمة الأخرى الوثوق بها. ذلك، وليس الإقناع، هو العملة اللازمة للحفاظ على الابتكار متاحًا خارج نطاق القلّة التي تستطيع توظيف فرق امتثال.
How It Feels in the Toolchain
الأنماط المجردة سهلة التخييل. يساعد أن نتخيل سير عمل حقيقي مُكيّف بهذه الأفكار. خذ agent حساسًا وبسيطًا: مجدول يستطيع قراءة بريد مشترك، تحليل طلبات السفر، التحقق من التزام بسياسة، وحجز رحلات باستخدام حسابات مؤسسية مخولة. عند التنفيذ البسيط، هذا المشروع يثير كل ردود الفعل المنصّية. يلمس البريد، يجرف موقع حجز، يخزن بيانات شخصية، وينفق أموالًا.
مع manifest، يعلن المجدول بالضبط أي صناديق بريد يقرأ، أي الحقول يستخرج، وما الأدوات التي يستخدمها للبحث والشراء. يُصرِّح الـ manifest أن الحجوزات تُنفَّذ فقط بعد نقطة تفتيش بشرية، مع عرض خط سير مقترح وتكاليف للمستخدم. يحدّ من الحجوزات إلى مجموعة صغيرة مفصّلة من البائعين ويُفرض حد يومي للحجوزات. يتضمن الـ manifest إشارات إلى مستند السياسة ومجموعة اختبارات تفحص البيانات المستخرجة مقابل قواعد الشركة.
تربط provenance البناء بالـ commit، تقفل قوالب الـ prompt وإصدارات الأدوات، وتنشر مراجع مجزّأة لمكتبات SDK الخاصة بالبائعين. يُوقَّع أثر البناء، ويسجل التوقيع في سجل عام. إذا وُزّع المجدول كحاوية، تُوقّع الصورة كذلك، وتشتمل بيانات سلسلة التوريد على هاش نموذج محلل البريد وهاش الـ prompt الخاص بتخطيط المسار.
يقسّم sandbox عقل المجدول ويديه. يعمل الـ LLM بلا شبكة، يتلقى محتوى صندوق البريد المستخرج عبر واجهة مُعرفة بصرامة، ويمكنه اقتراح إجراءات فقط، لا تنفيذها. يفحص عملية broker تلك الاقتراحات وفق قيود الـ manifest. عندما يُقترح حجز، يفرض الـ broker نقطة التفتيش البشرية بتوليد ملخّص ورابط. يوافق المستخدم، ثم يستدعي الـ broker API البائع باستخدام بيانات اعتماد غير مرئية للـ LLM. يُقفل وصول الشبكة الخاص بالـ broker على مجالات الحجز فقط. تُسجَّل كل السجلات مع طوابع زمنية وهشّات الاقتراح حتى يمكن تتبّع الأفعال إلى التفكير الذي أثارها.
تأتي القوالب القانونية مع شاشة موافقة عند التشغيل الأول. تشرح ما يقرأه الـ agent، إلى أين تُرسل البيانات، المدة التي تُحفظ فيها السجلات، ومن المسؤول عن التكاليف. تقدم خيار الانسحاب من التحليل التلقائي للبريد غير المعلّم بعلامة “TRAVEL”. تُصرّح صراحة أن الـ agent لن ينفّذ حجوزات فوق سعر محدد دون موافقة. تتضمن القالب أيضًا إرشادات للمستضيفين الذاتيّين: احتفظ بالسجلات لفترة دنيا، طبّق سياسات الحذف المناسبة، ولا تدمج صناديق بريد بدون موافقة.
فحوصات سلامة CI تتحقق من الحلقة كاملة. اختبر صناديق بريد بعبارات مزعجة — طلبات ساخرة، تواريخ غامضة، ملاحظات خاصة — وحاول إغواء الـ agent للحجز بدون موافقة. اختبر محاولة إخراج معلومات تعريف شخصية إلى مجال غير مُدرج. اطرح سيناريوهات تقييد معدل وتأكد أن الـ agent يفشل مغلقًا لا ضجيجًا. يولِّد كل تشغيل ناجح شهادة جديدة مطبوعة ضمن آثار الإصدار، والتي يمكن لسجل الحزم عرضها.
بهذا السقالة، يمكن لمضيف الشيفرة فحص المشروع واختياره للاستضافة بثقة، لأن المخاطر مُبيّنة. يمكن لمراجع متجر تطبيقات فهم السلوك المقصود ورؤية أن عملية التحديث لا تهرّب قدرات جديدة. يمكن لمتبنٍ مؤسسي التقطّح المستودع ومعرفة الروافع المتاحة للامتثال للسياسة. يظل الـ agent agentic — قادرًا على حجز رحلات — لكنه موصّل أيضًا بأسطح تحكم يحتاجها المراجعون. نفس النمط يمتد إلى تدفقات أكثر تعقيدًا: ملء نماذج headless، تقديم وثائق إلى بوابات حكومية، أتمتة دعم فني في مكتب مساعدة. كل سيناريو يصبح قابلاً للحكم ليس بالحجة، بل بشكل الشيفرة والعقود المحيطة بها.
اعتبر حالة ثانية: مساعد CLI يستطيع تقديم pull requests، ووسم القضايا، ودمج التغييرات بعد اجتياز الفحوص. لا يبدو ذلك مثيرًا للجدل، ومع ذلك على العديد من المنصات هذا ينجرف نحو سلوك محظور عندما يُنفَّذ عبر توكنات غامضة وتجريف هش. اجعل الأمر صريحًا. يسرد الـ manifest المستودعات التي يمكن للـ agent لمسها، الوسوم التي يجوز له تطبيقها، وفحوص الـ CI التي يجب أن تكون خضراء قبل أن يقترح دمجًا. تغطّي provenance نسخة قالب رسالة الالتزام وخوارزميات تحليل الفرق. يمنع الـ sandbox وصول الـ LLM المباشر إلى أسرار المستودع؛ يراه الفروقات والتعليقات فقط. يوضح القالب القانوني أن عمليات الدمج تتطلب موافقة بشرية في الطرفية، مع أثر تدقيقي. يحقن CI فروقات مُصممة لمحاولة التحايل على الفحوص. إذا تحدّت منصة المشروع، يمكن للمحافظ الإشارة إلى حدود موقعة ومدعومة بالاختبارات. تلك محادثة مختلفة تمامًا عن “ثقوا بنا، إنه مجرد مساعد.”
ستحتج بعض الفرق أن هذا العبء ضريبة على الابتكار. إنها ضريبة. لكنها أيضًا حاجز أمان يفتح توزيعًا أوسع. تجاهلها لا يلغي الجهد؛ بل يدفع التكلفة إلى أسوأ وقت: أثناء مراجعات الحسابات، عندما تكون السياسات غامضة والجداول الزمنية ليست ملكك. من الأفضل أن تدفع بالشفرة والسفن بدلاً من الدفع بالقلق والاستئنافات.
The Centralization Pitch, Answered
هناك حجة محترمة مضادة: مركزية الـ agents على منصات يمكنها فرض السلامة. ضع الأدوات خلف وسيط واحد تديره شركة كبيرة. قدم سوقًا لأفعال مُعتمدة، مع فحوص هوية، حدود معدل، وحلول نزاع. استبعد الـ agents المجهولة التي تحاول التجول عبر الأنظمة. احتفظ بالتحكم لدى من لديهم ما يخسرونه لو حدث خطأ. هذا المنطق له تاريخ في صالحه. هكذا أصبحت الهواتف الذكية آمنة بدرجة كافية للاستخدام الواسع. هكذا نجا قطاع المدفوعات من أسوأ موجات الاحتيال. بوابة واحدة تُسهّل الإمساك بالمسيئين.
الحجة لها جاذبية عملية أيضًا. يمكن لمزوّد مركزي أن يقوم بعمليات KYC شاملة، يكتشف الاحتيال عبر العملاء، يقدم تعويضات، ويشغّل red teams لا تستطيع معظم مشاريع الـ open source تحملها. يمكنه بناء تجربة مستخدم مصقولة تجعل human-in-the-loop أكثر من خانة اختيار؛ تصبح تدفقًا موثوقًا. يمكنه التفاوض على الوصول مع منصات أخرى وتسهيل احتكاكات السياسات. من وجهة نظر مشتري مؤسسي، يبدو ذلك فعّالًا. فمأزق واحد يمكن الاعتماد عليه. لوحة تحكم واحدة للمراقبة.
الجواب ليس إنكار أيٍّ من هذا. الجواب هو إدراك التكلفة. تعمل المركزية بجعل الإذن نادرًا وبمجاملة الجهات الأكبر. تخلق أحادية هشة تنكسر عند الحواف، حيث يهم السياق المحلي. تحول الابتكار إلى تجربة اختيار، حيث تبقى المنتجات المصقولة والموصولة فقط. تضيق سلسلة التوريد إلى درجة أن تغيير سياسة في شركة واحدة قد يترك مجالات عمل بأكملها.
يعيش الـ open source بنشر الإذن، لا بتجاهل المخاطر. الممارسات أعلاه ليست تمردًا على السيطرة؛ إنها اقتراح لنقل السيطرة أقرب إلى حيث يجب أن تُمارَس. لا ينبغي لقسم حكومي يقيم agent داخليًا في أبوظبي أن يضطر لقبول شروط منصة أجنبية شاملة. ولا ينبغي لصانع أدوات صغير أن يمرّ بلجنة مراجعة عالمية للسماح لمستخدم بتقديم تقارير مصاريف. كلاهما بحاجة إلى نفس الشيء: ضمانات قابلة للنقل وقابلة للتفتيش بأن الـ agent سيتصرّف ضمن الحدود. عندما تصاحب هذه الضمانات الشيفرة، تخسر المركزية أقوى حججها. لا يحتاج المراجع إلى التخمين. يمكنه التحقق.
ربما يقول متشكك: المستخدمون لن يقرأوا الـ manifests، والمنصات لن تفكّك الشهادات. هذه نقطة عادلة إذا كانت هذه الآثار مخصصة للبشر فقط. لا ينبغي أن تكون كذلك. المهمة أن نجعلها مدخلات من الدرجة الأولى للمتاجر، السجلات، وأنظمة CI. شاشات للناس، ومحلّلات للآلات. تذكر كيف تطورت توقيعات الحزم، ملفات التراخيص، وSBOMs من نِخبة إلى عادي. بدأت كخانات نعم/لا لفرق الامتثال، ثم أصبحت فحوصًا وقت البناء ومتطلبات وقت النشر. يمكن أن يلعب نفس المسار هنا، إذا اتفقنا مبكرًا على الشكل والدلالات.
A Boring Standard Is a Strategic Weapon
القطعة المفقودة ليست عبقريّة. إنها انضباط. يحتاج نظام الـ open-source agent إلى التصرف كما لو أن هناك معيارًا قائمًا بالفعل. اكتب manifests للـ agent كما لو أن متاجر التطبيقات ستستوعبها. أرفق provenance كما لو أن السجلات ستتحقق منها. ابنِ sandboxes كما لو أن المراجعين سيكسرون الزجاج في أسوأ يوم لك. اشحن قوالب قانونية كما لو أن معظم المتبنّين بلا مستشار. سلّك فحوص CI كما لو أن فريقك نفسه سينسى ما الذي يمكن للـ agent فعله بعد ستة أشهر.
يجب على المنصات أن تقابل هذا في منتصف الطريق. امنح مشاريع agentic فئة واضحة، مع توقعات صريحة وقائمة مراجعة منشورة. اقبل manifests، وارجع بملاحظات مُهيكلة عن الانتهاكات. قدّم طريقة لإعلان نقاط التفتيش البشرية التي يمكن لأنظمة المراجعة التحقق منها أثناء استعراض التطبيق. فرق السياسة بين العمل والتفكير؛ لا تُعاقب الاستدلال غير المتصل الذي لا يؤدي إلى أثر. قدّم مسارًا ثابتًا للامتثال بدلًا من مطالبة غامضة بـ “لا أتمتة”. إذا فعلنا جزئنا في توفير حدود قابلة للفحص الآلي، يمكن للمنصات أن تفعل جزئها بجعل هذه الحدود قابلة للتنفيذ.
يمكن للمضيفين المساعدة بتمييز الآثار ذات النسب الواضحة عن تلك التي تفتقر إليها. عندما يشحن مشروع بناءات موقعة، تكوينات قابلة للتكرار، وSBOMs، عاملها بشكل مختلف عن أرشيف غامض يظهر بين عشية وضحاها. قدّم قناة للآثار البحثية ذات المخاطر التي تحمل توثيقًا جيدًا لتلك المخاطر. انشر إرشادات حول كيفية تنظيم المستودعات حتى لا يضطر المراجعون لاستنتاج النية من الشيفرة وحدها.
على مسؤولي أدوات البنيّة العمل كذلك. يمكن لمديري الحزم إضافة حقول لقدرات الـ agent ومنع استخدام الأدوات الافتراضي ما لم يُطلب صراحة. يمكن للأُطر توليد manifests واختبارات سلامة من تعليقات في الشيفرة، بحيث يكون العبء خفيفًا. يمكن لأطر الاختبار أن تشحن مجموعات prompts قياسية تتحقق من الحلقات، الخروج على الحماية، واستدعاءات الأدوات غير المصرح بها. يجب أن يكون التوقيع والشهادات سطرًا واحدًا في قوالب CI، لا مشروع عطلة نهاية أسبوع.
هناك بعد سياساتي كذلك، ولا يتطلب قوانين جديدة. يمكن لمجموعات صناعية ومؤسسات مفتوحة استضافة manifests مرجعية، بنود قانونية نموذجية، واختبارات توافق. يمكنها تشغيل لوحات عامة تُظهر أي المشاريع تنشر provenance وتنجح في مجموعات السلامة. يمكنها استضافة سجلات شفافية للإصدارات الموقعة حتى لا تتجمع الثقة في بائع واحد.
البديل هو الانجراف. ستمر الوسائل المعلبة الجميلة اختبارات المتاجر لأنها نادرًا ما تتصرف. سيعيش الـ agents الحقيقيون على مشغّلات خاصة ومنصات بائع واحد. عندما يختل شيء، سنطلب حظرًا كليًا على “البوتات”، لأن النظام لم يبنَ لغة للسيطرة الدقيقة. يمكننا تجنّب هذا المصير بتحويل السيطرة إلى شيفرة والشيفرة إلى إشارات محمولة.
نقطة أخيرة عن الحوافز. الممارسات المقترحة ليست اختبار نقاء. إنها إسفين تنافسي. المشاريع التي تشحن manifests، provenance، sandboxes، قوالب قانونية، وفحوص CI للسلامة ستكون أسهل في الاعتماد في بيئات محافظة. سيكون لديها قصة أفضل لفرق المخاطر. ستعمل في أماكن أكثر، وعلى منصات أكثر، مع استئنافات أقل. هذا الامتداد يصبح خندقًا. ليس أصدق الضجيج، لكنه الخندق الذي يدوم عندما يخفّ الصخب وتبدأ عمليات التدقيق.
لا يحتاج الـ agentic AI open source إلى الفوز بمعركة خطابية مع المنصات. يحتاج لأن يصبح أسهل شيء للموافقة عليه. هذا طموح من نوع مختلف — أهدأ، أرسخ، أكثر إجرائية. يطلب من المحافِظين شحن سحر أقل وقليلًا من السباكة أكثر. يطلب من المنصات نشر معايير يمكن تحقيقها بالشيفرة. يطلب من المتبنّين الاعتراف بآثار العناية ومكافأتها بالوصول.
إذا أردنا agents تعمل حيث يتواجد المستخدمون، تحت سياسات يفهمونها، فهذه هي الطريق. ليست مناشدة للتساهل، ولا حملة إطلاق، بل عقد عملي وقابل للتشغيل بين البناة وحراس البوابة. ابنِ الـ agent manifest واربطه بالآثار. سَجِّل السلسلة من الـ prompt إلى الحزمة. احتفظ بوقت التشغيل في sandbox شكلها مرئي وقابل للإنفاذ. اشحن وضوحًا قانونيًا مع كل إصدار. أفشل البناء عندما ينحرف الـ agent.
افعل ذلك، وستبقى الحوافّ حية. اتركه، وسيفعل المركز ما يفعله دائمًا عندما يشعر بالبرودة — سوف يشدّ. الخيار ليس بين السرعة والأمان. إنه بين بناء معيار مشترك الآن أو المساومة إلى الأبد. اشحن المواصفة، لا التوسّل. كن مملاً عن قصد. هكذا يبقى هذا المجال مفتوحًا.