كيف يستخدم Codex الكمبيوتر؟ ثلاثة مداخل وحدود الصلاحيات

العنوان الأصلي: ثلاث طرق يمكن لـ Codex استخدامها للحاسوب
الكاتب الأصلي: جيسون
الترجمة: بيغي، BlockBeats

ملاحظة المحرر: استعرضت هذه المقالة ثلاثة مداخل لبيئة تشغيل Codex الخارجية: استخدام الحاسوب، إضافة Chrome، والمتصفح داخل التطبيق. تبدو الثلاثة جميعها تحل مشكلة «تمكين Codex من استخدام الحاسوب»، لكنها تتعلق بمواقف مهام، حدود صلاحيات، ومستويات ثقة مختلفة.

حيث أن، استخدام الحاسوب يغطي أوسع نطاق، ويمكنه مباشرة التحكم في التطبيقات الأصلية المصرح بها على macOS / Windows، إعدادات النظام، محاكيات iOS، وحتى إتمام سير العمل عبر تطبيقات متعددة. يناسب العمليات التي لا تدعم API، الإضافات، أو الأدوات الهيكلية، لكن بتكلفة أبطأ، وحدود صلاحيات أوسع. أما إضافة Chrome فهي مناسبة للمهام التي تعتمد على حالة تسجيل الدخول، الكوكيز، علامات التبويب المتعددة، وهوية المتصفح، مثل Gmail، LinkedIn، Salesforce، أو الخلفية الداخلية، أو الأبحاث عبر مواقع متعددة بعد تسجيل الدخول. والمتصفح داخل التطبيق أكثر ميلًا لسيناريوهات التطوير والتصحيح، خاصة للخدمات المحلية، أخطاء العرض، التخطيط التفاعلي، والتعليقات على التصميم؛ فهو لا يرث حالة تسجيل الدخول للمستخدم العادية، قدراته أضيق، لكنه يعزل بشكل أقوى.

الاستنتاج الرئيسي هو أن، ليس هناك طريقة واحدة فقط لـ Codex «استخدام الحاسوب»، والأهم هو اختيار واجهة التشغيل الأكثر ضيقًا، أمانًا، وهيكلية حسب المهمة. إذا كان يمكن استخدام الإضافات أو MCP، فلا ينبغي الاعتماد أولاً على التحكم البصري؛ إذا كانت المهمة تتعلق بتطوير الويب فقط، فالأفضل استخدام المتصفح داخل التطبيق؛ وعندما يتطلب الأمر هوية وتسجيل دخول المستخدم، يتم التبديل إلى Chrome؛ فقط عندما تعجز الأدوات الهيكلية عن التغطية، ويجب الاعتماد على الواجهة الرسومية على سطح المكتب، يكون استخدام الحاسوب هو الحل الأخير.

Appshots ليست طريقة رابعة للتحكم في الحاسوب، بل أداة «إظهار سياق الشاشة الحالي» لـ Codex. فهي تعالج مشكلة إدخال السياق، بينما الحلول الأخرى (المتصفح، Chrome، واستخدام الحاسوب) تعالج مشكلة التنفيذ. عند النظر إليها مجتمعة، تكشف هذه الطبقات عن المفتاح لمنتجات وكيل الذكاء الاصطناعي: ليس منح النموذج صلاحيات غير محدودة، بل تضييقها تدريجيًا، وتحديد الحدود، مع إبقاء المستخدم مسؤولاً عن مراجعة الإجراءات المهمة.

وفيما يلي النص الأصلي:

هناك ثلاث طرق لاستخدام Codex للحاسوب: استخدام الحاسوب، إضافة Chrome، والمتصفح داخل التطبيق.

هناك تداخل بينها، وهو ما قد يسبب بعض الالتباس.

بعد قراءة هذه المقالة، ستعرف كيف تثبت وتفعّل هذه الطرق الثلاث، وفي أي سيناريوهات تستخدمها، وكيف تربط بين Appshots ووضع المطور، وما الذي يجب أن تكتبه في ملف AGENTS.md ليختار Codex واجهة التشغيل المناسبة بنفسه.

النسخة المبسطة هي:

ومع ذلك، طالما أمكن، يُفضّل استخدام الإضافات أو MCP. على سبيل المثال، يمكن لإضافة Slack أن تتيح استرجاع موضوع معين بدقة أكبر من النقر في Slack؛ عمليات GitHub الناتجة عنها أسهل في الفحص من أن يقودها Codex عبر الويب. التحكم البصري مناسب أكثر عندما تصل قدرات الأدوات الهيكلية إلى حدودها.

كل شيء يمكن أن يكون @Computer

استخدام الحاسوب هو الأكثر تغطية بين هذه الواجهات الثلاث. يتيح لـ Codex عرض والتحكم في الواجهات الرسومية على macOS و Windows، بما في ذلك النوافذ، القوائم، إدخال لوحة المفاتيح، وحتى الحافظة داخل التطبيقات المصرح بها.

وغالبًا ما يكون أبطأ. الإضافات الهيكلية يمكنها استدعاء API مباشرة؛ بينما يتطلب استخدام الحاسوب مراقبة الواجهة، وتحديد أين ينقر، وانتظار استجابة التطبيق، ثم فحص الحالة التالية. هذه الدورة البصرية تستهلك وقتًا، لكنها تتيح لـ Codex التحكم في تطبيقات لا توفر API على الإطلاق.

على macOS، لا يعني البطء بالضرورة إزعاجك. يمكن لـ استخدام الحاسوب العمل في الخلفية على التطبيقات المصرح بها، وأنت لا تزال تستخدم أجزاء أخرى من الحاسوب. كثيرًا ما أجد أن Codex ينفذ سير عمل هادئ في الخلفية أثناء استخدامي لتطبيق معين.

اعتمادًا على التطبيقات المصرح بها على جهازك، يمكن أن تشمل هذه العمليات Spotify، Xcode، إعدادات النظام، محاكيات iOS، أو حتى التحكم في iPhone عبر Mirroring. ويمكنه أيضًا التبديل بين تطبيقات متعددة لمعالجة سير عمل يمتد عبرها.

عندما تعتمد المهمة على التالي، يمكنك استخدامه:

تطبيقات سطح المكتب الأصلية، مثل Spotify أو التطبيقات المالية؛

محاكيات iOS، أو Mirroring، أو عمليات تتطلب واجهة رسومية فقط؛

إعدادات النظام أو التطبيق؛

مصادر البيانات التي لا تدعم الإضافات أو API؛

سير عمل يتطلب التبديل بين تطبيقات متعددة؛

الخطوة الأخيرة المفقودة في تكامل هيكل معين.

طريقة التثبيت: افتح إعدادات Codex > استخدام الحاسوب، ثم اضغط على تثبيت.

طريقة التفعيل: اذكر @Computer، أو اطلب بوضوح من Codex استخدام استخدام الحاسوب. ومع تطور قدرات النموذج، سيبدأ في استدعائه تلقائيًا عند الحاجة.

جرب بعض الأمثلة:

أحب مثالًا واحدًا، بدأ عندما سرق طرد. أخبرتني أمازون أنني سأنتظر حوالي 25 دقيقة للاتصال بخدمة العملاء. أرسلت موضوعًا إلى Codex عبر استخدام الحاسوب، ليقوم بفحص نافذة الدردشة كل خمس دقائق، وعندما يظهر ممثل الدعم، يغير الفحص إلى كل دقيقة، ويساعدني في استرداد المبلغ. بعد أن انتهيت من الاستحمام، كانت عملية الاسترداد قد اكتملت.

استخدم @Computer لفتح Spotify، والعثور على قائمة التشغيل Discover Weekly، وبدء تشغيلها. لا تغير إعدادات حسابي أو اشتراكي. استخدم @Computer لفتح Mirroring الخاص بـ iPhone، وإعادة إنتاج خطأ التوجيه في تطبيق iOS، والتقاط لقطة شاشة للحالة الفاشلة. أصلح أدق مسار برمجي، ثم أعد تشغيل نفس التدفق مرة أخرى.

كما أستخدم استخدام الحاسوب كـ «الكيلومتر الأخير» في سير العمل الهيكلي. في أحد مقاطع الفيديو المنشورة، يمكن لـ Codex قراءة الملاحظات من Slack، وتعديل الكود، وإنتاج فيديو جديد، لكن تكامل Slack في ذلك الموضوع لم يكن قادرًا على رفع الملفات. فقام استخدام الحاسوب بالنقر على إضافة ملف، وأكمل الخطوة المفقودة.

كما أنه أحد أكثر الطرق ثقة، حيث يمنح صلاحية واضحة لتطبيق أو سير عمل معين. عند عدم الحاجة إلى تطبيقات حساسة، يُبقيها مغلقة؛ ويجب فحص نوافذ الأذونات بعناية؛ وعند التعامل مع الأمور المالية، الحسابات، المدفوعات، الشهادات، الخصوصية، أو تغييرات أمان النظام، من الأفضل أن يكون شخص حاضرًا للمراجعة.

استخدام @Chrome لإدارة علامات التبويب وتسجيل الدخول

إضافة Chrome لـ Codex تتيح لـ Codex الوصول إلى حالة تسجيل الدخول في Chrome الخاص بك. عندما تعتمد المهمة على الحساب، الكوكيز، ملف التكوين، أو علامات التبويب التي تم فتحها وتوثيقها، فمن الأفضل استخدامه.

هذه الواجهة مناسبة للأدوات التالية:

Gmail أو LinkedIn؛

Salesforce أو خلفية الدعم؛

لوحات المعلومات الداخلية؛

البحث بعد تسجيل الدخول عبر مواقع متعددة؛

نماذج تعتمد على حسابك أو ملحقات المتصفح.

طريقة التثبيت: افتح إضافات Codex، أضف Chrome، واتبع خطوات الإعداد. سيقوم Codex بتوجيهك لتثبيت إضافة Chrome الخاصة بـ Codex، ومنح صلاحيات Chrome. عندما تظهر علامة «متصل»، ابدأ موضوعًا جديدًا.

طريقة التفعيل: اذكر @Chrome، أو اطلب بوضوح من Codex استخدام Chrome الذي سجلت الدخول إليه:

استخدم @Chrome لمراجعة حساب العميل المفتوح، ومقارنته مع تذكرة الدعم في التبويب الآخر، وصياغة الحقول المفقودة. توقف قبل الإرسال.

سيعمل مهمة Chrome ضمن مجموعة علامات تبويب، مما يسهل وضع علامات التبويب ذات الصلة بموضوع معين من Codex معًا. وعلى عكس المتصفح داخل التطبيق، فإن هذه الواجهة تحمل هوية متصفحك، مما يمنحها قدرات أكثر، لكنها أكثر حساسية.

ميزة رئيسية أخرى هي التحكم في علامات التبويب المتعددة. يمكن لـ Chrome ربط عدة علامات تبويب بمهمة واحدة، وقراءة السياق من صفحة، ومقارنة المعلومات في صفحة أخرى، والمتابعة في صفحة ثالثة. يمكن أيضًا لـ استخدام الحاسوب التحكم في المتصفح عبر الرؤية، لكن Chrome يفهم المهمة كـ «سير عمل متصفح»، وليس مجرد سلسلة من عمليات تحديد الموقع.

مؤخرًا، كانت هناك مهمة، حيث سلمت لـ Codex علامة تبويب من متصفح Strudel Composer مفتوحة، ليقوم بجعل الموسيقى أكثر إثارة. أعطاه Chrome علامة التبويب المختارة، وأداة WebMCP المعروضة على الصفحة. فقام بفحص بنية اللحن، وأعاد كتابة الهارموني، وشكل المقطوعة بأكملها في أربع دقائق، وعدل السرعة، وحفظ المقطوعة، وواصل التشغيل. لم يكن بحاجة للبحث بصريًا عن كل عنصر، لأن Chrome جمع بين سياق الصفحة والقدرة الهيكلية التي توفرها.

كما استخدمته لتشغيل سلسلة طويلة على Twitter. التعليمات كانت:

كل يوم، استخدم Chrome للتحقق من رسائل DMs، وقراءة الأخبار ذات الصلة، والبحث عن ملاحظات أو إشارات يجب أن أعرفها. أضف أي شيء دائم إلى خزنتي. لا تنشر أو ترسل رسائل.

الأمر المثير هو أن Codex يمكنه فتح Twitter، لكن الأهم هو أن هذه السلسلة يمكنها العودة بشكل دائم إلى بيئة عمل مسجلة، وربط المحتوى المكتشف بملف محلي، وترك نتيجة للمراجعة.

حدود الثقة هنا مهمة. قد تعتبر المواقع أن نقرات Codex، وإرسال النماذج، والرسائل التي يرسلها، هي أفعالك الشخصية. محتوى الصفحة نفسه غير موثوق به. يجب تمييز الخطوات ذات العواقب الكبيرة: البحث، التصفح، والصياغة يمكن أن تتم تلقائيًا؛ لكن قبل الإرسال أو النشر أو الشراء، يجب أن تراجع.

إذا كانت المهمة تتم بالكامل داخل المتصفح، فالأفضل استخدام Chrome، وليس استخدام الحاسوب. لأن Chrome يوفر سياق المتصفح الأصلي المطلوب، ولا يوسع نطاق الوصول إلى سطح المكتب بأكمله.

استخدام @Browser داخل التطبيق لتطوير الموقع الذي تعمل عليه

المتصفح داخل التطبيق هو متصفح موجود داخل موضوع Codex. يتشارك مع Codex نفس صفحة العرض، مما يجعله مثاليًا لبناء وتصحيح تطبيقات الويب.

عادةً، أبدأ من هنا:

خادم التطوير المحلي؛

صفحة المعاينة المستندة إلى الملفات؛

الصفحات العامة غير المطلوب تسجيل الدخول إليها؛

إعادة إنتاج أخطاء العرض؛

فحص التخطيط التفاعلي؛

وترك ملاحظات على عناصر الصفحة.

أهم قيد هو العزل. المتصفح داخل التطبيق لا يستخدم إعدادات المتصفح العادية، الكوكيز، الإضافات، جلسات تسجيل الدخول، أو علامات التبويب المفتوحة. عندما تتطلب المهمة هوية حساب، فهذا قيد؛ لكن عندما لا تتطلب، فهو حد مفيد.

طريقة الإعداد: افتح إضافات Codex، أضف متصفح، وفعّله.

طريقة التفعيل: اذكر @Browser في الأمر، أو اطلب بوضوح من Codex استخدام المتصفح داخل التطبيق:

استخدم @Browser لفتح تطبيق vite على http://localhost:3000/، إعادة إنتاج خطأ التمرير على الهاتف المحمول، إصلاحه، والتحقق من نفس المسار على الشاشات المحمولة والمكتبية.

سوف يشكل ذلك حلقة تغذية مرتدة وثيقة: يمكن لـ Codex تحرير الكود، والتحكم في الصفحة، وفحص الحالة، والتقاط لقطات، ثم إعادة التحقق من نفس التدفق بعد الإصلاح.

أحب جزء العلامات التوضيحية أكثر. عند مراجعة تطبيق محلي، يمكنني النقر مباشرة على عنصر معين، أو تحديد منطقة وترك تعليق. أدوات النمط تتيح لي معاينة النص، الخط، التباعد، والألوان بدقة أكبر. غالبًا، أدمجها مع الإدخال الصوتي، وتوجيه العمليات: أراجع الصفحة، أترك ملاحظات، وأواصل إضافة المزيد أثناء معالجة Codex للتعليقات الحالية. الصفحة نفسها تصبح بمثابة وثيقة المواصفات.

هذه مفيدة جدًا للعمل التصميمي. أطلب من Codex غالبًا أن ينظم فكرة، أو حزمة بحث، أو حالة مشروع في ملف واحد index.html، ثم يفتحه داخل المتصفح داخل التطبيق. بدلاً من محاولة وصف التصميم بالكامل في أمر واحد، أستطيع وضع تعليقات مباشرة على الصفحة الحقيقية: «هذا التسلسل الهرمي معكوس»، «لا تضع هنا كأنها بطاقات»، «هذه العناصر تحتاج إلى مزيد من المساحة»، أو «استخدم نفس نسبة الخط في الموقع كله». يتلقى Codex تعليقات مع لقطات شاشة وسياق العناصر، ويعدل الملف، ثم يعيد فتح الصفحة للدورة التالية.

أنشئ ملف index.html واحد لهذا المشروع وافتحه في @Browser داخل التطبيق.

هذه الدورة تشبه العمل مع مصمم على لوحة واحدة، بدلاً من إرسال لقطات وتعليقات ذهابًا وإيابًا.

المتصفح داخل التطبيق مناسب أيضًا كنقطة انطلاق لسير عمل هجين. في موضوع آخر، فتحت عبر المتصفح داخل التطبيق منشورًا من X، وطلبت من Codex استقصاء المناقشات ذات الصلة. ساعدها الصفحة على تحديد المنشور المقصود؛ ثم حولت إلى Twitter CLI، واسترجعت 38 ردًا، بما في ذلك الردود المتداخلة التي كانت مخفية في عرض المتصفح. هذا تطبيق لمبدأ «استخدام أدق واجهة تحكم»، حيث تؤكد على السياق على الشاشة، ثم تستخدم أدوات هيكلية للبحث الأعمق.

هناك أيضًا تضحيات. عزل المتصفح داخل التطبيق يجعله واجهة تطوير جيدة، لكنه غير مناسب لتسجيل الدخول إلى Google، أو Passkeys، أو المواقع التي تعتمد على إضافات المتصفح. عندما يكون الهوية مهمًا، التبديل إلى Chrome هو الحل.

Appshots

Appshot ليست طريقة رابعة للتحكم في الحاسوب من قبل Codex. إنها وسيلة «لإظهار سياق الشاشة أمام Codex».

على Mac، بالضغط مرتين على مفتاح CMD، يمكنك التقاط النافذة الأخيرة. سيضيف Codex صورة ونصوصًا متاحة إلى الموضوع. يمكنك عمل Appshot لخطأ، أو بريد إلكتروني، أو تصميم، أو لوحة إعدادات، أو نموذج غريب، ثم تقول مباشرة:

هذه هي النموذج العقلي الأسهل تذكره: Appshots هي وسيلتك للإشارة إلى شيء على الحاسوب؛ وChrome، وComputer Use، هي طرق اتخاذ الإجراءات من قبل Codex.

يتم إنشاء Appshots حاليًا عبر تطبيق Codex على macOS. يلتقط النافذة الأمامية فقط، وليس سطح المكتب بأكمله. هذا يجعلها وسيلة مفيدة جدًا: يمكنك تقديم سياق مركز، دون منح السيطرة على التطبيق.

كيفية متابعة التطورات

تتغير هذه الواجهات بسرعة. إذا أردت الحصول على تفاصيل عملية، بدلاً من انتظار ملخص إصدار كبير:

تابع Ari Weinstein (@AriX)، لمعرفة استخدام الحاسوب وAppshots؛

تابع James Sun (@JamesZmSun)، لمعرفة محتوى المتصفح؛

تابع Andrew Ambrosino (@ajambrosino)، لمعرفة إصدار تطبيقات Codex، وسرد منتجات سطح المكتب الأكبر؛

تابع مطوري OpenAI (@OpenAIDevs)، لمعرفة أخبار أوسع عن Codex وOpenAI Platform.

[رابط النص الأصلي]

انقر لمعرفة وظائف BlockBeats في التوظيف

انضم إلى المجتمع الرسمي لـ BlockBeats:

قناة Telegram: https://t.me/theblockbeats

مجموعة Telegram: https://t.me/BlockBeats_App

حساب Twitter الرسمي: https://twitter.com/BlockBeatsAsia

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت