وفقاً لـ Beating وThinking Machines، وهي المختبر الذي أسسته مايرا موراتي، كبير مسؤولي التكنولوجيا السابق لدى OpenAI، أطلق المختبر نسخة بحثية تجريبية من نموذج Interaction، يتضمن معالجة صوت وفيديو في الوقت الفعلي بشكل أصلي، مع استجابات دقيقة تفصلها 200 مللي ثانية. يتيح النموذج الاستماع والمشاهدة والتحدث في الوقت نفسه، مع دعم مقاطعات المستخدم الفورية.
يستخدم نموذج TML-Interaction-Small بنية MoE تضم 276 مليار معلمة، مع تفعيل 12 مليار معلمة لكل استدلال. تُظهر بيانات رسمية تأخر تبديل أدوار الكلام البالغ 0.40 ثانية، ودرجة FD-bench V1.5 البالغة 77.8، وكلاهما يتجاوز GPT-Realtime-2.0 وGemini 3.1 Flash Live. من المقرر إتاحة وصول محدود للمعاينة خلال الأشهر المقبلة.