Thinking Machines Meluncurkan Model Interaksi dengan Respons 200 md, Mengungguli GPT-Realtime-2.0

Menurut Beating, Thinking Machines—lab yang didirikan oleh mantan CTO OpenAI Mira Murati—merilis pratinjau riset dari model Interaction, yang menampilkan pemrosesan audio dan video real-time native dengan respons micro-turn 200 milidetik. Model ini memungkinkan pendengaran, penglihatan, dan berbicara secara bersamaan sekaligus mendukung interupsi pengguna secara real-time.

Model TML-Interaction-Small menggunakan arsitektur MoE berparameter 276 miliar dengan 12 miliar parameter yang aktif per inferensi. Data resmi menunjukkan latensi speech turn-taking 0,40 detik dan skor FD-bench V1.5 sebesar 77,8, keduanya mengungguli GPT-Realtime-2.0 dan Gemini 3.1 Flash Live. Akses pratinjau terbatas direncanakan untuk beberapa bulan mendatang.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar