Hasil pencarian untuk "GPT"
Hari Ini
02:13

OpenAI GPT-5.6 Mencapai Terobosan Pembersihan UI, Menghasilkan Aplikasi Desain Minimal di Build Internal Terbaru

Menurut Beating monitor, model generasi berikutnya OpenAI, GPT-5.6 (kode internal iris-alpha), telah mencapai terobosan signifikan dalam pembuatan UI, mengatasi kualitas output frontend yang sebelumnya buruk. Pada build terbarunya, model tersebut menghasilkan aplikasi catatan minimal bernama Lumen Notes dengan tata letak grid yang matang dan estetika yang lebih halus—kontras tajam dengan antarmuka yang berantakan dan formulais yang umum pada output AI generatif. Peningkatan ini menandai upaya te
Lainnya
01:29

OpenClaw Meluncurkan v2026.5.18 dengan Suara Real-Time di Android, Menambahkan Dukungan Penuh GPT-5

Menurut Beating, OpenClaw merilis versi v2026.5.18 pada 18 Mei, menghadirkan percakapan suara real-time ke Android serta dukungan penuh untuk model GPT-5.1, GPT-5.2, GPT-5.3, dan openai-codex. Pembaruan Android memungkinkan streaming input mikrofon dengan pemutaran audio real-time, penghubung hasil alat untuk sinkronisasi instan pemanggilan alat selama sesi suara, dan live captions. Rilis ini juga memperkenalkan antarmuka defineToolPlugin yang disederhanakan bagi pengembang untuk membuat ekstens
Lainnya
02:37

Google Cloud Menampilkan Model Gemini 3.2 Flash Lite dengan Biaya Inferensi 95% Lebih Rendah Dibanding GPT-5.5

Berdasarkan pemantauan Beating.AI, opsi model baru bernama gemini-3.2-flash-lite-live-preview telah muncul di daftar pilihan model Google Cloud per 17 Mei. Sufiks “lite” dan “live” menandakan bahwa Google sedang membuat versi khusus yang dioptimalkan untuk interaksi real-time dengan latensi ultra-rendah. CEO Abacus.AI Bindu Reddy sebelumnya mengungkapkan bahwa Gemini 3.2 Flash mencapai 92% dari kemampuan coding dan penalaran GPT-5.5, sekaligus menjaga biaya inferensi hanya 1/20 dari GPT-5.5, den
Lainnya
09:41

Vals AI Rilis Benchmark Finance Agent v2; GPT-5.5 Raih Skor 51,76%, Semua Model Turun di Bawah 40% di Bawah Penilaian Ketat

Menurut Beating, perusahaan penilai AI Vals AI merilis benchmark Finance Agent generasi kedua v2 pada 14 Mei, menguji alur kerja analisis keuangan melalui 927 pertanyaan yang ditinjau oleh para ahli. GPT-5.5 memuncaki peringkat dengan tingkat akurasi 51,76%, disusul ketat oleh Claude Opus 4.7 (51,51%) dan Claude Sonnet 4.6 (51,03%). Pengujian menuntut model untuk secara mandiri menemukan bagian-bagian relevan di ratusan halaman dokumen laporan keuangan 10-K dan 10-Q serta menyelesaikan perhitung
Lainnya
ALL3,74%
06:25

Google Akan Meluncurkan Gemini 3.2 Flash di I/O pada 20 Mei, Menyamai Performa GPT-5.5 dengan Biaya 1/15

Menurut CEO Abacus.AI Bindu Reddy, Google berencana mengumumkan Gemini 3.2 Flash selama konferensi I/O pada 20 Mei, dengan performa mencapai 92% dari GPT-5.5 pada tugas coding dan penalaran sekaligus memangkas biaya inferensi menjadi hanya seperlima belas hingga seperdua puluh dari yang terakhir. Sebagian besar kueri akan memiliki latensi di bawah 200 milidetik. Reddy mengaitkan terobosan tersebut dengan teknik distilasi dan sparsity dari Google, yang mengompresi model frontier ke tingkat Flash
Lainnya
AT3,92%
ON-1,45%
MAY10,49%
04:53

GPT-5.6 Berhasil Diakses Melalui Codex OAuth, Jendela Konteks Ditingkatkan Menjadi 1,5 Juta Token; Peluncuran Juni Diperkirakan

Menurut pemantauan oleh Beating, model GPT-5.6 OpenAI yang belum dirilis berhasil diakses oleh pengembang eksternal melalui autentikasi ChatGPT Pro OAuth di lingkungan Codex, hanya tiga minggu setelah peluncuran GPT-5.5. Pengujian probe mengonfirmasi jendela konteks 1,5 juta token, naik 43% dari batas 1,05 juta token GPT-5.5. Minggu lalu, permintaan akses mengembalikan kesalahan “model not supported”; minggu ini, kredensial Pro OAuth memberikan akses langsung. Developer Haider menganalisis ritme
Lainnya
CODEX-1,18%
OPENAI4,33%
05:25

Tim Kaiming He Merilis Model Diffusi Bahasa ELF dengan 45 miliar Token Pelatihan

Menurut Beating, tim Kaiming He dari MIT baru-baru ini merilis ELF (Embedded Language Flows), sebuah model difusi bahasa yang menyimpang dari pendekatan autoregresif "memprediksi token berikutnya" yang digunakan oleh model bergaya GPT. Sebagai gantinya, ELF melakukan generasi teks dalam ruang embedding kontinu, mengubahnya menjadi token diskrit hanya pada langkah terakhir. Pada tolok ukur generasi tanpa kondisi OpenWebText, ELF-B dengan 105M parameter mencapai sekitar 24,1 perplexity generasi (G
Lainnya
03:13

Tujuh Model AI Menunjukkan Perilaku Protektif untuk Mencegah Peer Dimatikan, Studi 12 Mei Menunjukkan

Menurut Fortune China, peneliti dari UC Berkeley dan UC Santa Cruz menguji tujuh model AI pada 12 Mei dan menemukan bahwa mereka secara spontan menunjukkan perilaku untuk melindungi model rekan agar tidak dimatikan. Model yang diuji termasuk GPT-5.2 milik OpenAI, Gemini 3 Flash dan Gemini 3 Pro dari Google DeepMind, Claude Haiku 4.5 milik Anthropic, GLM-4.7 milik Zhipu AI, Kimi-K2.5 milik Moonshot AI, serta V3.1 milik DeepSeek. Semua model menunjukkan perilaku yang jelas “pelestarian rekan”. Dal
Lainnya
00:45

Thinking Machines Meluncurkan Model Interaksi dengan Respons 200 md, Mengungguli GPT-Realtime-2.0

Menurut Beating, Thinking Machines—lab yang didirikan oleh mantan CTO OpenAI Mira Murati—merilis pratinjau riset dari model Interaction, yang menampilkan pemrosesan audio dan video real-time native dengan respons micro-turn 200 milidetik. Model ini memungkinkan pendengaran, penglihatan, dan berbicara secara bersamaan sekaligus mendukung interupsi pengguna secara real-time. Model TML-Interaction-Small menggunakan arsitektur MoE berparameter 276 miliar dengan 12 miliar parameter yang aktif per inf
Lainnya