Baidu Meluncurkan PP-OCRv6 dengan Dukungan 50 Bahasa, Parameter Level 10 Juta Menyamai VLM Skala Miliar

Tim PaddlePaddle milik Baidu baru-baru ini merilis PP-OCRv6, sistem OCR baru yang menawarkan tiga versi: Tiny (1,5 juta parameter), Small (7,7 juta), dan Medium (34,5 juta). Model Medium memberikan peningkatan 4,6% dalam akurasi deteksi dan 5,1% dalam akurasi pengenalan dibandingkan PP-OCRv5, sekaligus mengintegrasikan bahasa Tionghoa, Inggris, Jepang, dan 46 bahasa berbasis alfabet Latin ke dalam satu model terpadu.

Sistem ini menggunakan teknik reparemeterisasi struktural untuk mengurangi beban komputasi sambil meningkatkan akurasi. Di bawah optimasi OpenVINO, versi Medium mencapai hingga 5,2x kecepatan inferensi CPU yang lebih cepat. Menurut tolok ukur resmi, PP-OCRv6 menyamai atau melampaui performa beberapa model visi-bahasa dengan parameter miliaran meski hanya memakai jutaan parameter. Kode tersebut telah diintegrasikan ke proyek open-source PaddleOCR.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar