OpenAI Truy Vết Vấn Đề “Goblin” Tới Tín Hiệu Phần Thưởng Nhân Cách “Nerdy”, Các Nhắc Đến “Goblin” Tăng 175% Trong GPT-5.1

Theo OpenAI, công ty đã xác định nguyên nhân gốc rễ của “vấn đề goblin” đã ảnh hưởng đến các mô hình GPT từ GPT-5.1 trở đi. Tín hiệu phần thưởng được dùng để củng cố đặc điểm tính cách “Nerdy” đã khuyến khích các đầu ra có nhắc đến các sinh vật thuộc thế giới giả tưởng, trong đó 76,2% tập dữ liệu huấn luyện thể hiện sự thiên lệch này. Tính cách Nerdy chỉ chiếm 2,5% phản hồi của ChatGPT nhưng lại đóng góp 66,7% các lần nhắc tới “goblin”, và số lần xuất hiện đã tăng vọt 3.881% từ GPT-5.2 lên GPT-5.4.

OpenAI đã loại bỏ tính cách Nerdy vào tháng 3, loại bỏ tín hiệu phần thưởng gây thiên lệch và lọc dữ liệu huấn luyện. Công ty cũng bổ sung các chỉ dẫn ức chế vào prompt dành cho nhà phát triển của GPT-5.5 trong Codex. Cuộc điều tra đã dẫn đến việc phát triển các công cụ kiểm toán hành vi mới cho mô hình.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận