Apple công bố công nghệ LiTo: Có thể phục hồi toàn bộ các đối tượng 3D từ một hình ảnh duy nhất và duy trì sự nhất quán về ánh sáng và bóng tối

Tin tức Gate News, ngày 17 tháng 3, nhóm nghiên cứu AI của Apple đã công bố bài báo tại ICLR 2026, đề xuất phương pháp tạo hình 3D LiTo (đánh dấu trường ánh sáng bề mặt), có thể tạo ra đối tượng 3D hoàn chỉnh từ một hình ảnh duy nhất, duy trì tính nhất quán của hiệu ứng ánh sáng như phản xạ gương, phản xạ Fresnel khi thay đổi góc nhìn. Trước đây, hầu hết các phương pháp tái tạo 3D chỉ xử lý một trong hai yếu tố hình học hoặc ngoại hình phản xạ khuếch tán, khó có thể tái tạo chi tiết ánh sáng và bóng tối thay đổi theo góc nhìn. LiTo mã hóa đồng bộ hình học và ngoại hình liên quan đến góc nhìn vào cùng một không gian tiềm ẩn 3D, sau đó sử dụng mô hình phù hợp luồng tiềm ẩn để tạo kết quả dựa trên hình ảnh duy nhất. Dữ liệu huấn luyện gồm hàng nghìn đối tượng 3D, mỗi đối tượng được render từ 150 góc nhìn và 3 điều kiện ánh sáng khác nhau, bộ giải mã học cách tái tạo hình học và ngoại hình hoàn chỉnh bằng cách lấy mẫu ngẫu nhiên các mẫu con. Thử nghiệm cho thấy LiTo vượt trội hơn các phương pháp hiện có TRELLIS về chất lượng hình ảnh và khả năng phục hồi từ hình ảnh đầu vào. Bài báo do Jen-Hao Rick Chang, Xiaoming Zhao (đồng tác giả chính), Dorian Chan, Oncel Tuzel viết, đã được công bố trên arXiv.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận