Kết quả tìm kiếm cho "VOICE"
Hôm nay
01:50

OpenClaw v2026.5.22 Giảm Độ Trễ Danh Sách Model từ 20 Giây Xuống 5ms, Bổ Sung Ghi Chú Họp Giọng Nói Discord

Theo dõi của Beating cho biết, dự án trợ lý AI mã nguồn mở OpenClaw đã phát hành phiên bản v2026.5.22 vào ngày 22/5, với các cập nhật lớn về hiệu năng cổng (gateway) và hỗ trợ plugin. Phiên bản mới đã giảm độ trễ phản hồi API danh sách mô hình từ khoảng 20 giây xuống 5 mili giây bằng cách làm nóng trước trạng thái xác thực của nhà cung cấp dịch vụ khi khởi động gateway, đạt mức cải thiện hiệu năng xấp xỉ 4.100 lần. Bản phát hành giới thiệu plugin ghi chú kênh thoại Discord độc lập, cho phép ngườ
Xem thêm
07:28

ChatGPT của OpenAI mở khóa tính năng điền form bằng AI vào ngày 23 tháng 5

Theo Guru Club, vào ngày 23/5, OpenAI đã công bố rằng ChatGPT hiện có thể tự động điền biểu mẫu sau khi người dùng tải lên tài liệu và cung cấp mô tả qua giọng nói hoặc văn bản. Hệ thống sẽ nhận diện các ô trường trong biểu mẫu và tự động hoàn tất thông tin dựa trên dữ liệu người dùng cung cấp. Trong phần trình diễn, một người dùng đã tải lên mẫu đăng ký hội viên thể dục và cung cấp bằng giọng nói các thông tin như tên, địa chỉ và mục tiêu luyện tập; ChatGPT đã nhận diện tất cả các ô và tự động
Xem thêm
06:13

OpenClaw v2026.5.20 tái cấu trúc quyền ủy quyền thực thi, bổ sung tích hợp giọng nói Discord

Theo Beating, tác nhân lập trình terminal mã nguồn mở OpenClaw đã phát hành v2026.5.20 với cơ chế ủy quyền thực thi được tái cấu trúc và tích hợp sâu giọng nói thời gian thực với Discord. Phiên bản mới đã loại bỏ các allowlist thực thi kế thừa và nâng cấp bảo mật để yêu cầu tải tệp Skill đã được xác minh thông qua các công cụ chuyên dụng, đồng thời chặn các lỗ hổng thực thi script không theo chuẩn. Các phiên giọng nói trên Discord hiện hỗ trợ chức năng theo dõi người dùng động, cho phép AI thông
Xem thêm
15:56

Khởi nghiệp AI Hark Hoàn tất $700M Series A với $6B định giá, do Parkway Venture Capital dẫn dắt vào ngày 21 tháng 5

Theo PANews, startup AI Hark đã hoàn tất vòng gọi vốn Series A trị giá 700 triệu USD vào ngày 21/5, với định giá hậu tiền là 6 tỷ USD. Parkway Venture Capital dẫn đầu vòng này, cùng tham gia có NVIDIA, AMD Ventures, Intel Capital, ARK Invest và các nhà đầu tư chiến lược khác. Hark dự định mở rộng hạ tầng GPU, đẩy nhanh nghiên cứu các mô hình ngôn ngữ lớn, mở rộng đội ngũ từ khoảng 70 lên 200 kỹ sư và phát triển phần cứng AI thế hệ tiếp theo cho một hệ thống AI cá nhân có tương tác bằng giọng nói
Xem thêm
11:37

Tencent ra mắt tính năng AI diễn giải cuộc họp với độ trễ 3 giây, hỗ trợ tạo giọng nói bản sao

Theo Beating, Tencent Meeting đã chính thức ra mắt tính năng diễn giải AI của mình hôm nay, nén độ trễ xuống trong vòng 3 giây và hỗ trợ dịch song ngữ Anh–Trung. Hệ thống triển khai cơ chế dịch theo thời gian thực, cho phép diễn giải gần như đồng thời và dạng giọng nói. Tính năng này bao gồm tùy chọn nhân bản giọng nói, mô phỏng đặc trưng giọng của người nói, giúp người phiên dịch nghe như đúng người nói ban đầu và giúp người tham dự phân biệt giữa nhiều người tham gia. Người dùng có thể chuyển
Xem thêm
01:29

OpenClaw Ra mắt v2026.5.18 với giọng nói thời gian thực trên Android, bổ sung hỗ trợ đầy đủ GPT-5

Theo Beating, OpenClaw đã phát hành phiên bản v2026.5.18 vào ngày 18 tháng 5, mang các cuộc trò chuyện bằng giọng nói thời gian thực lên Android và hỗ trợ đầy đủ cho các mô hình GPT-5.1, GPT-5.2, GPT-5.3 và openai-codex. Bản cập nhật trên Android cho phép truyền trực tiếp đầu vào micro kèm phát lại âm thanh thời gian thực, cơ chế liên kết kết quả công cụ để đồng bộ tức thì các lệnh gọi công cụ trong suốt phiên hội thoại bằng giọng nói, cùng phụ đề trực tiếp. Bản phát hành cũng giới thiệu một gia
Xem thêm
10:52

Bloomberg tích hợp chuyển biế́n giọng nói vào Vault, hỗ trợ hơn 50 ngôn ngữ để giám sát tuân thủ

Bloomberg đã tích hợp công cụ chuyển giọng nói thành văn bản BSpeech của mình vào Bloomberg Vault, mở rộng năng lực giám sát tuân thủ của nền tảng để tự động chuyển đổi các cuộc liên lạc thoại đã ghi thành bản ghi có thể tìm kiếm trên hơn 50 ngôn ngữ. Việc tích hợp cho phép các nhóm tuân thủ phân tích các cuộc trò chuyện bằng giọng nói thông qua các luồng công việc tương tự như những gì được áp dụng cho email và hội thoại chat, nhằm đáp ứng áp lực pháp lý ngày càng tăng lên các tổ chức tài chính
Xem thêm
06:29

Resemble AI Phát hành DramaBox, mô hình tạo lời thoại có thể kiểm soát cấp độ giám đốc, trên Hugging Face hôm nay

Theo Beating, Resemble AI đã phát hành DramaBox, một mô hình tạo lời thoại, trên Hugging Face vào hôm nay. Mô hình có khả năng kiểm soát cấp độ đạo diễn thông qua cú pháp prompt tách riêng—người dùng nhập thoại trong dấu ngoặc kép, đồng thời chỉ định các chỉ dẫn sân khấu như thở dài, ngắt quãng hoặc thì thầm nằm ngoài dấu ngoặc kép. Mô hình chuyển các chỉ dẫn này thành lời thoại có sắc thái cảm xúc thay vì đọc chúng thành tiếng. DramaBox hỗ trợ tạo giọng nói theo yêu cầu từ đầu (zero-shot voice
Xem thêm
ON-4,53%
PROMPT-3,7%
IN-13,64%
11:24

Tổn thất lừa đảo của Vương quốc Anh đạt 629,3 triệu bảng Anh trong nửa đầu năm 2025, tăng 17% khi AI thúc đẩy các vụ lừa đảo

Theo UK Finance, tổn thất do gian lận trong hệ thống ngân hàng tại Anh đã tăng vọt lên 629,3 triệu bảng Anh trong nửa đầu năm 2025, với số vụ việc được xác nhận tăng 17% so với cùng kỳ năm trước lên 2,09 triệu. Tổn thất từ gian lận authorized push payment tăng 12% lên 257,5 triệu bảng Anh, trong khi các vụ lừa đảo đầu tư nhảy 55% lên 97,7 triệu bảng Anh. Tổn thất từ lừa đảo hẹn hò cũng tăng 35% trong giai đoạn này, với dữ liệu của City of London Police cho thấy đã có hơn 102 triệu bảng Anh bị mấ
Xem thêm