Công cụ AI mới của Alibaba có thể biến một bức ảnh thành... ca sĩ

Sự kiện: Công nghệ AI

Chỉ với một hình ảnh tĩnh và một đoạn âm thanh, công cụ AI EMO có thể tạo ra video nhân vật đang hát siêu chân thực.

Cách đây không lâu, OpenAI đã gây chấn động giới công nghệ khi công bố công cụ AI Sora, với khả năng tạo video chỉ với vài đoạn mô tả bằng văn bản. Sự ấn tượng của Sora được nhấn mạnh bằng những đoạn video có chất lượng chân thực, như thể được tạo ra lên bởi một đội ngũ dựng phim chuyên nghiệp.

Giờ đây, công ty Alibaba cũng vừa gây ra tiếng vang lớn với “EMO (Emote Portrait Alive)”, một dự án trí tuệ nhân tạo (AI) mới có khả năng sáng tạo video không kém cạnh Sora. Theo đó, thay vì sản xuất ra một video bằng mô tả văn bản, EMO sẽ biến một nhân vật có trong hình ảnh tĩnh thành một ca sĩ đang hát trong video, với biểu cảm chân thực đến khó tin.

Mô phỏng về công cụ EMO của Alibaba.

Mô phỏng về công cụ EMO của Alibaba.

Được biết, EMO sử dụng một tập dữ liệu khổng lồ về âm thanh và video để học cách tạo ra các biểu cảm khuôn mặt một cách tự nhiên nhất. Công cụ này sẽ chuyển đổi ảnh tĩnh thành video trong từng khung hình, nhằm đảm bảo chất lượng đầu ra được mượt mà nhất có thể. Đặc biệt, EMO cũng sử dụng hai cơ chế tìm điểm chú ý riêng biệt cho hình ảnh và âm thanh để đảm bảo sự đồng bộ giữa biểu cảm khuôn mặt và lời nói.

Mô hình hoạt động của EMO.

Mô hình hoạt động của EMO.

Tiềm năng lớn của EMO có thể được áp dụng cho các lĩnh vực như giải trí, giáo dục và giao tiếp. Tuy nhiên, công cụ AI này cũng gây ra những lo ngại về mặt đạo đức, chẳng hạn như sử dụng hình ảnh của người khác khi chưa có sự đồng ý, hoặc nghiêm trọng hơn là bị lợi dụng để video giả mạo, gây ảnh hưởng đến danh tiếng của các cá nhân hoặc tổ chức.

Bạn đọc quan tâm có thể tìm hiểu chi tiết về EMO tại trang web: https://humanaigc.github.io/emote-portrait-alive. Những video minh họa do EMO tạo ra với độ chân thực khó tin, từ cử chỉ môi cho đến các biểu cảm:

Nguồn: [Link nguồn]

Các công cụ AI phổ biến ngày nay đang bị lợi dụng cho các chiến dịch tấn công độc hại.

Chia sẻ
Gửi góp ý
Lưu bài Bỏ lưu bài
Theo BẠCH NGÂN ([Tên nguồn])
Công nghệ Xem thêm
Báo lỗi nội dung
GÓP Ý GIAO DIỆN