Xuất hiện thuật toán AI mới có thể tạo mô hình 3D từ ảnh 2D chỉ trong 5 giây
Việc tạo ra mô hình 3D đã được tiết giảm đáng kể thời gian với thuật toán AI mới.
Theo TechSpot, bằng cách sử dụng tập dữ liệu lớn để đào tạo thuật toán học máy, các nhà nghiên cứu từ Adobe và Đại học Quốc gia Úc đã cho ra đời một công nghệ có thể làm nên điều kỳ diệu trong việc tạo mô hình 3D. Thứ này được gọi là Mô hình tái tạo lớn (Large Reconstruction Model - LRM), các nhà nghiên cứu cho biết đây là sản phẩm đầu tiên trong ngành có khả năng dự đoán hình dạng của mô hình 3D từ một hình ảnh 2D, đáng chú ý, quá trình này chỉ mất vỏn vẹn 5 giây.
Các nhà nghiên cứu giải thích rằng các mô hình 3D trước đây đã được đào tạo trên các bộ dữ liệu quy mô nhỏ tập trung vào một danh mục hình ảnh duy nhất. Ngược lại, mô hình LRM của họ có kiến trúc dựa trên bộ chuyển đổi có khả năng mở rộng với 500 triệu tham số và đã được đào tạo trên khoảng 1 triệu đối tượng 3D có sẵn trong bộ dữ liệu Objaverse và MVImgNet.
Mô hình 3D được tạo ra chỉ từ một hình ảnh 2D.
Các nhà nghiên cứu giải thích, sự kết hợp giữa mô hình dung lượng cao và dữ liệu đào tạo quy mô lớn này cung cấp cho thuật toán LRM khả năng tạo ra các bản tái tạo 3D chất lượng cao, trong đó có cả từ hình ảnh thực tế. Hơn nữa, LRM có thể lấy cả hình ảnh thông thường và các hình ảnh được tạo bởi các dịch vụ AI như DALL-E và Stable Diffusion làm mô hình 2D đầu vào.
Theo tác giả chính Yicong Hong của nghiên cứu, LRM là một bước đột phá lớn trong việc tái tạo mô hình 3D từ một hình ảnh. Thuật toán AI này có thể tạo ra các mô hình học chi tiết từ video hoặc hình ảnh, thậm chí giữ nguyên các kết cấu phức tạp như vân gỗ. Bạn đọc quan tâm có thể tham khảo những sáng tạo 3D ấn tượng của LRM tại đây.
Các nhà nghiên cứu cho biết LRM có tiềm năng lớn để được sử dụng trong nhiều ngành công nghiệp bao gồm thiết kế, giải trí và chơi game. Gần đây, đã có một số công ty AI gấp rút cung cấp các giải pháp tiềm năng liên quan đến việc sáng tạo nội dung 3D, điển hình là dịch vụ Stable 3D của Stability AI.
LRM thậm chí còn có thể được phổ biến rộng rãi hơn nữa đến với người dùng thông thường, chỉ với những bức ảnh được chụp bằng điện thoại họ có thể tạo ra những mô hình 3D ấn tượng. Mặc dù còn đối mặt với nhiều thách thức, nhưng LRM đang mở ra một thế giới đầy cơ hội cho việc sáng tạo và thương mại.
Nguồn: [Link nguồn]
Đại sứ bán hàng Diễm Hằng AI có nhiều phiên bản buồn, vui, nhí nhảnh,…