article detail

Deepfake chính mình với công cụ trò chuyện video NVIDIA Maxine

TPB1209
3 năm trước
Cập nhật 3 năm trước
Maxine sẽ xử lý cuộc gọi trên đám mây bằng cách sử dụng GPU của Nvidia để tăng chất lượng cuộc gọi với sự trợ giúp của trí tuệ nhân tạo.

Nvidia mới đây công bố một nền tảng hội nghị truyền hình mới cho các nhà phát triển có tên Nvidia Maxine mà họ nói rằng có thể khắc phục hầu hết các bất cập phổ biến nhất trong một cuộc gọi video.



Maxine sẽ xử lý cuộc gọi trên đám mây bằng cách sử dụng GPU của Nvidia để tăng chất lượng cuộc gọi với sự trợ giúp của trí tuệ nhân tạo. Hiểu đơn giản Maxine sẽ thiết kế lại khuôn mặt của người gọi giúp cho khuôn mặt của họ luôn thẳng chính giữa màn hình, ngoài ra nó sẽ không truyền tải mọi pixel từ đầu này sang đầu kia mà chỉ truyền đi một số thành phần nhất định phần còn lại là việc của AI sẽ tái tạo lại khuôn mặt của người gọi ở đầu bên kia. Điều này làm giảm đi đáng kể băng thông internet phải truyền đi. Các tính năng khác có sẵn trong Maxine bao gồm chiếu sáng lại khuôn mặt, phiên âm theo thời gian thực cũng như hình hoạt họa AR dựa trên khuôn mặt người gọi giống như tính năng trên Animoji trên Iphone.


Tất nhiên, không phải tất cả các tính năng này đều mới. Tính năng nén video và phiên âm theo thời gian thực đã phổ biến ở Microsoft và Apple khi đã giới thiệu tính năng căn chỉnh ánh nhìn trong Surface Pro X và FaceTime để đảm bảo mọi người giữ giao tiếp bằng mắt trong cuộc gọi điện video.



Nhưng Nvidia chắc chắn sức ảnh hưởng của mình trong lĩnh vực điện toán đám mây và công việc nghiên cứu và phát triển AI của mình sẽ giúp họ vượt lên trên các đối thủ cạnh tranh. Tuy nhiên, phải thử nghiệm thực tế để xem liệu có bất kỳ công ty hay một hội nghị truyền hình nào thực sự cảm thấy công nghệ của Nvidia có hiệu quả vượt bậc hơn so với công nghệ hiện tại không thì còn phải chờ thêm thời gian. Maxine không phải là một nền tảng dành cho người tiêu dùng mà là một bộ công cụ để các công ty bên thứ ba cải thiện phần mềm của riêng họ. 



Tổng giám đốc truyền thông và giải trí của Nvidia - Kerris cho biết: “Tất cả chúng ta đều đã trải qua những thời điểm mà băng thông bị giới hạn vì nhiều lý do. Nếu chúng tôi áp dụng AI cho vấn đề này, chúng tôi có thể tái tạo lại các cảnh ở cả hai đầu và chỉ truyền những gì cần truyền, và do đó làm giảm đáng kể băng thông cần truyền tải.”



Nvidia cho biết tính năng nén của họ sử dụng phương pháp AI là kỹ thuật tương tự được sử dụng trong deepfakes. Công ty cho biết trong một bài đăng trên blog: “Thay vì phát trực tuyến toàn bộ pixel, phần mềm AI sẽ phân tích các điểm chính trên khuôn mặt của mỗi người trong một cuộc gọi và sau đó tái tạo hình ảnh khuôn mặt trong video ở phía bên kia một cách thông minh. Điều này giúp bạn có thể phát trực tuyến video với ít dữ liệu truyền qua lại trên internet hơn.”


Như vậy, có thể thấy đây sẽ là một công nghệ của tương lai khi mà chúng ta sẽ tiết kiệm được rất nhiều băng thông internet cho việc gọi điện trực tuyến - ứng dụng mà đang rất thịnh hành trong thời điểm hiện tại cũng như trong tương lai. Điều này làm giảm đi rất nhiều tài nguyên cần có so với công nghệ cũ và dành băng thông cho những ứng dụng khác hiệu quả hơn. Ngoài ra về chất lượng hình ảnh khi sử dụng công nghệ này cũng được cải thiện hơn nhiều, đem lại trải nghiệm hình ảnh và âm thanh mượt mà và sắc nét hơn trong thời gian tới.

Thảo luận
Tham gia thảo luận văn minh cùng anh em ThinkView
Đăng nhập