Hiện nay giới trẻ đang truyền tay nhau trend chuyển thể từ ảnh sang video độc đáo. Cụ thể, đây là phần mềm có thể biến một bức ảnh chân dung thành một video biết nói biết cười biết hát. Điều đặc biệt là mọi hoạt động cử chỉ của video đều giống hoạt động thực của người đó ngoài đời. Không chỉ vậy, nó còn mang lại rất nhiều tiếng cười cho mọi người. Tuy nhiên, bên cạnh những lợi ích đó nó vẫn tồn tại những điều tiêu cực. Phần mềm còn được gọi là speaking Portrait, hãy cùng chúng tôi tìm hiểu rõ hơn về phần mềm này nhé.
Speaking Portrait biến ảnh thành video
Ứng dụng Speaking Portrait có thể làm cho các bức ảnh chuyển động và nói chuyện. Nó dựa trên một đoạn video nguồn. Đầu năm nay, nhà phát triển D-ID gây xôn xao với Deep Nostalgia – giúp những bức ảnh thời xưa biết “động đậy” trong giây lát. Tại sự kiện TechCrunch Disrupt cuối tháng 9, công ty có trụ sở tại Israel đã giới thiệu thế hệ công nghệ tiếp theo của Deep Nostalgia, mang tên Speaking Portrait. Ứng dụng mới có khả năng biến ảnh tĩnh thành video chuyển động và nói bất cứ điều gì người dùng muốn.
Speaking Portrait có 2 phiên bản
Phiên bản Single Portrait
Speaking Portrait có hai phiên bản. Đầu tiên là Single Portrait giúp chuyển một bức ảnh thành video dạng chân dung biết nói. Tuy nhiên, chuyển động của phiên bản này chỉ giới hạn ở phần đầu. Bất kỳ thứ gì khác trong nền vẫn ở trạng thái tĩnh. Do đó khả năng sử dụng vào mục đích giả mạo khá thấp.
Phiên bản Trained Character
Bản nâng cao hơn là Trained Character. Ngoài một bức ảnh, phần mềm yêu cầu thêm một video dài 10 phút quay lại một nhóm chuyển động cụ thể cùng giọng nói thông qua một đoạn thoại được chuẩn bị sẵn. Kết quả là phiên bản này trông thực hơn nhiều so với Single Portrait. Nhờ vào khả năng xác định vật thể trong nền và tạo ra chuyển động cơ thể của người. Bao gồm cả cánh tay và bàn tay của họ.
Speaking Portrait rất có tiềm năng trong tương lai
Tính năng làm ảnh tĩnh động đậy trên Deep Nostalgia giống như một công cụ quảng cáo. Nó thu hút người dùng đến với trang web bảo tồn phả hệ MyHeritage. Trong khi đó, Speaking Portrait có tiềm năng hơn nhiều. Nó không chỉ dành cho những ai muốn xây dựng nhân vật ảo thuyết trình chuyên nghiệp bằng nhiều thứ tiếng trong các cuộc họp trực tuyến. Công nghệ này còn đảm bảo cho các hãng thông tấn luôn có người dẫn chương trình trực tiếp. Với mục đích cập nhật tin tức nóng hổi, ngay cả vào nửa đêm.
Đây là xu hướng ứng dụng đang được nhiều công ty AI theo đuổi với mục tiêu làm cho các bộ phim nước ngoài được lồng tiếng trông tự nhiên hơn, bằng cách đảm bảo chuyển động miệng và khuôn mặt khớp với lời thoại.
Dù vẫn còn nhiều lý do để lo ngại rằng deepfake có thể bị sử dụng vào mục đích giả mạo, công nghệ này hiện đã đạt đến một trình độ mới và trở nên dễ sử dụng hơn, đồng thời cho thấy nhiều lợi ích tiềm năng nếu được sử dụng đúng cách.
Mặt trái của Deepfake
Với công nghệ ngày càng tinh vi, Deepfake ngày càng khó phát hiện. Nó có thể được sử dụng cho nhiều loại tội phạm. Điều này khiến chúng trở nên nguy hiểm hơn. Deepfake có thể được sử dụng cho nhiều loại tội phạm khác nhau. Chẳng hạn như làm mất uy tín của một cá nhân nào đó. Sẽ ra sao khi các phần mềm Deepfake lan tràn trên mạng, một ai đó có thể tạo video khiêu dâm về bạn rồi đăng lên Facebook? Dù chỉ là một hành động trêu đùa với mục đích trêu chọc. Tuy nhiên, khi đã xuất hiện trên mạng, không có cách gì để kiểm soát sự phát tán đoạn video này và những hệ lụy sau đó.
Mặc dù việc làm giả hình ảnh và video đã được thực hiện ngay cả trước khi có sự xuất hiện của phần mềm chỉnh sửa video và các chương trình chỉnh sửa hình ảnh. Nhưng với trường hợp của Deepfake lại khác – chủ nghĩa hiện thực mới và thật sự nguy hiểm.