AI bắt đầu truyền linh hồn vào con người kỹ thuật số

Tác giả: Freddie

Hỗ trợ dữ liệu: dữ liệu lớn Pythagore (

Nguồn: Gelonghui

Nguồn hình ảnh: Được tạo bởi công cụ Unbounded AI

Vài ngày trở lại đây, các "ca sĩ chưa nổi tiếng" trong nước lại nổi đình nổi đám với những bản cover bằng AI.

Cư dân mạng ở Station B đã sử dụng mô hình AI để tạo ra bản sao AI của ca sĩ Stefanie Sun, bản sao này thực sự giống với "Lin Chiling" và "Guo Degang" trên điều hướng ô tô. Lấy âm thanh của chính ca sĩ để đào tạo và tạo ra "Sun Yanzi" với cùng một âm sắc.

Sau đó, mong muốn để thần tượng hát những bài hát yêu thích của họ đã được thực hiện theo một cách kỳ lạ như vậy.

Nguồn: Trạm B

Trò chơi ở nước ngoài thậm chí còn thái quá hơn.

Một nữ nhân vật nổi tiếng trên Internet 23 tuổi ở Hoa Kỳ với 1,8 triệu người hâm mộ đã sao chép bản sao AI của cô ấy bằng GPT-4, sau đó đem lòng yêu hơn 1.000 cư dân mạng cùng lúc, tính phí 1 đô la mỗi phút.

Chỉ trong một tuần, cô đã kiếm được 71.600 USD.

**Và còn hơn thế nữa, hiện tại số lượng "bạn trai" của cô vẫn đang tăng chóng mặt, đã lên đến gần 10.000 người và họ đã xếp hàng chờ được "yêu" cô suốt 96 tiếng đồng hồ . **

Một số nhà phân tích cho rằng theo xu hướng, cô ấy kiếm được 5 triệu đô la Mỹ mỗi tháng không khó, nếu không phải hạn chế về kỹ thuật, số tiền cô ấy kiếm được có thể là một con số thiên văn.

Những hiện tượng này đã có thể chứng minh đầy đủ rằng một kỷ nguyên của cổ tức công nghệ mới do AI+ mang lại đang nhanh chóng đến gần.

01Đội quân kỹ thuật số tràn vào phòng phát sóng trực tiếp

Giao hàng trực tiếp với hàng hóa là kịch bản tiềm năng nhất để hiện thực hóa IP ảo.

Việc sử dụng các công cụ như mạng xã hội, video và mua sắm trực tuyến của thế hệ Z vượt xa mức trung bình của toàn mạng. Lối chơi mới kết hợp giữa con người kỹ thuật số và không gian ảo đã mang lại cho họ cảm giác trải nghiệm và tương tác. người hâm mộ IP ảo là nhóm trẻ từ 18-24 tuổi.

Xu hướng này cho phép các thương hiệu nhìn thấy cơ hội làm cho sản phẩm đột phá.

Vào năm 2020, các ca sĩ ảo Luo Tianyi và Le Zhengling sẽ đến phòng phát sóng trực tiếp của Taobao để mang hàng hóa cho Bausch & Lomb, Midea, L'Occitane và các thương hiệu khác. Số lượng người xem chương trình phát sóng trực tiếp này lên tới 2,7 triệu người và gần 2 triệu người đã trao phần thưởng và tương tác.

Điều này đã gây ra một cuộc thảo luận lớn vào thời điểm đó và thời đại phát sóng trực tiếp của **con người kỹ thuật số ảo đã đến. **

Và với sự bùng nổ của các mô hình quy mô lớn bằng trí tuệ nhân tạo do chatGPT khởi xướng trong năm nay, lĩnh vực con người kỹ thuật số ảo đã mở ra một đợt bùng nổ khác hoành tráng hơn.

Một số lượng lớn người kỹ thuật số ảo bắt đầu chen chúc vào phòng phát sóng trực tiếp.

Vào tháng 4 năm nay, con người kỹ thuật số ảo "朏朏" của Tianyu Digital đã hoàn thành việc truy cập mô hình ChatGPT và hoàn thành buổi ra mắt phát sóng trực tiếp. Nó không chỉ có thể trả lời các câu hỏi của khách hàng trong thời gian thực mà còn có thể trả lời các câu hỏi khác nhau một cách độc lập.

Nguồn: Douyin

Trong đoạn video ngắn, có rất nhiều cảnh như thế này: Toàn bộ văn phòng của một công ty không có người, chỉ có dãy bàn với hàng chục người đẹp AI trên màn hình máy tính đang phát sóng trực tiếp....

Nguồn: video ngắn

Công ty này có thể phát sóng trực tiếp trong một ngày chỉ bằng cách dựa vào hình đại diện 2D siêu chân thực, kịch bản và bối cảnh được chuẩn bị trước. được sao chép với chi phí cực thấp, chiến thắng nằm ở chiến thắng về số lượng và thực sự nằm xuống và để AI kiếm tiền không phải là điều không thể. **

Tất cả những điều này cho thấy một cuộc cách mạng về hiệu quả nội dung dựa trên “AI+” đang bùng nổ trong lĩnh vực con người kỹ thuật số.

Con người kỹ thuật số ảo được chia thành nhiều loại theo công nghệ sản xuất, kịch bản ứng dụng và đặc điểm hình ảnh.

Khác với các thần tượng nổi tiếng 3D, hầu hết những người kỹ thuật số thực tế 2D nói chuyện trong phòng phát sóng trực tiếp đều dựa trên các nguyên mẫu ngoài đời thực, giọng nói và biểu cảm của họ được tái tạo theo Soul IP.

Một neo ảo có thể thực hiện công việc phát sóng trực tiếp 7*24, theo cuộc gọi mà không phải lo lắng về vấn đề đảo lộn cài đặt của con người, giúp giảm chi phí lao động trong các hoạt động phát sóng trực tiếp.

Đằng sau điều này, AIGC đang định hình lại quy trình sản xuất con người kỹ thuật số.

Việc sản xuất con người kỹ thuật số 2D sử dụng học sâu. Nó chỉ cần xác định thiết kế hình ảnh. Sau khi dữ liệu đồ họa và âm thanh được thu thập và xử lý trước, chúng sẽ được tải lên mô hình để đào tạo. So với 3D, phương thức sản xuất đơn giản và nhiều hơn tiêu chuẩn hóa, và hiệu quả sản xuất liên tục được cải thiện.

Phương pháp dây chuyền lắp ráp nhà máy này đã rút ngắn đáng kể ngưỡng sản xuất, chi phí và chu kỳ của con người kỹ thuật số.

**Đồng thời, với sự lặp lại công nghệ và giảm chi phí ở khâu sản xuất cuối cùng của ngành, các giải pháp nhân sự kỹ thuật số cho các khách hàng nhỏ cũng đã bắt đầu xuất hiện. **

Vào tháng 4, Tencent Cloud đã phát hành nền tảng sản xuất con người kỹ thuật số. Các avatar kỹ thuật số cần tạo ra hình ảnh đời thực có thể mua dịch vụ trên nền tảng. Chỉ cần tải lên hình ảnh, âm thanh và video để thực hiện tùy chỉnh và tính phí theo các âm sắc và thời lượng video khác nhau.

Ngoài việc tạo ra con người kỹ thuật số, nó còn có thể cung cấp một bộ giải pháp phát sóng trực tiếp hoàn chỉnh cho con người kỹ thuật số. Các chức năng bao gồm âm thanh người thật tiếp quản phòng phát sóng trực tiếp và nhận phản hồi thông minh cho nhận xét của người dùng. Giá chỉ cần một nghìn nhân dân tệ .

**Và một số nhà điều hành kênh thậm chí còn bán các neo AI theo gói với giá dưới 200 nhân dân tệ. **

Hầu hết những hình ảnh neo này đều đến từ sự ủy quyền của các công ty người mẫu, mặc dù chất lượng phát sóng còn thô nhưng rõ ràng có dấu vết bị cắt, giọng nói không có đặc điểm.

Nhưng đối với các doanh nghiệp vừa và nhỏ bình thường, không có V lớn để mang hàng hóa và họ không đủ khả năng chi hàng triệu đô la để tùy chỉnh IP cao cấp, nếu họ muốn giảm chi phí vận hành và bắt đầu sản lượng nhanh chóng, vài nghìn nhân dân tệ kỹ thuật số là đủ.

Studio con người kỹ thuật số, Siji

Nếu doanh nghiệp muốn tự sửa đổi mã và tạo ra những con người kỹ thuật số khác nhau, thì doanh nghiệp đó cũng có thể mua mã nguồn từ nhà cung cấp công nghệ.

Nhưng câu chuyện về con người kỹ thuật số AI vẫn chưa kết thúc.

02 Linh hồn truyền AI

Trong báo cáo "Phân tích cơ hội và tình trạng thị trường con người kỹ thuật số AI của Trung Quốc", IDC chia con người kỹ thuật số thành 5 cấp độ. Hiện tại, sự phát triển của con người kỹ thuật số đã trải qua các giai đoạn từ sản xuất thủ công đến mô hình hóa AI. Ban đầu họ có hình dáng con người, nhưng họ chỉ có thể thực hiện việc ra quyết định tương tác đơn giản.

Khi mức độ thông minh đạt đến L4 và L5, con người kỹ thuật số do AI điều khiển có thể đảm nhận hầu hết các quyết định về bối cảnh và hỗ trợ nhiều phương thức tương tác thời gian thực hơn, tương tự như quản gia AI cá nhân của Iron Man "Jarvis".

**Sự phát triển của con người kỹ thuật số ảo trong 30 năm qua, sự phát triển công nghệ và nhu cầu thị trường về cơ bản phát triển xoay quanh hai điểm, một là hiệu ứng hình ảnh; hai là trải nghiệm tương tác. **

Con người kỹ thuật số ảo lần đầu tiên xuất hiện trong trò chơi, hoạt hình và phim ảnh, lặp lại mối liên hệ cảm xúc với những thứ thời thượng và sự mở rộng giá trị IP.

IP kiểu nhân vật ban đầu được vẽ bằng tay và các hành động phải được vẽ từng cái một. Năm 1982, Hayashi Minmi, nữ anh hùng trong phim hoạt hình Nhật Bản "Macros", trở thành ca sĩ ảo đầu tiên phát hành album nhạc.

Ca sĩ thế hệ đầu tiên Lin Mingmei

Trong phim, hình ảnh có thể được mô phỏng bằng máy tính, nhưng hành động phải được thực hiện bởi con người, công nghệ CG và ghi lại chuyển động và các công nghệ khác đang dần trở nên phổ biến, dựa vào phông xanh và thiết bị chụp, diễn viên có thể nhập vai bất kỳ.

Sau một thiên niên kỷ, từ "Chúa tể của những chiếc nhẫn" năm 2002 đến "Avatar 2" năm ngoái, hiệu ứng tạo hình của các nhân vật đều rất tỉ mỉ, mang lại sự tiện lợi lớn cho sáng tạo nghệ thuật.

Hình ảnh 'Gollum' của Chúa tể những chiếc nhẫn do người thật chụp

Cho đến nay, sự phát triển của công nghệ con người kỹ thuật số đã từng bước tiến đến giới hạn giống "con người" hơn, không chỉ đòi hỏi ngoại hình và hiệu ứng hình ảnh trên quần áo phải gần với thực tế mà còn bao gồm cả việc lái xe (trình bày thực và các biểu cảm và chuyển động tinh tế) và kết xuất (làm cho Hình ảnh chi tiết hơn và theo thời gian thực).

Tuy nhiên, tôi vẫn cảm thấy như thiếu một cái gì đó.

Năm 1970, Masahiro Mori, một chuyên gia về robot người Nhật Bản đã đưa ra giả thuyết về "Thung lũng kỳ lạ", do robot có ngoại hình và hành động giống con người nên con người sẽ có những cảm xúc tích cực đối với robot.

Khi robot và con người đạt đến một mức độ tương đồng nhất định, ngay cả sự khác biệt nhỏ nhất cũng sẽ được phóng đại và mang lại sự tiêu cực và oán giận. Và khi sự tương đồng giữa robot và con người tiếp tục tăng lên, con người sẽ quay trở lại với những cảm xúc tích cực về chúng.

Khác với phim, các kịch bản ứng dụng có thuộc tính xã hội mạnh hơn có yêu cầu cao hơn đối với tương tác thời gian thực của con người kỹ thuật số và không chỉ hài lòng với việc tạo ra một "chiếc bình" đẹp mắt.

**Về mặt tương tác, các mô hình ngôn ngữ tự nhiên lấp đầy khoảng trống. **

GPT, có khả năng tạo văn bản khiến mọi người kinh ngạc, đã thêm hai thanh vào "IQ" của con người kỹ thuật số.

Mô hình NLP lớn là nền tảng kỹ thuật của con người ảo do AI điều khiển. Nói một cách đơn giản, nó cho phép con người kỹ thuật số ảo nói một cách hùng hồn, giảm chi phí sản xuất nội dung được tiêu chuẩn hóa và được đào tạo để đóng các vai trò như dịch vụ khách hàng thông minh, người điều hành và hướng dẫn viên du lịch. Về lâu dài, với việc cải thiện khả năng cá nhân hóa và thấu hiểu cảm xúc, việc cung cấp sự đồng hành và chăm sóc cho người già và trở thành "giáo viên cá nhân" cho trẻ em cũng sẽ được hiện thực hóa.

Ngoài ra, chuyển động của miệng cũng có thể được điều khiển bởi AI để thiết lập mối quan hệ ánh xạ với văn bản. Khi mức độ chân thực tăng lên, các biểu cảm vi mô sẽ trở nên phong phú hơn. Khi nói, các biểu cảm và cử động miệng có thể khớp với nhau. "Giống như con người về hình thức" và "giống con người về tinh thần".

Tân Hoa Xã: Phi hành gia kỹ thuật số đầu tiên trên thế giới: Xiao Zheng

Midjourney là một sản phẩm bùng nổ dựa trên mô hình khuếch tán, được phát hành vào tháng 7 năm ngoái, đào tạo AI vẽ tranh thông qua hướng dẫn nhập văn bản.

Một cặp đôi, minh họa bởi Midjourney

** Một số tổ chức đã tính toán rằng doanh thu hàng năm hiện tại của nó đã đạt quy mô 100 triệu đô la Mỹ. **

Có một cao thủ của trạm B đã sử dụng Midjourney để khôi phục hình ảnh chân thực của bà, từ ngoại hình, đường nét lão hóa và mái tóc bạc trắng đầy chi tiết, cộng với âm thanh trong quá khứ để tái tạo giọng nói của bà, cuối cùng tạo ra hình ảnh của bà thông qua Nhân đôi kỹ thuật số D-ID.

Để bù đắp cho chút tiếc nuối khi không nói lời tạm biệt với bà, người cháu bắt đầu đối thoại với "bà" kỹ thuật số trước mặt, và "bà" đã đáp lại một cách thân tình, đây thực chất là tài liệu trả lời do ChatGPT cung cấp.

Nguồn: Trạm B

Chính nhờ những nỗ lực ngày càng nhiều này ở phía khách hàng mà đến lượt nó, một lượng lớn tài liệu đào tạo liên tục được bổ sung vào quá trình "nhân cách hóa" AI, giúp tăng tốc độ phong phú của dữ liệu mô hình AI và cuối cùng cho phép AI đưa linh hồn vào con người kỹ thuật số và mang lại những khả năng lớn hơn.

03 ** Phần kết **

Việc khám phá các hình đại diện ảo đã tiếp tục trong hơn 30 năm. Từ được vẽ bằng tay đến do con người điều khiển, rồi đến do AI điều khiển, sự tiến bộ của trải nghiệm thực tế và tương tác đã mở ra một loạt các kịch bản ứng dụng. .

AIGC giúp số hóa hoàn toàn ngoại hình, giọng nói và các đặc điểm khác của người bình thường, đồng thời ngưỡng sản xuất thấp hơn mở ra không gian tưởng tượng của thị trường.

IDC dự đoán rằng vào năm 2026, quy mô thị trường con người kỹ thuật số AI của Trung Quốc sẽ đạt 10,24 tỷ nhân dân tệ, nhưng trải nghiệm mà nó mang lại cho chúng ta tốt đến mức nào sẽ quyết định số phận cuối cùng của con người kỹ thuật số.

Đồng thời, con người kỹ thuật số AI có tiềm năng là cổng tương tác giữa con người và máy tính thế hệ tiếp theo, trong tương lai chúng ta có thể không còn phải đối mặt với màn hình lạnh lùng mà là những con người kỹ thuật số sống động tham gia.

Có lẽ như cha đỡ đầu của AI đã nói, con người chỉ là một giai đoạn chuyển tiếp trong quá trình tiến hóa của trí thông minh để tạo ra trí thông minh kỹ thuật số, cuối cùng thì chúng ta cũng có một bản sao kỹ thuật số trông giống con người, nói chuyện giống chúng ta và có thể suy nghĩ giống chúng ta trong tương lai. (toàn văn)

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate.io
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)