金十数据7月4日讯,商汤发布首个“可控”人物ビデオ生成大模型Vimi,该模型主要面向C端用户,支持チャット、歌唱、踊るなど多様なエンターテイメントインタラクティブシーン。商汤方面称、Vimiは1分間の単一ショット人物ビデオを生成でき、時間の経過に伴って画面劣化や歪みは発生せず、商汤の日日新大模型に基づいており、任意のスタイルの写真から対象のアクションに一致した人物ビデオを生成することが可能であり、既存の人物ビデオ、アニメーション、音声、テキストなど多様な要素を活用できる。
商汤は初の「制御可能な」人物ビデオ生成大モデルVimiをリリース
金十数据7月4日讯,商汤发布首个“可控”人物ビデオ生成大模型Vimi,该模型主要面向C端用户,支持チャット、歌唱、踊るなど多様なエンターテイメントインタラクティブシーン。商汤方面称、Vimiは1分間の単一ショット人物ビデオを生成でき、時間の経過に伴って画面劣化や歪みは発生せず、商汤の日日新大模型に基づいており、任意のスタイルの写真から対象のアクションに一致した人物ビデオを生成することが可能であり、既存の人物ビデオ、アニメーション、音声、テキストなど多様な要素を活用できる。