type
status
date
slug
summary
tags
category
icon
password
My Library
😀
前言: 随着人工智能技术的快速发展,AI视频生成已经成为一个令人兴奋的新领域。从简单的文本到视频转换,到复杂的数字人物创作,AI正在彻底改变我们制作和消费视频内容的方式。本文将全面梳理当前AI视频生成的主要技术方向和实用工具,帮助你快速掌握这个充满创造力的新领域。
 
 

一、三大生成板块

1. 文生视频(text to video)

  • 原理:文字生成第一帧图片,然后变成图生视频
  • 缺点:可控性弱只能玩
 

2. 图生视频(picture to video)

  • 原理:第一帧图片+推导后面的无数帧
  • 进阶:
    • 先AI画一堆分镜 使用工具
    • 相邻两个首尾帧生成一个视频
    • 最后剪辑连起来
    • 全程可以用即梦的视频生成模块里的”故事创作“实现
  • 工具:
    • 国外:Runway gen3.0
    • 国内:快手可灵、字节即梦
 

3.视频生视频(视频转绘)

  • 原理,是图生视频,通过抽帧来实现
  • 应用
    • 低精度的建模视频和绿屏视频生成高精度视频
    • 风格转绘,比如化成像素风
 

二、衍生板块

1. 人物说话(talking head)

  • 原理:唇形同步(Lip sync)
  • 工具:Runway /即梦/通义舞王(这两个效果最好)语音合成搭配fishaudio
    • 即梦还支持用:图片/视频+要说的文字和标准音频/录制好的音频(我直接用fishaudio吸取别人的声音)
 
 
 
 
 

2. 人物跳舞(move)

  • 原理:AI姿势识别:提取舞蹈视频的火柴人模型,然后+图生视频即可。
  • 工具:Viggle AI (效率高,质量一般) 通义舞王(免费、慢,但是质量高)
    • mix模式是在视频背景里跳舞
    • move模式是在照片背景里跳舞
    • multi模式是多人可替换
 

3. 数字人(digital avatar)

  • 原理:通过已知将已知的单一背景或者特定要求视频分成若干段,将这些小段的动作随机组合,+脸部的唇形同步
  • talking head升级版:等于是talking head的Plus版(肢体动作+语音合成+talking head+时长够长)背景换成ppt模式
  • 应用:
    • 不能自定义:D-ID
    • 可以自定义:Heygen、必剪studio(都需要背景颜色单调视频,不然很假)
Heygen还具有翻译视频+字幕+覆盖原语音的功能

4. 特效:用AI做视频特效,2分钟你的Vlog变电影级大片【ai视频喂饭教程】runway进阶用法_哔哩哔哩_bilibili

  • AI场景生成特效+抠出特效放到绿屏里+然后把绿屏覆盖到有人像的视频里(绿幕视频就等于是图片里的透明背景图像,一个意思)
 
 
Relate Posts
批判性思维的四大方法
Lazy loaded image
ChatGPT使用教程的笔记
Lazy loaded image
Suno!AI制作音乐
Lazy loaded image
GPT降智处理办法
Lazy loaded image
AI老照片修复-comfyui工作流
Lazy loaded image
半导体的产业链(含AI)
Lazy loaded image
Perplexity AI搜索引擎的神!
Lazy loaded image
GOAT!Claude 究极Prompt 拥有人类思维链AI P图与海报:即梦web
Loading...
牛 牛
牛 牛
一個熱愛技術和音樂的普通大學生
Latest posts
刀锋
2025-1-20
东北6天5夜旅行攻略 V1.0
2025-1-19
观《请回答1988》有感
2025-1-10
Edge浏览器清理特定网页cookie
2025-1-3
Notion 新手心得(持续更新中~)
2025-1-3
Steam转区简明教程
2025-1-3
Announcement
🎉NiuNiu Blog AI助手版上线啦🎉
-- 点击右侧紫色浮窗使用 ---
👏欢迎反馈体验👏