作为一名热衷于人工智能的科技作者,我的社交媒体充斥着 AI 生成的各类内容——从图像到音频,再到视频。最近,一个趋势引起了我的注意:AI 生成的说话网红视频。这些视频的逼真程度令人惊叹,有时甚至让人感到不安。
以下是这些视频的效果:
虽然这些视频仍存在“奇异谷”效应,显得有些人工痕迹,但不可否认的是,AI 技术在过去几个月中取得了巨大进步。
当 AI 生成的人物开始发表 TED 演讲并引起人们的关注时,你就会意识到技术的发展速度有多快。
最初,人们从 TED 演讲的照片开始,然后利用 Runway 的 Gen-3 Turbo 和 Kling AI 等工具将这些图像转换为视频。为了增加真实感,他们还使用 RenderNet AI 添加了 AI 生成的配音和唇形同步,让这些数字网红栩栩如生。
在本文中,我将指导你如何使用四种 AI 工具,创建自己的 AI 网红视频:
- Midjourney 或 Flux(用于生成图像)
- Freepik Upscaler(提升图像质量)
- Kling AI(将图像转换为视频)
- RenderNet AI(添加配音和唇形同步)
让我们一步一步地开始吧。
步骤一:生成图像
首先,需要为你的 AI 网红生成一张逼真的肖像。你可以使用任何图像生成器,但如果你追求高度逼真,我推荐使用 Midjourney 或 Flux。
以下是使用 Midjourney 生成的示例图像:
提示:一张电影风格的照片,中景,时尚的拉丁裔女性,棕色头发带有紫色挑染。她坐在咖啡馆里,微笑着,手势像在解释什么。
使用相同的提示,使用 Freepik 生成的图像如下:
这是我最喜欢的一张:
你可以多次尝试,直到找到最满意的形象。
步骤二:提升图像质量
接下来,我们使用 Freepik 图像放大器来提升图像质量。该工具由 Magnific AI 提供支持,效果出色。
放大后的结果:
这个工具为皮肤和头发增加了细节,使图像更加逼真。
另一种方法是使用 RenderNet AI 的 TrueTouch 功能。同样可以提升图像质量,并提供更多自定义选项。
放大后的结果:
可以看到,细节更加丰富,眼神更加生动。
步骤三:将图像转换为视频
现在,我们需要将静态图像转换为逼真的视频。可以使用 Runway 的 Gen-3 Turbo、Kling AI、Vidu 或 Luma 的 Dream Machine 等工具。
如果你想免费体验,Kling AI 是不错的选择。它每天提供 66 个视频生成积分,足够生成多个 5 秒的视频片段。
访问 Kling AI 网站并创建账户。进入 AI 视频页面,在“图像参考”选项卡上传你的图像。
输入以下描述,引导 AI 生成我们想要的视频:
提示:一位微笑的女士在讲话时,用手比划,多次眨眼,注视观众。
你可以根据需要调整提示。处理时间可能会因用户数量而有所不同,可能需要几分钟到几个小时。
生成的视频效果如下:
注意:使用免费版本时,生成时间取决于队列长度。在本例中,生成耗时约四小时。
或者,你也可以使用 Runway 的 Gen-3 Turbo,将图像转换为视频。目前,他们提供 300 个免费生成积分。
生成的视频效果:
太棒了!她看起来栩栩如生,仿佛在热情地分享成为网红的秘诀。
然而,问题来了:她在说什么? 接下来,我们需要为她添加配音并进行唇形同步。
步骤四:撰写脚本
现在,我们需要为 AI 网红准备一段配音稿。可以使用任何免费的 AI 聊天机器人,如 OpenAI 的 ChatGPT、Google 的 Gemini 或 Anthropic 的 Claude AI。
以下是一个简单的提示:
提示:为一个 10 秒的视频片段撰写一段网红分享她成为病毒式传播网红秘诀的独白。
生成的脚本:
“想知道我成为病毒式网红的秘诀吗?关键在于坚持、创造力和与观众的互动!定期发布新鲜内容,积极回复评论,这样才能将关注者转化为社区,让每一篇帖子都成为热门!”
简洁明了,适合短视频。
步骤五:添加配音和唇形同步
最后一步,为视频添加配音并进行唇形同步。我们将使用 RenderNet AI 的配音功能。
注意:该功能需要购买积分,生成一个 10 秒的视频片段需要消耗 367 个积分。
登录 RenderNet AI 账户,进入配音页面。上传之前生成的视频,并按照指引操作。
提示:视频需为 MP4 格式,最大分辨率为 2560x2560 像素,最大帧率为 60 fps。
在设置声音和脚本时,选择与角色匹配的声音。在本例中,选择了 Rachel 的声音。
点击生成按钮,等待处理完成。你可以在 RenderNet Studio 中对视频进行微调。
满意后,下载最终视频。成品就是一个完全同步的 AI 网红视频。
真是太酷了!我对这个结果感到非常惊喜。虽然还不完美,但技术已经取得了巨大进步。我只用了不到一个小时就制作了自己的 AI 网红视频,令人难以置信。
最后的思考
总的来说,这次实验既有趣又令人满意。看到一个人可以在短时间内利用各种 AI 工具创造出令人惊叹的作品,真是令人惊叹。AI 的进步速度令人难以置信,这些工具只会变得越来越强大。
想象一下未来,任何人只需一台笔记本电脑和网络连接,就能制作完整的 TED 演讲或详细的产品评测,而无需亲自出镜。这是一个令人兴奋但又有些令人担忧的前景。
重要的是,我们需要意识到这项技术带来的潜在风险。如果没有适当的监管,深度伪造、虚假新闻和政治宣传可能会泛滥。因此,让我们负责任地使用这些工具,共同促进技术的健康发展。