项目介绍
AI数字人的发展正如火如荼,然而,本地部署的问题一直是困扰大家的难题,复杂的步骤让许多人望而却步。不过,经过我的不懈努力,现在我终于找到了了一款无需部署、解压即可使用的AI数字人离线版。
注意,需要在电脑里提前安装好FFmpeg,这是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序,是SadTalker运行的必要支持程序。
FFmpeg 是一个免费、开源且高度可定制的多媒体处理工具,它是一个强大的跨平台框架,用于处理音频、视频、多媒体流和图像。FFmpeg 的主要功能包括解码、编码、转码、流处理、多路复用、分离、合并、过滤等,支持多种音视频格式,包括但不限于MP4、AVI、MKV、MP3、H.264、H.265、AAC 等。
通俗的说当你在计算机上观看视频或听音乐时,你可能会遇到不同类型的文件和格式。有时你需要将它们从一种格式转换为另一种格式,或者进行一些特殊处理,比如剪辑视频或添加效果。 FFmpeg 就像一个多媒体工具箱,它可以帮助你做这些事情。你可以把它想象成一个魔法盒子,可以处理视频、音频和图片。你可以使用它来转换文件格式,比如将一个视频文件从MP4格式转换为AVI格式,或者从一个高质量音频文件提取音乐。你还可以用它来编辑视频,比如剪辑掉一些片段,或者给视频加上特殊效果,就像电影中的特技效果。
下载链接:https://89bk.lanzoul.com/iDYZ41nrefvc
解压缩到一个目录中,路径不能包含中文
打开ffmpeg-2024-02-04-git-7375a6ca7b-full_build
找到bin目录打开他,看一下是否有三个应用程序
然后复制路径
比我的解压路径是D:\ffmpeg-2024-02-04-git-7375a6ca7b-full_build\bin
![图片[1]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208215704262-111-1024x632.png)
然后在环境变量里面添加一行
![图片[2]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208215841230-112-1024x788.png)
![图片[3]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208215949185-113.png)
![图片[4]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208215957913-114.png)
![图片[5]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208220004291-115.png)
完成
想制作这样的数字人说话视频,需要用到2个工具,第一个是文字转语音工具,这里直接使用剪映专业版代替,话不多说,直接看图。
![图片[6]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208220658803-1-1024x683.png)
![图片[7]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208220735150-2-1024x640.png)
![图片[8]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208220744870-3.png)
准备完成后,解压缩这个最新版AI数字人离线版,打开里面的启动程序即可。
![图片[9]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208220501100-11-1024x565.png)
http://127.0.0.1:7860这个地址就是控制台
打开控制台在左边上传图片和音频文件,我的配置如下:
![图片[10]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208222438412-111111-1024x639.png)
总共有5个参数,第一个是裁剪是默认的,如果选这个就是最终输出的视频就是被裁剪了基本就剩下头部那一块地方了 我一般是选full。
选full的最终输出的视频,也就是你图片素材有多大,输出的视频就有多大。
建议素材或者语音文件不要太大,否则效率会让你怀疑人生。
我选择full模式视频动画如下
![图片[11]-AI数字人本地部署版本来了,解压即用,无需繁琐本地配置,轻松实现照片生成AI数字人,让照片开口说话-知赚网](https://img.zaza88.com/2024/02/20240208221354785-55-1024x554.png)
窗口显示到了100%后,在这个工具的文件夹里面有个results文件夹,所生成的视频就在这里,另外在浏览器控制台里面也可以下载生成的视频文件。
----》点我开通《----