Mochi1 是由创业团队 Genmo 开发并开源的一款全新文生视频模型,在动作效果和提示词理解能力上有了显著进步。不过,原始模型需要配备 4 个 H100 GPU,普通用户难以体验。本次分享的是 K 大佬的量化版本,这个版本可以在显存 24G 或以下的显卡上运行。虽然质量不及原版,但足够用来尝鲜和娱乐。
配置要求
要运行 Mochi1,请确保您的电脑符合以下要求:
- 操作系统:Windows 10 或 11,64 位版本;
- 显卡:
- FB16 精度模型:建议显存 24G 的 NVIDIA 显卡;
- FP8 精度模型:建议显存 16G 的 NVIDIA 显卡;
- 显存低于 16G 的 NVIDIA 显卡可选择 GGUF 模型;
- CUDA:版本需要达到 12.4 或以上;
- 硬盘空间:解压后的文件约占 54.8G,请确保有足够存储空间。
如果未安装 CUDA,可以参考教程:CUDA 安装指南。
如何确认显卡型号及显存?
- 打开任务管理器;
- 切换到 性能 选项卡;
- 找到 GPU,右上角显示显卡型号,下方可查看显存大小。
使用教程
- 解压文件包
下载整合包后解压,注意避免文件夹路径或文件名中包含中文字符,以免部分软件无法识别而导致报错。 - 启动程序
双击一键启动_gpu.bat
文件,稍等片刻,浏览器会自动打开操作界面。 - 载入工作流
点击左上角 “工作流”,选择 “打开”。 - 加载配置文件
在弹出的窗口中,选择 “Mochi_1-文生视频工作流.json” 文件并打开。 - 设置模型与参数
选择模型:- FB16 精度:适合显存 24G 的 NVIDIA 显卡;
- FP8 精度:适合显存 16G 的 NVIDIA 显卡;
- GGUF 模型:适合显存低于 16G 的 NVIDIA 显卡。
输入提示词,其他参数可保持默认设置,然后点击 “执行队列”。
- 保存生成结果
生成结果后,右键单击选项 “save preview” 保存到指定位置;或者直接前往文件夹ComfyUI/output
找到结果文件。
开源地址
项目代码托管于 GitHub,访问链接:MochiWrapper 开源项目。