AI探店视频技术分析
# Background
最近面试了一家主推 收款码+一键转发探店视频
产品的公司,在此不讨论这个商业模式是否可行,仅仅尝试分析这个 AI 探店视频生成方案有哪些,先叠个甲,我不曾看过他的源码,仅从网上公开资料分析,仅供学习参考。
# Analysis
该产品 AI 探店视频生成操作步骤大概如下:
简而言之就是:
- 商家上传探店视频素材
- 服务器根据这些素材随机混剪出一个独一无二的视频
- 顾客下载这个视频发布在抖音上
本文要分析的则是服务端是如何剪辑这些视频的,商家上传视频是需要提交的数据有:
文案关键字:最少3个,最多20个
素材:图片或视频,不低于10个,最多19个
【预览视频】:需要倒计时,应该是实时生成的,预计5分钟
预览没问题,则可以下一步,选择要生成的数量(最多20个);可使用高级设置添加标题、特效、旁白声音
# Plan 1:阿里云 - 云端智能剪辑
产品教程里提到 携手阿里云定制
,Google 一下便找到了阿里云的解决方案 —— 云端智能剪辑
,通过文档猜测此产品功能实现为:
- 图片上传到阿里云的 OSS
- 调用阿里云的 SDK 或 OpenAPI 进行剪辑
具体操作参见阿里云 视频课程3-开发者实践-14:35(制作营销短视频)
关于费用
根据收费说明推测,剪辑一个 h264 3min 720p
的高级剪辑费用约为 0.1467 * 3 = 0.4401元
,实际价格应该低于这个价,我没见过成片,应该是不超过 2 分钟的,可能就 1 分钟。
参考:视频点播的增值服务计费项_视频点播 (VOD)- 阿里云帮助中心 (opens new window)
# Plan 2:自建
笔记
其实使用阿里云的方案已经足够了,费用也不高,自建纯属折腾。
一番搜索后,还是没能找到一个 all in one 的库,需要多个库配合使用,但这些库基于 python 的,所以开发起来不麻烦,这里仅提供思路,没有真正实践。
- MoviePy:剪辑
- ChatTTS:文本转语音
参考:
上次更新: 2024/08/03, 20:49:18