NipGeihou's blog NipGeihou's blog
  • Java

    • 开发规范
    • 进阶笔记
    • 微服务
    • 快速开始
    • 设计模式
  • 其他

    • Golang
    • Python
    • Drat
  • Redis
  • MongoDB
  • 数据结构与算法
  • 计算机网络
  • 应用

    • Grafana
    • Prometheus
  • 容器与编排

    • KubeSphere
    • Kubernetes
    • Docker Compose
    • Docker
  • 组网

    • TailScale
    • WireGuard
  • 密码生成器
  • 英文单词生成器
🍳烹饪
🧑‍💻关于
  • 分类
  • 标签
  • 归档

NipGeihou

我见青山多妩媚,料青山见我应如是
  • Java

    • 开发规范
    • 进阶笔记
    • 微服务
    • 快速开始
    • 设计模式
  • 其他

    • Golang
    • Python
    • Drat
  • Redis
  • MongoDB
  • 数据结构与算法
  • 计算机网络
  • 应用

    • Grafana
    • Prometheus
  • 容器与编排

    • KubeSphere
    • Kubernetes
    • Docker Compose
    • Docker
  • 组网

    • TailScale
    • WireGuard
  • 密码生成器
  • 英文单词生成器
🍳烹饪
🧑‍💻关于
  • 分类
  • 标签
  • 归档
  • 设计模式

  • 开发规范

  • 经验分享

    • MyBatis-Plus查询条件构造器扩展——QueryWrapperX
    • 浅谈MVC分层及层对象传递实践
    • Spring Boot中Service需要声明接口吗
    • Java日志类
    • 派单算法
    • AI探店视频技术分析
      • Background
      • Analysis
      • Plan 1:阿里云-云端智能剪辑
      • Plan 2:自建
  • 记录

  • 快速开始

  • 笔记

  • 面试题

  • 微服务

  • 踩过的坑

  • Java
  • 经验分享
NipGeihou
2024-07-31
目录

AI探店视频技术分析

# Background

最近面试了一家主推 收款码+一键转发探店视频 产品的公司,在此不讨论这个商业模式是否可行,仅仅尝试分析这个 AI 探店视频生成方案有哪些,先叠个甲,我不曾看过他的源码,仅从网上公开资料分析,仅供学习参考。

# Analysis

该产品 AI 探店视频生成操作步骤大概如下:

image-20240731205324576

简而言之就是:

  • 商家上传探店视频素材
  • 服务器根据这些素材随机混剪出一个独一无二的视频
  • 顾客下载这个视频发布在抖音上

本文要分析的则是服务端是如何剪辑这些视频的,商家上传视频是需要提交的数据有:

文案关键字:最少3个,最多20个
素材:图片或视频,不低于10个,最多19个

【预览视频】:需要倒计时,应该是实时生成的,预计5分钟

预览没问题,则可以下一步,选择要生成的数量(最多20个);可使用高级设置添加标题、特效、旁白声音

# Plan 1:阿里云 - 云端智能剪辑

产品教程里提到 携手阿里云定制 ,Google 一下便找到了阿里云的解决方案 —— 云端智能剪辑 ,通过文档猜测此产品功能实现为:

  • 图片上传到阿里云的 OSS
  • 调用阿里云的 SDK 或 OpenAPI 进行剪辑

具体操作参见阿里云 视频课程3-开发者实践-14:35(制作营销短视频)

关于费用

根据收费说明推测,剪辑一个 h264 3min 720p 的高级剪辑费用约为 0.1467 * 3 = 0.4401元 ,实际价格应该低于这个价,我没见过成片,应该是不超过 2 分钟的,可能就 1 分钟。

参考:视频点播的增值服务计费项_视频点播 (VOD)- 阿里云帮助中心 (opens new window)

# Plan 2:自建

笔记

其实使用阿里云的方案已经足够了,费用也不高,自建纯属折腾。

一番搜索后,还是没能找到一个 all in one 的库,需要多个库配合使用,但这些库基于 python 的,所以开发起来不麻烦,这里仅提供思路,没有真正实践。

  • MoviePy:剪辑
  • ChatTTS:文本转语音

参考:

  • Zulko/moviepy: Video editing with Python (opens new window)
  • 2noise/ChatTTS: A generative speech model for daily dialogue. (opens new window)
上次更新: 2024/08/03, 20:49:18
派单算法
「记录」SpringBoot与前端传递的json中属性映射读写注解

← 派单算法 「记录」SpringBoot与前端传递的json中属性映射读写注解→

最近更新
01
Docker Swarm
04-18
02
安全隧道 - gost
04-17
03
Solana最佳实践
04-16
更多文章>
Theme by Vdoing | Copyright © 2018-2025 NipGeihou | 友情链接
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式