v4 -- Claude Code Skill

Karaoke MV Generator

自动生成卡拉OK风格MV。Ken Burns 缩放 + Whisper 精确时间戳 + ASS 字幕,中英文自动识别。

//

Ken Burns 效果

每张图片缓慢缩放平移,电影级视觉

{}

Whisper 时间戳

stable-ts 精确到字符级别的歌词对齐

CN/EN

中英文自动识别

中文字符级对齐,英文 segment 文本相似度

从零创作流程

01
描述创意
->
02
生成歌词
->
03
生成配图
->
04
生成音乐
->
05
合成 MV

使用方法

# 使用现有素材
python3 karaoke-mv-generator.py \
  --audio song.mp3 \
  --images img1.jpg img2.jpg img3.jpg \
  --lyrics lyrics.txt \
  --output karaoke/ \
  --name "MySong"
# Claude Code 中直接触发
/karaoke-mv
音频: /path/to/song.mp3
图片: /path/to/img1.jpg, img2.jpg
歌词: /path/to/lyrics.txt

歌词格式

中文

字符级对齐
歌曲标题

[verse] 那条路 还在延伸 风吹过 又是黄昏
[chorus] 时光啊 你走得太快 故乡啊 你是否还在

English

segment 文本相似度
Song Title

[verse]
Upon the hills where shadows play
The morning mist begins to sway

[chorus]
Oh meadows wide and waters deep
Your beauty makes my spirit weep

输出参数

分辨率1080x1920
方向竖屏
编码H.264 + AAC
质量CRF 23
帧率30fps
字幕ASS Karaoke
字体PingFang SC 72pt
依赖FFmpeg 7.0+