Add --audio-chunk option for audio/video chunking strategies (20db65c1) · Commits · nexlab / videogen

Commit 20db65c1 authored Feb 26, 2026 by

Stefy Lanza (nextime / spora )

Add --audio-chunk option for audio/video chunking strategies

Added --audio-chunk argument with 3 modes:
- overlap (default): overlapping chunks like [0-60], [58-118]
- word-boundary: uses Whisper timestamps to split at word boundaries
- vad: uses Voice Activity Detection to skip silence

Also added --audio-chunk-overlap to control overlap duration.

New functions added:
- process_video_with_vad(): VAD-based chunking
- process_video_word_boundary(): Word-boundary chunking using Whisper

Modified:
- transcribe_video_audio(): accepts audio_chunk_type and audio_chunk_overlap params
- _transcribe_chunked(): accepts chunk_type and overlap params

parent caf3c707

Expand all Hide whitespace changes

Inline Side-by-side

View file @ 20db65c1

This diff is collapsed.

Please register or to comment