使用FFmpeg将WebM转换为WAV

5

我已经成功使用Python中的FFmpeg将MP3文件转换为WAV,以便可以将它们发布到Google语音识别。现在我有同样的情况,但是要处理WebM文件,而我之前使用的旧函数无法工作。它应该将文件转换为WAV并将其分割成15秒的块。我可以直接从WebM文件中进行此操作,还是需要将其先转换为其他格式?

我使用的函数如下:

def convert_and_split(filename):
    command = ['ffmpeg', '-i', filename, '-f', 'segment', '-segment_time', '15', '-c', 'copy', 'parts/out%09d.wav']
    subprocess.run(command,stdout=subprocess.PIPE,stdin=subprocess.PIPE)

编辑。忘记提到这个函数目前在处理webm文件时的操作。它会生成一个名为out000000000.wav的空wav文件。在控制台中,我会得到以下错误消息:

[segment @ 0x55970b22fe80] Opening 'parts/out000000000.wav' for writing
[wav @ 0x55970b1ffbc0] opus codec not supported in WAVE format
Could not write header for output file #0 (incorrect codec parameters ?): Function not implemented

编辑2. 我想我做对了,但希望听到是否有更好的方法。

首先将文件转换为单声道WAV格式,然后将其分成块。请随时指出任何错误或问题。

def convert_webm_to_wav(file):
    command = ['ffmpeg', '-i', file, '-acodec', 'pcm_s16le', '-ac', '1', '-ar', '16000', '/home/janip/openvidu_files/' + file.name[:-5] + '.wav']
    subprocess.run(command,stdout=subprocess.PIPE,stdin=subprocess.PIPE)

def split_audio(filename):
    command = ['ffmpeg', '-i', filename, '-f', 'segment', '-segment_time', '15', '-c', 'copy', '/home/janip/work/Holda/Nut_ideas/voice_chat_demos/openvidu-tutorials/openvidu-js-node/python_scripts/parts/out%09d.wav']
    subprocess.run(command,stdout=subprocess.PIPE,stdin=subprocess.PIPE)

编辑3. 我尝试了llogan提供的函数,但出现了这个错误:

error:[segment @ 0x55f1c28d2740] Opening 'parts/out000000000.wav' for writing
[segment @ 0x55f1c28d2740] Failed to open segment 'parts/out000000000.wav'
Could not write header for output file #0 (incorrect codec parameters ?): No such file or directory
Error initializing output stream 0:0 -- 

error:Conversion failed!

当我使用两个单独的功能时它可以工作,但我认为wav格式的音频质量比原始的webm格式差。有什么方法可以改进吗?


3
请尝试从终端运行ffmpeg命令,并在问题中添加出现的错误信息。 - Daweo
2个回答

9

您需要将数据转换为 PCM 格式:

ffmpeg -i ./big-buck-bunny_trailer.webm -c:a pcm_f32le ./out.wav

输出:

ffmpeg version 4.2.3 Copyright (c) 2000-2020 the FFmpeg developers
  built with Apple clang version 11.0.3 (clang-1103.0.32.59)
  configuration: --prefix=/usr/local/Cellar/ffmpeg/4.2.3 --enable-shared --enable-pthreads --enable-version3 --enable-avresample --cc=clang --host-cflags=-fno-stack-check --host-ldflags= --enable-ffplay --enable-gnutls --enable-gpl --enable-libaom --enable-libbluray --enable-libdav1d --enable-libmp3lame --enable-libopus --enable-librubberband --enable-libsnappy --enable-libsrt --enable-libtesseract --enable-libtheora --enable-libvidstab --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-lzma --enable-libfontconfig --enable-libfreetype --enable-frei0r --enable-libass --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenjpeg --enable-librtmp --enable-libspeex --enable-libsoxr --enable-videotoolbox --disable-libjack --disable-indev=jack
  libavutil      56. 31.100 / 56. 31.100
  libavcodec     58. 54.100 / 58. 54.100
  libavformat    58. 29.100 / 58. 29.100
  libavdevice    58.  8.100 / 58.  8.100
  libavfilter     7. 57.100 /  7. 57.100
  libavresample   4.  0.  0 /  4.  0.  0
  libswscale      5.  5.100 /  5.  5.100
  libswresample   3.  5.100 /  3.  5.100
  libpostproc    55.  5.100 / 55.  5.100
Input #0, matroska,webm, from './big-buck-bunny_trailer.webm':
  Metadata:
    encoder         : http://sourceforge.net/projects/yamka
    creation_time   : 2010-05-20T08:21:12.000000Z
  Duration: 00:00:32.48, start: 0.000000, bitrate: 533 kb/s
    Stream #0:0(eng): Video: vp8, yuv420p(progressive), 640x360, SAR 1:1 DAR 16:9, 25 fps, 25 tbr, 1k tbn, 1k tbc (default)
    Stream #0:1(eng): Audio: vorbis, 44100 Hz, mono, fltp (default)
Stream mapping:
  Stream #0:1 -> #0:0 (vorbis (native) -> pcm_f32le (native))
Press [q] to stop, [?] for help
Output #0, wav, to './out.wav':
  Metadata:
    ISFT            : Lavf58.29.100
    Stream #0:0(eng): Audio: pcm_f32le ([3][0][0][0] / 0x0003), 44100 Hz, mono, flt, 1411 kb/s (default)
    Metadata:
      encoder         : Lavc58.54.100 pcm_f32le
size=    5597kB time=00:00:32.50 bitrate=1410.7kbits/s speed= 625x
video:0kB audio:5597kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.001989%

谢谢您的建议,您能否检查一下我的编辑,看我是如何做到我想做的事情,并指出我是否有做错什么? - lr_optim
1
@ lr_optim: 我会使用-y来覆盖现有文件(特别是用于测试),因为当任何“输出”文件存在时,ffmpeg会停止处理。检查stdout和/或returncode和/或是否存在'*.wav'文件。否则我会以同样的方式处理。 - Maurice Meyer

4
不需要将文件转换为WAV格式,然后再使用单独的命令进行分割。只需删除-c copy并在一个命令中完成即可:
def convert_and_split(filename):
    command = ['ffmpeg', '-i', filename, '-f', 'segment', '-segment_time', '15', 'out%09d.wav']
    subprocess.run(command,stdout=subprocess.PIPE,stdin=subprocess.PIPE)

-c copy 启用流复制模式。就像复制和粘贴一样,但您无法将Opus音频放入WAV中。删除 -c copy 将允许ffmpeg将Opus转换为WAV。


谢谢您的建议。我编辑了我的原始答案,以展示使用您的函数得到的错误消息。您能否检查一下,看看是否有什么问题? - lr_optim
2
@lr_optim 这个错误意味着输出路径不存在。将'parts/out%09d.wav'改为'out%09d.wav' - llogan

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接