top / index / prev / next / target / source

2025-04-19 diary: Zoom H4essential で録音した32bit フロート形式を一般形式ファイルに変換 (1パス)

いがぴょんの日記 日記形式でつづる いがぴょんコラム ウェブページです。

Zoom H4essential で録音した32bit フロート形式を一般形式ファイルに変換 (1パス)

最近、**Zoom H4essential** を使ってフィールド録音してみました。
録音フォーマットは 96kHz・32bit float(フロート)。音質は最高なのですが、この形式のままだと再生環境を選ぶため、あとで扱いやすいフォーマットに変換する必要があります。

今回はその変換手順の備忘録です。
変換にはおなじみ ffmpeg/ffprobe を使います。


1. 録音ファイルをMacに転送

まず、H4essential を USB で Mac に接続し、録音ファイル(例: 250419_183946_TrMic.WAV)をコピーします。


2. ffprobeで録音ファイルの中身を確認

内容を確認するために以下のコマンドを実行します。

ffprobe -v error -show_format -show_streams 250419_183946_TrMic.WAV 

パラメータ説明

パラメータ 意味
-v error エラーメッセージのみ表示(不要なログを抑制)
-show_format フォーマット情報(サンプリングレートやビットレートなど)を表示
-show_streams ストリーム情報(チャンネル数やビット深度など)を表示

実行結果はこんな感じ:

[STREAM]
index=0
codec_name=pcm_f32le
codec_long_name=PCM 32-bit floating point little-endian
profile=unknown
codec_type=audio
codec_tag_string=[3][0][0][0]
codec_tag=0x0003
sample_fmt=flt
sample_rate=96000
channels=2
channel_layout=unknown
bits_per_sample=32

32bit float でステレオ録音、サンプルレートは96kHzであることがわかります。


3. ffmpegで16bit・44.1kHzに変換(ラウドネス正規化付き)

CD音質に変換するには、以下のようにします。
このとき、loudnorm フィルタを使って音量を自動調整(ラウドネスノーマライゼーション)も行っています。

ffmpeg -i 250419_183946_TrMic.WAV -af loudnorm -ar 44100 -sample_fmt s16 250419_183946_TrMic-loudnorm.WAV

パラメータ説明

パラメータ 意味
-i 250419_183946_TrMic.WAV 入力ファイル(H4essentialで録音した 96kHz・32bit float WAV)
-af loudnorm オーディオフィルタ:loudnorm を使ってラウドネスを自動調整(1パスモード)
-ar 44100 出力サンプリングレートを 44.1kHz(CD音質)に設定
-sample_fmt s16 出力のビット深度を 16bit signed integer に変換
250419_183946_TrMic-loudnorm.WAV 出力ファイル名

🔎 補足

変換結果例(抜粋)

[aist#0:0/pcm_f32le @ 0x7f99xxxxxxxx] Guessed Channel Layout: stereo
Input #0, wav, from '250419_183946_TrMic.WAV':
  Metadata:
    comment         : zTAKE=001 
                    : zSCENE=250419_191634 
                    : zTAPE= 
                    : zCIRCLED=FALSE 
                    : zTRK3=Tr1 
                    : zTRK4=Tr2 
                    : zNOTE= 
                    : 
    encoded_by      : ZOOM H4essential
    date            : 2025-04-19
    creation_time   : 18:39:46
    time_reference  : 6449856000
    coding_history  : A=PCM,F=96000,W=32,M=stereo,T=H4essential;VERSION=1.10;TRK=1;ONF=1;LNK=1;FDR=   0;PAN=CNTR;MID=XY;
  Duration: 00:36:48.00, bitrate: 6144 kb/s
  Stream #0:0: Audio: pcm_f32le ([3][0][0][0] / 0x0003), 96000 Hz, stereo, flt, 6144 kb/s
Stream mapping:
  Stream #0:0 -> #0:0 (pcm_f32le (native) -> pcm_s16le (native))
...
[out#0/wav @ 0x7f99xxxxxxxx] video:0KiB audio:380362KiB subtitle:0KiB other streams:0KiB global headers:0KiB muxing overhead: 0.000056%
size=  380363KiB time=00:36:48.00 bitrate=1411.2kbits/s speed=16.3x

まとめ

Last modified: $Date: 2025-04-19 $


この日記について