top / index / prev / next / target / source
日記形式でつづる いがぴょんコラム ウェブページです。
最近、**Zoom H4essential** を使ってフィールド録音してみました。
録音フォーマットは 96kHz・32bit float(フロート)。音質は最高なのですが、この形式のままだと再生環境を選ぶため、あとで扱いやすいフォーマットに変換する必要があります。
今回はその変換手順の備忘録です。
変換にはおなじみ ffmpeg/ffprobe を使います。
まず、H4essential を USB で Mac に接続し、録音ファイル(例: 250419_183946_TrMic.WAV
)をコピーします。
内容を確認するために以下のコマンドを実行します。
ffprobe -v error -show_format -show_streams 250419_183946_TrMic.WAV
パラメータ説明
パラメータ | 意味 |
---|---|
-v error | エラーメッセージのみ表示(不要なログを抑制) |
-show_format | フォーマット情報(サンプリングレートやビットレートなど)を表示 |
-show_streams | ストリーム情報(チャンネル数やビット深度など)を表示 |
実行結果はこんな感じ:
[STREAM]
index=0
codec_name=pcm_f32le
codec_long_name=PCM 32-bit floating point little-endian
profile=unknown
codec_type=audio
codec_tag_string=[3][0][0][0]
codec_tag=0x0003
sample_fmt=flt
sample_rate=96000
channels=2
channel_layout=unknown
bits_per_sample=32
32bit float でステレオ録音、サンプルレートは96kHzであることがわかります。
CD音質に変換するには、以下のようにします。 このとき、loudnorm フィルタを使って音量を自動調整(ラウドネスノーマライゼーション)も行っています。
ffmpeg -i 250419_183946_TrMic.WAV -af loudnorm -ar 44100 -sample_fmt s16 250419_183946_TrMic-loudnorm.WAV
パラメータ説明
パラメータ | 意味 |
---|---|
-i 250419_183946_TrMic.WAV |
入力ファイル(H4essentialで録音した 96kHz・32bit float WAV) |
-af loudnorm |
オーディオフィルタ:loudnorm を使ってラウドネスを自動調整(1パスモード) |
-ar 44100 |
出力サンプリングレートを 44.1kHz(CD音質)に設定 |
-sample_fmt s16 |
出力のビット深度を 16bit signed integer に変換 |
250419_183946_TrMic-loudnorm.WAV |
出力ファイル名 |
loudnorm
は ITU-R BS.1770 規格に基づいて ラウドネスを調整します。[aist#0:0/pcm_f32le @ 0x7f99xxxxxxxx] Guessed Channel Layout: stereo
Input #0, wav, from '250419_183946_TrMic.WAV':
Metadata:
comment : zTAKE=001
: zSCENE=250419_191634
: zTAPE=
: zCIRCLED=FALSE
: zTRK3=Tr1
: zTRK4=Tr2
: zNOTE=
:
encoded_by : ZOOM H4essential
date : 2025-04-19
creation_time : 18:39:46
time_reference : 6449856000
coding_history : A=PCM,F=96000,W=32,M=stereo,T=H4essential;VERSION=1.10;TRK=1;ONF=1;LNK=1;FDR= 0;PAN=CNTR;MID=XY;
Duration: 00:36:48.00, bitrate: 6144 kb/s
Stream #0:0: Audio: pcm_f32le ([3][0][0][0] / 0x0003), 96000 Hz, stereo, flt, 6144 kb/s
Stream mapping:
Stream #0:0 -> #0:0 (pcm_f32le (native) -> pcm_s16le (native))
...
[out#0/wav @ 0x7f99xxxxxxxx] video:0KiB audio:380362KiB subtitle:0KiB other streams:0KiB global headers:0KiB muxing overhead: 0.000056%
size= 380363KiB time=00:36:48.00 bitrate=1411.2kbits/s speed=16.3x
Last modified: $Date: 2025-04-19 $