ホワイトノイズとは何ですか？

ホワイトノイズとは、すべての周波数帯域にわたってパワースペクトル密度が一定である雑音です。各サンプルが互いに無相関で、自己相関関数がディラクのデルタ関数となります。

Paul Kellet の IIR フィルタとは何ですか？

Paul Kellet の IIR フィルタは、6段の1次 IIR フィルタを並列合成してピンクノイズの −3 dB/oct 特性を近似する手法です。44.1 kHz において 10 Hz〜4 kHz で ±0.1 dB 以内の精度を持ちますが、係数がサンプリング周波数に依存するという制約があります。

IFFT 法によるピンクノイズ生成の利点は何ですか？

IFFT 法では周波数領域で振幅を 1/√f に設定し、ランダム位相を与えて逆 FFT することで、理論的に正確な −3 dB/oct 特性を持つピンクノイズが得られます。サンプリング周波数に依存しない点が IIR フィルタ法に対する利点です。

シェルビング型フィルタの縦続接続法とは何ですか？

シェルビング型フィルタの縦続接続法は、高域 −3 dB のシェルビング型フィルタを 11 段縦続接続し、非線形最適化によって −3 dB/oct 特性を高精度に近似する手法です。さらに 2 段ずつペアリングして 2 次 IIR（biquad）6 段にまとめ、Lp ノルム・ホモトピー法（p を 2 から ∞ へ段階的に増加）で最適化すると、44.1 kHz において 20 Hz〜20 kHz で 7 段構成では ±0.0058 dB 以内の等リップル比 0.96・符号完全交代の等リップル近似が得られ、チェビシェフの交替定理の条件をほぼ満たします。

ピンクノイズのオクターブ等パワー性とは何ですか？

ピンクノイズはパワースペクトル密度が 1/f に比例するため、任意の周波数 f₀ から 2f₀ までの 1 オクターブ帯域のパワーが ∫(f₀→2f₀) f⁻¹ df = log 2 と一定になります。この性質により、オクターブバンド分析器で測定すると全帯域のレベルが揃い、音響測定の基準信号として用いられます。

ノイズ生成

Noise Generation — Theory and Implementation

ノイズ（雑音）は、信号処理のテスト、音響測定、ディザリング、シミュレーションなど多くの場面で不可欠な信号である。ここでは各種ノイズの数学的特性と生成手法を解説し、特にピンクノイズについては Paul Kellet の IIR フィルタ法と IFFT 法を詳しく分析する。

1. 色付きノイズの分類

ノイズはパワースペクトル密度 $S(f)$ の周波数依存性によって分類される。一般に $S(f) \propto 1/f^\alpha$ と表され、指数 $\alpha$ によって「色」が決まる。

表1: 色付きノイズの一覧
名称	指数 $\alpha$	パワースペクトル密度	特徴
ホワイトノイズ	$0$	$S(f) = \text{const.}$	全帯域均一、理論解析の基準
ピンクノイズ（$1/f$）	$1$	$S(f) \propto 1/f$	オクターブ等エネルギー、音響測定
ブラウンノイズ（$1/f^2$）	$2$	$S(f) \propto 1/f^2$	ランダムウォーク、低周波成分優勢
ブルーノイズ	$-1$	$S(f) \propto f$	高周波成分優勢、ディザリング
バイオレットノイズ	$-2$	$S(f) \propto f^2$	ホワイトノイズの微分

2. ホワイトノイズ

ホワイトノイズは、パワースペクトル密度が全周波数にわたって一定である理想的な雑音である。離散時間では各サンプル $x[n]$ が独立同分布 (i.i.d.) に従う系列として定義される。

統計的性質

自己相関関数: $R_{xx}[m] = \sigma^2 \delta[m]$
パワースペクトル密度: $S_{xx}(e^{j\omega}) = \sigma^2$（一定）
確率分布: ガウス分布が最も一般的だが、一様分布なども使用される

生成方法

一様分布ホワイトノイズ — 疑似乱数生成器（メルセンヌ・ツイスタ、xoshiro など）を使用
ガウスホワイトノイズ — Box-Muller 法や Ziggurat 法で一様乱数を正規分布に変換

Box-Muller 法

独立な一様乱数 $U_1, U_2 \sim \text{Uniform}(0,1)$ から、独立な標準正規乱数の組 $(Z_1, Z_2)$ を生成する：

$$Z_1 = \sqrt{-2\ln U_1}\,\cos(2\pi U_2), \quad Z_2 = \sqrt{-2\ln U_1}\,\sin(2\pi U_2)$$

3. ピンクノイズ（$1/f$ ノイズ）

ピンクノイズはパワースペクトル密度が周波数に反比例する雑音であり、オクターブあたりのエネルギーが等しいという特徴を持つ。音響測定、音楽制作、自然現象のモデリングに広く使われる。このようなスペクトルを持つノイズは「$1/f$ 揺らぎ」とも呼ばれ、自然界に広く見られる。

オクターブ等パワー性の証明

ピンクノイズのパワースペクトル密度を $E[|X(f)|^2] = f^{-1}$ とする。任意の中心周波数 $f_0$ から 1 オクターブ上の $2f_0$ までのパワーは：

$$p(f_0) = \int_{f_0}^{2f_0} E[|X(f)|^2]\,df = \int_{f_0}^{2f_0} f^{-1}\,df = \bigl[\log f\bigr]_{f_0}^{2f_0}$$ $$= \log(2f_0) - \log(f_0) = \log 2$$

結果は $f_0$ に依存せず一定である。すなわち、どのオクターブ帯域でもパワーは $\log 2$ で等しい。これがピンクノイズが音響測定に用いられる理由であり、オクターブバンド分析器で測定すると全帯域のレベルが揃う。

主要な生成手法

手法	原理	精度	用途
IIR フィルタ法	ホワイトノイズに $1/\sqrt{f}$ 特性のフィルタを適用	近似（設計依存）	リアルタイム処理
Voss-McCartney 法	異なる更新頻度の乱数列を加算	近似（段数依存）	低コスト実装
IFFT 法	周波数領域で $1/\sqrt{f}$ を設定し逆 FFT	厳密	オフライン生成
シェルビング型縦続接続法	$-3$ dB シェルビングフィルタを 11 段縦続接続し非線形最適化	高精度（$\pm 0.02$ dB）	高精度リアルタイム処理
2 次 IIR 縦続接続法（6 段）	biquad 6 段を縦続接続し $L_p$ ホモトピー法 + 交互最適化	極めて高精度（$\pm 0.0075$ dB）	高精度リアルタイム処理
2 次 IIR 縦続接続法（7 段）	biquad 7 段。等リップル（符号交代）を達成	最高精度（$\pm 0.0058$ dB）	高精度リアルタイム処理

3.1 理想的なピンクノイズフィルタ

連続時間においてホワイトノイズをピンクノイズに変換するフィルタの伝達関数は：

$$H(s) \propto \frac{1}{\sqrt{s}} = s^{-1/2}$$

これは分数階微積分（fractional calculus）の演算子であり、有理関数では正確に表現できない。したがって、有限次の IIR フィルタで近似する必要がある。

近似の基本方針は、$1/\sqrt{s}$ を1次項の部分分数に展開することである：

$$\frac{1}{\sqrt{s}} \approx \sum_{k=0}^{N-1} \frac{\beta_k}{s + p_k}$$

極 $p_k$ を対数等間隔に配置し、留数 $\beta_k$ を調整すると $-3$ dB/oct（$= -10$ dB/dec）のスロープを広帯域にわたって近似できる。 Oustaloup の再帰近似法はこの方針を体系化したものであり、極と零点を厳密に対数等間隔に配置する。

3.2 Paul Kellet の IIR フィルタ

Paul Kellet が musicdsp.org で公開したフィルタは、6段の1次 IIR フィルタを並列に合成して $-3$ dB/oct 特性を近似する。係数は理論的な最適化ではなく、Visual Basic のプログラムでインパルス応答をプロットしながら手動で調整されたものである。

3段階の精度のバリエーションがあり、ここでは最高精度の Refined（Instrumentation grade）版を分析する。

差分方程式

ホワイトノイズ $x[n]$ を入力とし、各段のフィルタ状態 $b_k[n]$ を以下で更新する：

$$b_k[n] = \alpha_k \cdot b_k[n-1] + \beta_k \cdot x[n] \quad (k = 0, 1, \ldots, 5)$$

加えて1サンプル遅延の項 $b_6$ があり、出力は：

$$y[n] = \sum_{k=0}^{5} b_k[n] + b_6[n] + 0.5362 \cdot x[n]$$

ここで $b_6[n] = 0.115926 \cdot x[n-1]$（$b_6$ は出力に加算された後に更新される）。

フィルタ係数

表2: Paul Kellet フィルタの係数（Refined 版）
段	$\alpha_k$（極）	$\beta_k$（ゲイン）	極周波数 @44.1kHz
$b_0$	$0.99886$	$0.0555179$	$\approx 8\;\text{Hz}$
$b_1$	$0.99332$	$0.0750759$	$\approx 47\;\text{Hz}$
$b_2$	$0.96900$	$0.1538520$	$\approx 218\;\text{Hz}$
$b_3$	$0.86650$	$0.3104856$	$\approx 937\;\text{Hz}$
$b_4$	$0.55000$	$0.5329522$	$\approx 3160\;\text{Hz}$
$b_5$	$-0.7616$	$-0.0168980$	$\approx 12360\;\text{Hz}$

極周波数の概算値は $f_p \approx f_s(1 - |\alpha_k|) / (2\pi)$ で得られる。隣接する極の周波数比は $\times 5.9$, $\times 4.6$, $\times 4.3$, $\times 3.4$ であり、概ね対数等間隔だが一定ではない。これは手動チューニングの痕跡である。

C++ 実装例

// Paul Kellet pink noise filter (Refined / Instrumentation grade)
// 入力: white — ホワイトノイズサンプル ([-1, +1])
// 状態: b0〜b6 は呼び出し間で保持する (初期値 0)
double white = rng.nextDouble() * 2.0 - 1.0;  // 一様乱数
b0 = 0.99886 * b0 + white * 0.0555179;
b1 = 0.99332 * b1 + white * 0.0750759;
b2 = 0.96900 * b2 + white * 0.1538520;
b3 = 0.86650 * b3 + white * 0.3104856;
b4 = 0.55000 * b4 + white * 0.5329522;
b5 = -0.7616 * b5 - white * 0.0168980;
double pink = b0 + b1 + b2 + b3 + b4 + b5 + b6 + white * 0.5362;
b6 = white * 0.115926;
// pink を出力として使用（必要に応じて正規化）

3.3 伝達関数 $H(z)$ の導出

各段の伝達関数

差分方程式 $b_k[n] = \alpha_k \cdot b_k[n-1] + \beta_k \cdot x[n]$ の Z 変換を取ると：

$$B_k(z) = \alpha_k z^{-1} B_k(z) + \beta_k X(z)$$ $$B_k(z)(1 - \alpha_k z^{-1}) = \beta_k X(z)$$

したがって各段の伝達関数は：

$$H_k(z) = \frac{B_k(z)}{X(z)} = \frac{\beta_k}{1 - \alpha_k z^{-1}} \quad (k = 0, 1, \ldots, 5)$$

$b_6$ の伝達関数

$b_6$ は出力の加算に使用された後に $x[n]$ で更新される。すなわち、加算時点での $b_6$ の値は前サンプルの $x[n-1]$ に基づく：

$$H_6(z) = 0.115926\,z^{-1}$$

全体の伝達関数

出力 $y[n] = \sum_{k=0}^{5} b_k[n] + b_6[n] + 0.5362 \cdot x[n]$ より：

$$\boxed{H(z) = \sum_{k=0}^{5} \frac{\beta_k}{1 - \alpha_k z^{-1}} + 0.115926\,z^{-1} + 0.5362}$$

各項を展開すると：

$$H(z) = \frac{0.0555179}{1 - 0.99886\,z^{-1}} + \frac{0.0750759}{1 - 0.99332\,z^{-1}} + \frac{0.1538520}{1 - 0.96900\,z^{-1}}$$ $$\quad + \frac{0.3104856}{1 - 0.86650\,z^{-1}} + \frac{0.5329522}{1 - 0.55000\,z^{-1}} - \frac{0.0168980}{1 + 0.7616\,z^{-1}}$$ $$\quad + 0.115926\,z^{-1} + 0.5362$$

構造の特徴： これは全極型フィルタ + FIR 項の並列合成である。 Oustaloup の近似法と異なり零点を持たず、直達項 $0.5362$ と 1サンプル遅延項 $0.115926\,z^{-1}$ が高域の応答を補正している。

3.4 周波数特性 $H(\omega)$ の導出

$z = e^{j\omega}$ を代入する。各 IIR 段の分母は：

$$1 - \alpha_k e^{-j\omega} = (1 - \alpha_k \cos\omega) + j\,\alpha_k \sin\omega$$

各段の実部・虚部

$H_k(e^{j\omega}) = \frac{\beta_k}{1 - \alpha_k e^{-j\omega}}$ の実部と虚部を分離すると：

$$\operatorname{Re}_k(\omega) = \frac{\beta_k(1 - \alpha_k \cos\omega)}{1 - 2\alpha_k\cos\omega + \alpha_k^2}$$ $$\operatorname{Im}_k(\omega) = \frac{\beta_k\,\alpha_k \sin\omega}{1 - 2\alpha_k\cos\omega + \alpha_k^2}$$

$b_6$ + 直達項

$$\operatorname{Re}_{6+d}(\omega) = 0.115926\cos\omega + 0.5362$$ $$\operatorname{Im}_{6+d}(\omega) = -0.115926\sin\omega$$

全体の応答

$$\operatorname{Re}(\omega) = \sum_{k=0}^{5} \operatorname{Re}_k(\omega) + \operatorname{Re}_{6+d}(\omega)$$ $$\operatorname{Im}(\omega) = \sum_{k=0}^{5} \operatorname{Im}_k(\omega) + \operatorname{Im}_{6+d}(\omega)$$

振幅特性・位相特性

$$|H(\omega)| = \sqrt{\operatorname{Re}(\omega)^2 + \operatorname{Im}(\omega)^2}$$ $$\angle H(\omega) = \arctan\!\left(\frac{\operatorname{Im}(\omega)}{\operatorname{Re}(\omega)}\right)$$

ここで $\omega = 2\pi f / f_s$（$f_s$: サンプリング周波数）。

各段の振幅応答

個々の IIR 段の振幅応答は以下の閉じた形で表される：

$$|H_k(\omega)| = \frac{|\beta_k|}{\sqrt{1 - 2\alpha_k \cos\omega + \alpha_k^2}}$$

ただし全体の振幅応答は各段の振幅の単純な和ではない。位相の異なる複素数の和であるため、実部と虚部を別々に合算してから絶対値を取る必要がある。

周波数特性のプロット

$f_s = 44100\;\text{Hz}$ における Kellet フィルタの振幅特性と、理想的な $-3$ dB/oct からの偏差を以下に示す。

Paul Kellet フィルタの周波数特性 (fs=44.1kHz)。上段: 振幅特性と理想 -3dB/oct の比較。下段: 理想からの偏差。 — 図1: Kellet フィルタの周波数特性（$f_s = 44.1\;\text{kHz}$）。上段: 振幅特性（シアン）と理想 $-3$ dB/oct（赤破線）の比較。下段: 理想からの偏差。10 Hz–4 kHz で $\pm 0.1$ dB 以内。

10 Hz – 4 kHz: 偏差 $\pm 0.1$ dB 以内 — ほぼ完璧な近似
4 kHz – 10 kHz: 最大 $-1$ dB 程度 — わずかに減衰が大きい
10 kHz 以上: Nyquist に向かって急落（IIR の限界）

6つの1次フィルタのみで可聴帯域のほぼ全域をカバーしている、非常に優れた近似である。

3.5 サンプリング周波数依存性

Kellet フィルタの係数は固定であるため、サンプリング周波数 $f_s$ が変わると極周波数がすべてシフトし、近似の精度が変化する。極周波数は $f_p \approx f_s(1 - |\alpha_k|) / (2\pi)$ に比例するため：

表3: サンプリング周波数による極周波数のシフト
段	22.05 kHz	44.1 kHz	96 kHz	192 kHz
$b_0$	4 Hz	8 Hz	17 Hz	35 Hz
$b_1$	23 Hz	47 Hz	102 Hz	205 Hz
$b_2$	109 Hz	218 Hz	475 Hz	950 Hz
$b_3$	469 Hz	937 Hz	2039 Hz	4078 Hz
$b_4$	1580 Hz	3160 Hz	6878 Hz	13756 Hz
$b_5$	6180 Hz	12360 Hz	26900 Hz	53800 Hz

サンプリング周波数による Kellet フィルタの特性変化。22.05kHz, 44.1kHz, 96kHz, 192kHz の比較。 — 図2: サンプリング周波数による Kellet フィルタの特性変化。 $f_s = 44.1\;\text{kHz}$（シアン）で最良の近似を示す。 $f_s$ が高くなると極が高域へシフトし、低域のカバーが薄くなって偏差が増大する。

注意： $f_s = 96\;\text{kHz}$ や $192\;\text{kHz}$ では、極が高域にシフトし $-3$ dB/oct の近似が大きく劣化する。 Kellet 本人は 44.1 kHz 用の1セットしか示しておらず、他のサンプルレート用の係数は提供していない。

Lubomir によるサンプルレート別係数（2009年）

musicdsp.org の同ページに Lubomir が投稿した拡張版では、各段の目標極周波数 $f_k$ をサンプルレート帯域ごとに定義し、 $\alpha_k = e^{-2\pi f_k / f_s}$ で極係数を算出する方式が示されている。ただしゲイン係数 $\beta_k$ は提供されておらず、出力は各段の単純な加算 b0+b1+b2+b3+b4+b5+white-b6 となっている。 Kellet のような精密なゲイン調整が行われていないため、スペクトルの平坦性は Kellet オリジナルより劣る可能性がある。

表4: Lubomir によるサンプルレート別の目標極周波数 (Hz)
$f_s$ 帯域	$f_0$	$f_1$	$f_2$	$f_3$	$f_4$	$f_5$	$f_6$
$\leq 48.1\;\text{kHz}$	4753	4031	2785	1538	358	70	30
$44.8\text{k}$–$96\;\text{kHz}$	8227	8227	6389	3303	479	151	54
$96\text{k}$–$192\;\text{kHz}$	9212	8621	8555	8293	518	164	240
$\geq 192\;\text{kHz}$	10000	10000	10000	10000	545	142	212

高サンプルレートほど極周波数が密集しており、Lubomir 自身も「高サンプルレートではフィルタの品質が劣化する」と指摘している。これは 6 段の IIR フィルタという構造的な限界に起因するものであり、極の数を増やさない限り本質的な改善は難しい。

対策の選択肢

係数テーブル切替: 上記の Lubomir 方式で $f_s$ 帯域ごとに係数を切り替える
動的係数計算: 目標極周波数を固定し、$\alpha_k = e^{-2\pi f_k / f_s}$ で任意の $f_s$ に対応する
IFFT 法: 周波数領域で直接スペクトルを構成し、$f_s$ 依存性を完全に回避する（次節で解説）

3.6 IFFT 法 — サンプリング周波数非依存の生成

IIR フィルタのサンプリング周波数依存性を完全に回避する方法として、 周波数領域でスペクトルを直接構成し、逆 FFT する手法がある。

原理

パワースペクトル密度 $S(f) \propto 1/f$ を持つ信号の振幅スペクトルは $|X(f)| \propto 1/\sqrt{f}$ である。ここに一様ランダムな位相 $\theta_k \in [0, 2\pi)$ を与え、逆 FFT すると理想的なピンクノイズが得られる：

$$X[k] = \begin{cases} 0 & (k = 0) \\[4pt] \dfrac{1}{\sqrt{k}} \cdot e^{j\theta_k} & (k = 1, 2, \ldots, N/2 - 1) \\[4pt] \dfrac{1}{\sqrt{N/2}} & (k = N/2,\; \text{Nyquist}) \\[4pt] X^*[N-k] & (k = N/2+1, \ldots, N-1,\; \text{共役対称}) \end{cases}$$ $$x[n] = \text{IFFT}\{X[k]\}$$

共役対称の意味： $X[N-k] = X^*[k]$ を設定することで、逆 FFT の出力 $x[n]$ が実数となる。 DC ($k=0$) は 0 に設定し（ピンクノイズは直流成分を持たない）、 Nyquist ($k = N/2$) は実数とする。

周期性と必要な長さ

IFFT で生成された信号は周期 $N$ の周期信号であるため、ループ再生しても接続点で不連続が生じない。ただし人間の聴覚は雑音の繰り返しに対して意外と敏感であり、周期が短いと周期性を知覚する可能性がある。

表5: バッファ長と周期性の知覚（$f_s = 44100\;\text{Hz}$）
$N$	周期	メモリ（float）	周期性の知覚
$2^{17}$	$\approx 3.0\;\text{sec}$	0.5 MB	気づく人がいる
$2^{19}$	$\approx 11.9\;\text{sec}$	2 MB	ほぼ気づかない
$2^{20}$	$\approx 23.8\;\text{sec}$	4 MB	安全

$N = 2^{20}$（約24秒）で 4 MB — 現代のシステムでは問題にならないサイズである。

IIR フィルタ法との比較

項目	Kellet IIR フィルタ	IFFT 法
スペクトル精度	近似（$\pm 0.1$ dB @44.1kHz）	厳密（$-3$ dB/oct）
$f_s$ 依存性	あり（係数が $f_s$ 固定）	なし
メモリ使用量	$O(1)$（状態変数7個）	$O(N)$（バッファ全体）
初期化コスト	なし	$O(N \log N)$（FFT 1回）
サンプルあたりのコスト	乗算14回 + 加算8回	テーブル参照1回
非周期性	非周期（毎サンプル新たな乱数を入力）	周期的（$N$ サンプルで繰り返す）
リアルタイム適性	高い	高い（テーブル参照のみ）

C++ 実装例（IFFT 法）

// IFFT 法によるピンクノイズバッファ生成
const int N = 1 << 20;  // 2^20 ≈ 24秒 @44.1kHz
std::vector<std::complex<double>> spectrum(N);
std::mt19937 rng(42);  // シード固定で再現性確保
std::uniform_real_distribution<double> dist(0.0, 2.0 * M_PI);

// DC = 0
spectrum[0] = 0.0;

// 正の周波数: 振幅 1/√k, ランダム位相
for (int k = 1; k < N / 2; ++k) {
    double amp = 1.0 / std::sqrt((double)k);
    double phase = dist(rng);
    spectrum[k] = std::polar(amp, phase);
}

// Nyquist (実数)
spectrum[N / 2] = 1.0 / std::sqrt((double)(N / 2));

// 共役対称 → 実数出力を保証
for (int k = 1; k < N / 2; ++k)
    spectrum[N - k] = std::conj(spectrum[k]);

// 逆 FFT → 時間領域信号
std::vector<double> buffer(N);
ifft(spectrum.data(), buffer.data(), N);

// ピーク正規化
double peak = *std::max_element(buffer.begin(), buffer.end(),
    [](double a, double b){ return std::abs(a) < std::abs(b); });
double norm = 1.0 / std::abs(peak);
for (auto& s : buffer) s *= norm;

// 使用時: buffer[n % N] でループ再生

FFT ライブラリ： 上記の ifft() は標準ライブラリには含まれない。実装には FFTW、 KissFFT、または各フレームワーク付属の FFT（JUCE の juce::dsp::FFT など）を使用する。

任意の色ノイズへの拡張

IFFT 法の大きな利点は、振幅スペクトルを $|X[k]| \propto 1/k^{\alpha/2}$ とするだけで任意の $\alpha$ を持つ色付きノイズを同一の手法で生成できることである。ピンク ($\alpha = 1$)、ブラウン ($\alpha = 2$)、ブルー ($\alpha = -1$)、バイオレット ($\alpha = -2$) のいずれも統一的に扱える。

3.7 シェルビング型フィルタの縦続接続法

Kellet フィルタが並列合成であるのに対し、 シェルビング型フィルタを縦続接続して $-3$ dB/oct 特性を得る方法がある。初期値をオクターブ間隔のシェルビング特性から構成し、非線形最適化によって高精度な近似を実現する。

基本的な考え方

高域で $-3$ dB 減衰するシェルビング型フィルタを 11 段用意し、各段のカットオフ周波数を Nyquist 周波数の $1/2, 1/4, 1/8, \ldots$ とオクターブごとに配置する。これらを縦続接続すると、オクターブ上がるごとに $-3$ dB のシェルビング特性が 1 段分ずつ追加されるため、全体として概ね $-3$ dB/oct のスロープが得られる。

ただし、シェルビングフィルタの遷移帯域幅が有限であるため、このままでは高域の近似誤差が大きい。そこで初期値から出発して非線形最適化を行い、 20–20,000 Hz の範囲で $f^{-1/2}$ 特性に対する近似精度を高める。

最適化手法

非線形最適化には Hooke-Jeeves の直接探索法と Nelder-Mead のシンプレックス法を交互に適用する。どちらか一方ではローカル・ミニマムに陥りやすいため、二つの手法を交互に用いることで脱出しやすくしている。

フィルタ構成

図3 の 1 次 IIR フィルタを 11 段縦続接続して構成する。各段の伝達関数は：

$$H_k(z) = \frac{a_{0,k} + a_{1,k}\,z^{-1}}{1 + b_{1,k}\,z^{-1}} \quad (k = 1, 2, \ldots, 11)$$

全体の伝達関数は各段の積となる：

$$H(z) = \prod_{k=1}^{11} H_k(z)$$

1次IIRフィルタのブロック図。入力 x[n] に係数 a0, a1 を乗じ、出力 y[n] のフィードバックに係数 -b1 を乗じて加算する。 — 図3: 1 次 IIR フィルタ（直接形 I）のブロック図

フィルタ係数

サンプリング周波数 44.1 kHz 時の最適化された係数を以下に示す。

表6: シェルビング型縦続接続フィルタの係数（$f_s = 44.1$ kHz）
段	$a_0$	$a_1$	$b_1$
1	$1.227547$	$-1.227741$	$-0.998119$
2	$0.706739$	$-0.704978$	$-0.998992$
3	$0.707316$	$-0.704341$	$-0.998081$
4	$0.709331$	$-0.698912$	$-0.991347$
5	$0.710148$	$-0.690184$	$-0.979240$
6	$0.713537$	$-0.672923$	$-0.959506$
7	$0.711876$	$-0.632674$	$-0.921737$
8	$0.689138$	$-0.552799$	$-0.848287$
9	$0.647217$	$-0.363415$	$-0.718600$
10	$0.960137$	$-0.057957$	$-0.325561$
11	$0.738759$	$0.350674$	$0.421166$

20 Hz でゲインが 1 になるよう、1 段目の $a_0, a_1$ で調整したため、この段のみ係数の絶対値が 1 を超えている。固定小数点で実現する場合は、ゲインを全段に分散すべきである。

周波数特性

最適化後の振幅特性と理想 $-3$ dB/oct からの偏差を図4 に示す。

20–20,000 Hz の範囲で $\pm 0.02$ dB 以内の近似精度が得られている。 Kellet フィルタ（6 段並列、$\pm 0.1$ dB）と比べて 5 倍以上高精度である。

Kellet フィルタとの比較

項目	Kellet（6 段並列）	シェルビング縦続（11 段）
構造	1 次 IIR 並列合成 + FIR 項	1 次 IIR 縦続接続
段数	6 段 + 遅延項	11 段
近似精度 @44.1 kHz	$\pm 0.1$ dB（10 Hz–4 kHz）	$\pm 0.02$ dB（20 Hz–20 kHz）
設計方法	手動チューニング	非線形最適化（Hooke-Jeeves + シンプレックス）
サンプルあたりの計算量	乗算 14 回 + 加算 8 回	乗算 33 回 + 加算 22 回
$f_s$ 依存性	あり（係数固定）	あり（係数固定）

用途に応じた使い分け： Kellet フィルタは計算コストが低く、心地よい揺らぎの生成やサウンドデザインに向く。シェルビング縦続接続法は精度が高く、音響測定器など高精度が求められる場面に適している。

3.8 2 次 IIR 縦続接続法

3.7 節のシェルビング型フィルタ（1 次 IIR）を 2 段ずつペアリングして 2 次 IIR（biquad）セクションにまとめ、 $L_p$ ノルム・ホモトピー法と交互最適化を組み合わせることで、ほぼ等リップルな高精度近似を実現した。

設計手法

初期値の構成: 3.7 節で得た 11 段の 1 次 IIR を 2 段ずつ畳み込んで 5 個の 2 次セクションにまとめ、残り 1 段を退化した 2 次セクション（$b_2 = a_2 = 0$）として扱う。計 6 セクション、フィルタ次数 12。
$L_p$ ノルム・ホモトピー法: 評価関数に $L_p$ ノルムを用い、$p$ を段階的に $2 \to 4 \to 8 \to \cdots \to 1024$ と増加させる。 $$\min_c \left(\frac{1}{N}\sum_{i=1}^{N} |e_i(c)|^p\right)^{1/p}$$
- $p = 2$: 二乗誤差の最小化に相当し、目的関数が滑らかなため大域的な最適解の谷を見つけやすい
- $p \to \infty$: 最大誤差の最小化（minimax）に近づき、ピーク誤差の等リップル化が進む
- 前の $p$ での解を次の $p$ の初期値にすることで、滑らかに minimax 最適解へ遷移する
- $p = 2 \to 1024$ のサイクルを複数回繰り返すと、 2 周目以降の $p = 2$ で再び滑らかな目的関数から探索し直すため、さらに良い解の谷を発見できる
交互最適化（各 $p$ の段階で実施）:
- 分子係数 $(b_0, b_1, b_2)$ を固定して分母係数 $(a_1, a_2)$ を最適化（安定性制約付き）
- 分母係数を固定して分子係数を最適化
- これを繰り返す（Nelder-Mead シンプレックス法）
全 30 変数を同時に最適化するとローカル・ミニマムに陥りやすいが、分子（18 変数）と分母（12 変数）に分割することで収束が安定する。
等リップル仕上げ: $L_p$ ホモトピーで minimax の谷に入った後、ペナルティ付きコスト関数 $$J(c) = \|e\|_\infty + \lambda\bigl(\max_k |e_k| - \min_k |e_k|\bigr)$$ で $\lambda$ を $20 \to 0.5$ に減衰させながら最適化する。第 2 項がリップルの不均一度を罰するため、 minimax 誤差を維持しつつリップル振幅を等しくする効果がある。

なぜ $L_p$ ホモトピーが有効か： $L_\infty$（minimax）の目的関数は非滑らかで局所解が多い。一方 $L_2$ は滑らかで凸に近いため、良い谷を見つけやすい。 $p$ を連続的に上げることで、$L_2$ 最適解の近傍にある $L_\infty$ 最適解へ滑らかに移行できる。この手法は数値最適化におけるホモトピー連続法の一種である。

フィルタ構成

各セクションの伝達関数は：

$$H_k(z) = \frac{b_{0,k} + b_{1,k}\,z^{-1} + b_{2,k}\,z^{-2}}{1 + a_{1,k}\,z^{-1} + a_{2,k}\,z^{-2}} \quad (k = 1, 2, \ldots, 6)$$

全体の伝達関数は各セクションの積：

$$H(z) = \prod_{k=1}^{6} H_k(z)$$

フィルタ係数

サンプリング周波数 44.1 kHz 時の最適化された係数を以下に示す。

表7: 2 次 IIR 縦続接続フィルタの係数（$f_s = 44.1$ kHz）
段	$b_0$	$b_1$	$b_2$	$a_1$	$a_2$
1	$0.86753350$	$-1.73305332$	$0.86551919$	$-1.99717354$	$0.99717496$
2	$0.50181474$	$-0.99410860$	$0.49232374$	$-1.98995367$	$0.98996914$
3	$0.50618383$	$-0.96992475$	$0.46453372$	$-1.94139412$	$0.94222035$
4	$0.48891831$	$-0.82787107$	$0.34973154$	$-1.77198269$	$0.78426487$
5	$0.60541780$	$-0.37142054$	$0.02159458$	$-1.02405979$	$0.22260582$
6	$0.76149420$	$0.35743019$	$-0.00468860$	$0.40589582$	$-0.01116303$

すべての極は実数軸上にあり、$|z| < 1$ を満たすため安定である。

周波数特性

$L_p$ ホモトピー法による最適化後の振幅特性と、交互最適化のみの結果との比較を図5 に示す。

$L_p$ ホモトピー法で minimax の谷に入った後、等リップルペナルティ付きコスト関数 $J(c) = \|e\|_\infty + \lambda(\max |e_k| - \min |e_k|)$ で仕上げることで、最大誤差 $\pm 0.0075$ dB と等リップル比 0.80 を両立した。交互最適化のみ（$\pm 0.011$ dB）に対して 32% の誤差削減である。誤差曲線のリップルはほぼ等振幅であり、チェビシェフ近似の等リップル最適解にほぼ到達していることを示唆している。

最適化結果

$L_p$ ホモトピー法を 5 サイクル（$p = 2 \to 1024$ を 5 周）実行し、等リップルペナルティ（$\lambda = 20 \to 0.5$）で仕上げた。最適化の収束過程と最終結果を以下に示す。

表7b: 6 段 biquad の最適化収束過程
サイクル	$p = 2$	$p = 1024$	等リップル仕上げ後
1	$0.0121$ dB	$0.0078$ dB	—
2	$0.0120$ dB	$0.0078$ dB	—
3	$0.0122$ dB	$0.0075$ dB	—
4	$0.0137$ dB	$0.0076$ dB	—
5	$0.0126$ dB	$0.0075$ dB	$0.0075$ dB

表7c: 6 段 biquad のリップルピーク一覧
ピーク #	周波数 [Hz]	誤差 [dB]
1	24	$+0.00598$
2	36	$-0.00597$
3	63	$+0.00597$
4	116	$-0.00597$
5	222	$+0.00597$
6	442	$-0.00598$
7	1,179	$+0.00645$
8	3,639	$-0.00749$
9	6,839	$+0.00679$
10	11,307	$-0.00748$
11	15,899	$+0.00749$
12	18,949	$-0.00749$

12 ピークすべてで符号が $+, -, +, -, \ldots$ と交代しており、チェビシェフの交替定理が要求する条件を満たしている。ただし低域側（20–500 Hz）の 6 ピークが $\pm 0.006$ dB 前後であるのに対し、高域側（1–20 kHz）では $\pm 0.0075$ dB とやや大きく、等リップル比は 0.80 にとどまる。 7 段に増やすことでリップル振幅の均一性がさらに向上する（3.9 節参照）。

各手法の比較

表8: ピンクノイズフィルタの手法比較
手法	構造	次数	最大誤差	乗算回数/サンプル
Kellet（3.2 節）	1 次 IIR $\times$ 6 並列	6	$\pm 0.1$ dB	14
シェルビング縦続（3.7 節）	1 次 IIR $\times$ 11 縦続	11	$\pm 0.024$ dB	33
2 次 IIR 縦続（本節）	2 次 IIR $\times$ 6 縦続	12	$\pm 0.0075$ dB	30
7 段 biquad 縦続（3.9 節）	2 次 IIR $\times$ 7 縦続	14	$\pm 0.0058$ dB	35
IFFT 法（3.6 節）	テーブル参照	—	厳密	1（参照のみ）

交互最適化の利点： 全パラメータを同時に最適化すると 30 変数の非線形最適化となりローカル・ミニマムに陥りやすい。分子（零点）と分母（極）を交互に最適化すると、各ステップが 18 変数または 12 変数の小規模な問題となり、収束が安定する。音響フィルタ設計における Steiglitz-McBride 反復法と同様の考え方である。

3.9 2 次 IIR 縦続接続法（7 段、14 次）

3.8 節の 6 段 biquad（12 次）では符号交代は達成されたが、等リップル比が 0.80 にとどまり、リップル振幅の均一性が不十分であった。 7 段目（14 次）を追加して自由度を増やすことで、 等リップル比 0.96 のより均一な等リップル近似を達成した。

設計

3.8 節の最適化済み 6 段係数を初期値とし、7 段目を通過特性（$H_7(z) = 1$）で初期化して同じ $L_p$ ホモトピー＋等リップル仕上げを適用した。最適化の結果、7 段目は Nyquist 付近の応答を補正するセクションとして機能している。

フィルタ係数

表9: 7 段 biquad フィルタの係数（$f_s = 44.1$ kHz）
段	$b_0$	$b_1$	$b_2$	$a_1$	$a_2$
1	$0.86755796$	$-1.73308991$	$0.86553203$	$-1.99715810$	$0.99715893$
2	$0.50172008$	$-0.99397131$	$0.49228359$	$-1.98991592$	$0.98992974$
3	$0.50648560$	$-0.97032338$	$0.46463933$	$-1.94062766$	$0.94143996$
4	$0.48911181$	$-0.82950565$	$0.35114963$	$-1.77419462$	$0.78624604$
5	$0.61893348$	$-0.38406685$	$0.02457179$	$-1.07965645$	$0.26342630$
6	$0.74407507$	$0.35654882$	$-0.00001299$	$0.60711783$	$0.08000378$
7	$1.00046081$	$-0.00000020$	$0.00000672$	$-0.14453871$	$0.03922527$

周波数特性

12 個のリップルすべてで符号が $+, -, +, -, \ldots$ と厳密に交代しており、チェビシェフの交替定理が要求する条件を満たしている。 6 段でも符号交代は達成されているが、等リップル比は 0.80 にとどまる。 7 段では等リップル比が 0.96 に向上し、リップル振幅がより均一になっている。

6 段との比較

項目	6 段（12 次）	7 段（14 次）
最大誤差	$\pm 0.0075$ dB	$\pm 0.0058$ dB
等リップル比	0.798	0.962
符号交代	完全	完全
リップル数	12	12
乗算回数/サンプル	30	35

等リップル近似と交替定理： チェビシェフの交替定理によれば、$N$ 次の最良近似では誤差曲線が少なくとも $N + 2$ 個の交替点（符号が交代する極値）を持つ。 14 次フィルタで 12 個の交替リップルが得られたことは、この理論限界に近い最適解であることを示唆している。

段数による精度の変化

段数を変えて同じ $L_p$ ホモトピー＋等リップル最適化を適用した結果を以下にまとめる。 5 段（10 次）では完全等リップル（ratio = 1.000）を達成したが、精度は $\pm 0.141$ dB にとどまる。段数を増やすごとに精度が向上し、7 段（14 次）では $\pm 0.006$ dB と Kellet フィルタの約 17 倍の精度を実現する。

表11: biquad 段数と近似精度の比較（$f_s = 44.1$ kHz, 20 Hz–20 kHz）
段数	次数	最大誤差	等リップル比	符号交代	ピーク数	乗算/サンプル
5	10	$\pm 0.141$ dB	1.000	完全	6	25
6	12	$\pm 0.0075$ dB	0.798	完全	12	30
7	14	$\pm 0.0058$ dB	0.962	完全	12	35

5段biquadの誤差特性。6ピークが完全に同一振幅で符号交代する等リップル特性。6段・7段との比較。 — 図7: 5 段 biquad（10 次）の誤差特性。 6 ピークが完全に同一振幅（$\pm 0.141$ dB）で符号交代しており、理論的な等リップル最適解に到達している。 6 段（緑破線）・7 段（橙点線）と比較すると、段数が増えるほど誤差が急速に減少する。

5 段で完全等リップル（ratio = 1.000）が得られた理由は、10 次の自由度に対してリップル数が 6（= $\lfloor N/2 \rfloor + 1$）と十分少なく、すべてのリップル振幅と符号を制御するのに十分な極・零点があるためである。 6 段・7 段でも符号交代は達成されているが、リップル数が 12 に増加するため振幅の均一性は低下する（等リップル比: 6 段 0.80、7 段 0.96）。実用上は 7 段の $\pm 0.006$ dB が最も高精度な選択肢である。

4. ブラウンノイズ（$1/f^2$ ノイズ）

ブラウンノイズ（ブラウニアンノイズ、レッドノイズとも呼ばれる）は、ホワイトノイズの累積和（ランダムウォーク）として生成される。ロバート・ブラウンのブラウン運動に由来する。

生成: $x[n] = x[n-1] + w[n]$（$w[n]$: ホワイトノイズ）
パワースペクトル密度: $S(f) \propto 1/f^2$（$-6$ dB/oct）
用途: 地震波モデリング、リラクゼーション音源

IFFT 法で生成する場合は、振幅スペクトルを $|X[k]| \propto 1/k$ に設定すればよい（パワースペクトル密度が $1/k^2$ に対応する）。

5. 疑似乱数生成器

ディジタルノイズの品質は疑似乱数生成器（PRNG）の性能に依存する。高品質な PRNG はノイズ生成の基盤となる。

表10: 主要な疑似乱数生成器
アルゴリズム	周期	特徴
メルセンヌ・ツイスタ (MT19937)	$2^{19937}-1$	長周期、623次元均等分布
xoshiro256**	$2^{256}-1$	高速、良好な統計特性
線形合同法 (LCG)	$2^{32}$ 程度	単純高速、品質は低い
LFSR	$2^n - 1$	ハードウェア実装向き

実装上の注意： C 標準ライブラリの rand() は LCG ベースでスレッドセーフでなく、品質も低い。オーディオ用途では std::mt19937 や JUCE の juce::Random を推奨する。

6. 応用

音響測定 — ピンクノイズによるスピーカー・ルームの周波数応答測定
ディザリング — 量子化歪みの分散にブルーノイズやホワイトノイズを使用
シミュレーション — モンテカルロ法における確率的モデリング
通信 — チャネルノイズのシミュレーション（AWGN チャネル）
音楽・サウンドデザイン — シンセサイザーの音源としてのノイズ波形
インパルス応答測定 — TSP（時間引き伸ばしパルス）と組み合わせた室内音響計測

7. 参考資料

Paul Kellet, "Pink noise filter" — musicdsp.org（Kellet フィルタの原典）
Phil Burke, "DSP Generation of Pink Noise" — firstpr.com.au（各手法の包括的解説）
"1st and 2nd order pink noise filters" — musicdsp.org
Colors of noise — Wikipedia
Pink noise — Wikipedia
White noise — Wikipedia
Brownian noise — Wikipedia
Box–Muller transform — Wikipedia

ノイズ生成

1. 色付きノイズの分類

2. ホワイトノイズ

統計的性質

生成方法

Box-Muller 法

3. ピンクノイズ（$1/f$ ノイズ）

オクターブ等パワー性の証明

主要な生成手法

3.1 理想的なピンクノイズフィルタ

3.2 Paul Kellet の IIR フィルタ

差分方程式

フィルタ係数

C++ 実装例

3.3 伝達関数 $H(z)$ の導出

各段の伝達関数

$b_6$ の伝達関数

全体の伝達関数

3.4 周波数特性 $H(\omega)$ の導出

各段の実部・虚部

$b_6$ + 直達項

全体の応答

振幅特性・位相特性

各段の振幅応答

周波数特性のプロット

3.5 サンプリング周波数依存性

Lubomir によるサンプルレート別係数（2009年）

対策の選択肢

3.6 IFFT 法 — サンプリング周波数非依存の生成

原理

周期性と必要な長さ

IIR フィルタ法との比較

C++ 実装例（IFFT 法）

任意の色ノイズへの拡張

3.7 シェルビング型フィルタの縦続接続法

基本的な考え方

最適化手法

フィルタ構成

フィルタ係数

周波数特性

Kellet フィルタとの比較

3.8 2 次 IIR 縦続接続法

設計手法

フィルタ構成

フィルタ係数

周波数特性

最適化結果

各手法の比較

3.9 2 次 IIR 縦続接続法（7 段、14 次）

設計

フィルタ係数

周波数特性

6 段との比較

段数による精度の変化

4. ブラウンノイズ（$1/f^2$ ノイズ）

5. 疑似乱数生成器

6. 応用

7. 参考資料

関連項目