光学設計ノーツ 53 ver.1.1
最適化とは、最小二乗法について
前回説明させていただいた様に、ニュートン-ラフソン法は収束も非常に早く、原理的に
も理解しやすく有用な手法であるが、エンジニアリング的な分野では、繰り返し実行されな
ければならない、ヘッセ行列の計算、つまり 2次微分の計算に困難が発生する。この困難を
克服するために、ヘッセ行列の代わりの 2次微分を必要としない適当な行列 Bを用いる準
ニュートンと呼ばれる手法も存在する。しかし、この代替えのヘシアンに相当する行列も、
関数が複雑になれば、或いは関数自体を得ることが不可能な場合には、利用することが困難
になる。今回はそうした場合に用いられる最小二乗法について触れさせて戴きたい。
n
11212111 bxaxaxa nn
=
+
+
+
L
22222121 bxaxaxa nn
=
+
+
+
L 1
M
mnmnmm
bxaxaxa
=
+
+
+
L
2211
行列で表現すれば、
=
mn
nmmm
n
n
b
b
b
x
x
x
aaa
aaa
aaa
MM
L
MMMM
L
L
2
1
2
1
,2,1,
,22,21,2
,12,11,1
1B
A、ベクトルBを用いて表現すれば、
B
Ax
=
1C
であるが、n<m
(1)
することを言う。
分かりやすい例では、3次元空間を考えると、そこに独立の(線形独立した)
2
3 3本が同一平面上にあるとき、
場合には、n<m
2本のベクトルの
n<m の場合に(1)
ないというのはこうした意味である。
n<m
3
3
ある平面を探ろうとすることである。(1)
くことに相当する。
11212111
bxaxaxa
nn
+
+
+
L
22222121
bxaxaxa
nn
+
+
+
L 2
M
mnmnmm
bxaxaxa
+
+
+
L
2211
( )
2
12211
=
+++= m
iininii bxaxaxa L
φ
3
として、ある解
x
に( 1 2 和(
2乗和)φを考えるとき、
φ
3b
となる、ベクトル x
、こ 、φ 、(3)式を変数で微分し
0
1
=
x
0
2
=
x
4
M
0=
n
x
(3)
xj
で偏微分すれば、
( )
ij
m
iininii
j
abxaxaxa
x
=
+++=
12211
2L
φ
φ
+++=
=== = i
m
iij
m
iinijn
m
i
m
iiijiij
baaaxaaxaax
111 1 2211
2L
5
(5) 0
=
=
=
=
===
=
==
===
i
m
iin
i
m
ii
i
m
ii
n
in
m
iini
m
iini
m
iin
in
m
ii
i
m
iii
m
ii
in
m
iii
m
iii
m
ii
ba
ba
ba
x
x
x
aaaaaa
aa
aaaa
aaaaaa
1
12
11
2
1
1
2
1
1
1
12
2
121
12
112
111
11
M
M
L
MMMM
L
L
6
この(6)
1C 3b)式は
= 2
bAx
φ
7
(
)
(
)
bAxbAx
=
φ
(
)
(
)
(
)
(
)
bbAxbbAxAxAx
+
=
(
)
(
)
(
)
bbbAxAxAx
+
=
2
8
さらに、ここに、
(
)
(
)
yAxyAx T
=
9
なる性質があるので、
(
)
(
)
(
)
bbbAxAxAx += TT 2
φ
(
)
(
)
2
2bxbAAxAx +=
TT
10
また、行列の偏微分の性質、
(
)
AxAxx 2
=
11
(
)
AxA
=
12
より、(10) x
bAAxA TT 22 =
φ
13
(6)
bAAxA
TT
= 14
として表すことが出来る。
x
の測定値が
y
姿
y
=
ax
(15)
xの時の、測定値を yとすれば、
関数(15)
ax-y
である。よってこれまでの通り誤差の 2乗和、φを考えると、
= 

(16)
この量を最小にするように
a
を決めたい訳である。そのために、(16)式を
a
で微分してみる
と、


=2

(17)
この値が 0になる極値を探せば



= 0
(18)
として解は、
=
=1
2
=1
(19)
となる。或いは以下の様にも表せる(右肩の
T
は転置行列を表す。
=
(20)
これで、係数
a
を決め、関数が決められる。
ここで、
x
[1, 2, 3, 4, 5 ,6 , 7, 8, 9, 10]
の値の時の測定値 y
y
=[0.7, 2.1 , 3, 4.8, 5.6, 6, 6.9, 8.2, 9.5, 11]
として(19)式を計算してみると、
a
1.0558 となり図 1の様にフィッティングされる。
1 フィッティング 1
2 フィッティング 2
また、
y
y
[1.3, 2.2, 3, 5.2, 5.6, 6, 6.5, 8.2, 9.5, 9.7]
とした場合は
a
1.0210 となり図 2の様にフィッティングされる。
1) 安達忠次:線形代数と解析幾何(森北出版、東京、1976)
2) 金谷健一:これなら分かる最適化数学(共立出版、東京、2008)
3) 今野浩、山下浩:非線形計画法(日科技連、東京、1978)
4) 松山実:基礎数値解析(昭晃堂、東京、1998)