高校数学の話題

黒木玄 (Gen Kuroki)

2018-08-15~2019-04-01

このノートでは高校の数学の教科書にあるような話題を扱い, その数学的背景について解説する.

タイポや自明な誤りは自分で訂正して読むこと. 本質的な誤りがあれば著者に教えて欲しい.

このファイルは次の場所できれいに閲覧できる:

このノートの想定読者は大学である程度を数学を学んだで人で高校で習った数学について見直したい人達である.

このファイルはJulia言語カーネルの Jupyter notebook である. 自分のパソコンにJulia言語をインストールしたい場合には

を参照せよ. このファイルは JuliaBox でも使用できるかもしれない. このファイル中のJulia言語のコードを理解できれば, Julia言語からSymPyを用いた数式処理や数値計算の結果のプロットの仕方を学ぶことができる.

$ \newcommand\eps{\varepsilon} \newcommand\ds{\displaystyle} \newcommand\Z{{\mathbb Z}} \newcommand\R{{\mathbb R}} \newcommand\C{{\mathbb C}} \newcommand\T{{\mathbb T}} \newcommand\QED{\text{□}} \newcommand\root{\sqrt} \newcommand\bra{\langle} \newcommand\ket{\rangle} \newcommand\d{\partial} \newcommand\sech{\operatorname{sech}} \newcommand\cosec{\operatorname{cosec}} \newcommand\sign{\operatorname{sign}} \newcommand\sinc{\operatorname{sinc}} \newcommand\arctanh{\operatorname{arctanh}} \newcommand\sn{\operatorname{sn}} \newcommand\cn{\operatorname{cn}} \newcommand\cd{\operatorname{cd}} \newcommand\dn{\operatorname{dn}} \newcommand\real{\operatorname{Re}} \newcommand\imag{\operatorname{Im}} \newcommand\Li{\operatorname{Li}} \newcommand\np[1]{:\!#1\!:} \newcommand\PROD{\mathop{\coprod\kern-1.35em\prod}} \newcommand{\stirlingsecond}[2]{\genfrac{\lbrace}{\rbrace}{0pt}{}{#1}{#2}} $

目次

In [1]:
using Printf
const e = 
linspace(start, stop, length) = range(start, stop=stop, length=length)
using Base64

using Plots
pyplot()
#gr(); ENV["PLOTS_TEST"] = "true"
#clibrary(:colorcet)
#clibrary(:misc)

function pngplot(P...; kwargs...)
    sleep(0.1)
    pngfile = tempname() * ".png"
    savefig(plot(P...; kwargs...), pngfile)
    showimg("image/png", pngfile)
end
pngplot(; kwargs...) = pngplot(plot!(; kwargs...))

showimg(mime, fn; scale="") = open(fn) do f
    base64 = base64encode(f)
    if scale == ""
        display("text/html", """<img src="data:$mime;base64,$base64">""")
    else
        display("text/html", """<img src="data:$mime;base64,$base64" width="$scale">""")
    end
end

using SymPy
#sympy[:init_printing](order="lex") # default
#sympy[:init_printing](order="rev-lex")

const latex = sympy[:latex]
using LaTeXStrings

using SpecialFunctions
using QuadGK
using Elliptic.Jacobi: cd, sn

三角函数の加法定理

三角函数の加法定理:

$$ \begin{aligned} & \cos(x+y) = \cos x\;\cos y - \sin x\;\sin y, \\ & \sin(x+y) = \cos x\;\sin y + \sin x\;\cos y. \qquad \QED \end{aligned} $$

この公式を認めて使えば, 三函数に関する他の多くの公式が導かれることは知っているだろう. だからよく

三角函数の加法定理だけは覚えておいて, 他の公式はそれから導けばよい.

というような教え方がされている場合がある. しかし, この教え方は数学の理解という観点からはひどく中途半端である. なぜならば, 三角函数の加法定理自体がそう難しくない結果だからである. しかもその本質は中学校レベルの幾何の問題に過ぎない.

三角函数の加法定理は簡単に導けるので, 三角函数の加法定理さえ覚える必要はない.

三角函数の加法定理の導出は易しい

以下の図を見て欲しい.

In [2]:
showimg("image/jpeg", "images/trigonometric1.jpg", scale="40%")

縦の青の点線が黒線と重なっていることを嫌うなら次のように図を描けばよい.

In [3]:
showimg("image/jpeg", "images/trigonometric2.jpg", scale="40%")

三角函数の加法定理の導出は中学校レベル

三角函数 $\cos\theta$, $\sin\theta$ の正式な定義のためには, まず弧度法の意味での角度を定義し, 弧度法の意味ので角度の函数としてそれらを定義しなければいけなくなる. 角度の測り方を固定しない場合には $\cos(a\theta)$, $\sin(a\theta)$ のように角度の測り方の不定性によって角度に定数倍 ($a$ 倍)の違いが生じる.

しかし, $\cos\theta$, $\sin\theta$ の代わりに, $c(\theta)=\cos(a\theta)$, $s(\theta)=\sin(a\theta)$ を使っても, 三角函数の加法定理の形は変わらない:

$$ c(x+y) = c(x)c(y)-s(x)s(y), \quad s(x+y)=c(x)s(y)+s(x)c(y). $$

このことから, 三角函数の加法定理を理解するためには弧度法による角度の定義を知っている必要がないことがわかる.

以下の図の問題を見て欲しい. それは実質的に三角函数の加法定理を示せという内容の問題である. そのことから, $\cos$, $\sin$ という記号を使わずに, 三角函数の加法定理と同等のことを述べることができることがわかる. そして, その問題の解答は完全に中学校数学の範囲内の議論で可能である.

In [4]:
showimg("image/jpeg", "images/trigonometric3.jpg", scale="80%")

三角函数の加法定理は複数の方法で得られる

自力で何も知らない状態から三角函数の加法定理を証明しようとすれば, 図の描き方に複数の選択肢があることに気付く. 実際にやってみればわかるようにどのように図を描いても, 結果的に三角函数の加法定理が得られる. 要するに, 三角函数の加法定理の証明のためには, 知らなければできそうもないテクニカルな議論をする必要はなく, どのように図を描いても証明できる. ああやっても証明できるし, こうやっても証明できる. そのようなことに気付けば, 三角函数の加法定理は真に易しい結果であることを納得できるはずである.

In [5]:
showimg("image/jpeg", "images/trigonometric4.jpg", scale="80%")

$\sin$ の倍角の公式はこれの右上の図を使うと容易に証明可能である. 右上の図で $\alpha=\beta$ のとき $a=1$ となるので,

$$\sin(2\alpha)=\cos\alpha\,(\sin\alpha + 1 \sin\alpha)=2\cos\alpha\sin\alpha.$$

三角函数の加法定理と内積の関係

三角函数の加法定理:

$$ \begin{aligned} & \begin{cases} \cos(\alpha+\beta) = \cos\alpha\,\cos\beta - \sin\alpha\,\sin\beta, \\ \cos(\alpha-\beta) = \cos\alpha\,\cos\beta + \sin\alpha\,\sin\beta, \\ \end{cases} \\ & \begin{cases} \sin(\alpha+\beta) = \sin\alpha\,\cos\beta + \cos\alpha\,\sin\beta, \\ \sin(\alpha-\beta) = \sin\alpha\,\cos\beta - \cos\alpha\,\sin\beta. \\ \end{cases} \end{aligned} $$

これらを成分がを極座標された2つの2次元ベクトル

$$ \vec{a} = \begin{bmatrix} a\\ c\\ \end{bmatrix} = \begin{bmatrix} \|\vec{a}\|\cos\alpha \\ \|\vec{a}\|\sin\alpha \\ \end{bmatrix}, \quad \vec{b} = \begin{bmatrix} b\\ d\\ \end{bmatrix} = \begin{bmatrix} \|\vec{b}\|\cos\beta \\ \|\vec{b}\|\sin\beta \\ \end{bmatrix} $$

に適用してみよう. これらの対応する成分の積の和を計算すると $\cos$ の加法定理より,

$$ ab+cd = \|\vec{a}\|\|\vec{b}\|(\cos\alpha\,\cos\beta+\sin\alpha\,\sin\beta) = \|\vec{a}\|\|\vec{b}\|\cos(\beta-\alpha) $$

となる. これで, 2つの2次元ベクトルの対応する成分の和は2つのベクトルのあいだの角度の $\cos$ の $\|\vec{a}\|\|\vec{b}\|$ 倍になることがわかった. 我々はこれを「内積」と呼ぶのであった.

次に $ad-bc$ を計算してみよう:

$$ ad-bc = \|\vec{a}\|\|\vec{b}\|(\cos\alpha\,\sin\beta-\sin\alpha\,\cos\beta) = \|\vec{a}\|\|\vec{b}\|\sin(\beta-\alpha). $$

これの絶対値は2つのベクトルを辺とする平行四辺形の面積である. 我々は $ad-bc$ を行列

$$ \begin{bmatrix} a & b \\ c & d \\ \end{bmatrix} $$

の行列式と呼んでいるのであった. $2\times2$ の行列式は平行四辺形の面積の $\pm1$ 倍という幾何学的意味を持っている. 2つの2次元ベクトルの外積を $ad-bc$ で定義することもできる.

このように, 三角函数の加法定理は2次元ベクトルの内積や $2\times 2$ の行列式(もしくは2次元ベクトルの外積)の幾何学的意味を記述している公式ともみなされる.

3次方程式と4次方程式の解法

高校数学レベルでの3次方程式と4次方程式の解法を解説する.

ある3次式の因数分解から3次方程式の解法へ

高校で次の因数分解の公式を習う:

$$ x^3+y^3+z^3 - 3xyz = (x+y+z)(x^2+y^2+z^2-xy-xz-yz). $$

1の原始3乗根を $\omega$ と書く: $\omega^2+\omega+1=0$,

$$ \omega = e^{\pm 2\pi i/3} = \frac{-1\pm\sqrt{3}\;i}{2}. $$

以下では, $\omega^2+\omega+1=0$ とそれから導かれる $\omega^3=1$, $\omega\ne 1$ のみを使う.

1の原始3乗根 $\omega$ を使うと上の因数分解の公式は

$$ x^3+y^3+z^3-3xyz = (x+y+z)(x+\omega y+\omega^2 z)(x+\omega^2 y+\omega z) $$

と書き直される. 最初の因数分解の公式の右辺の $-xy$, $-xz$, $-yz$ の係数 $-1$ は $\omega^2+\omega=-1$ によって再現される.

さらに, $p = yz$, $q=y^3+z^3$ とおくと, 上の因数分解の公式は

$$ x^3 -3px + q = (x+y+z)(x+\omega y+\omega^2 z)(x+\omega^2 y+\omega z) $$

と書き直される. この公式を使うと3次方程式の解の公式を作れる.

任意に与えられた $p$, $q$ に対して, $p=yz$, $q=y^3+z^3$ を満たす $y,z$ は以下のようにして求めることができる. $y^3 z^3=p^3$ と $y^3+z^3=q$ より

$$ \lambda^2 - q\lambda + p^3 = (\lambda - y^3)(\lambda - z^3). $$

ゆえに, 必要ならば $y,z$ の立場を交換すれば

$$ y^3 = \frac{q + \sqrt{q^2-4p^3}}{2}, \quad z^3 = \frac{q-\sqrt{q^2-4p^3}}{2} $$

が成立している. 右辺の3乗根を取れば $y,z$ も求まる:

$$ y = \sqrt[3]{\frac{q + \sqrt{q^2-4p^3}}{2}}, \quad z = \sqrt[3]{\frac{q-\sqrt{q^2-4p^3}}{2}}. $$

上の $x^3 -3px + q$ の因数分解の公式より, $x^3-3px+q=0$ の解はこの $y,z$ を使って,

$$ x = -y-z,\ -\omega y-\omega^2 z,\ -\omega^2 y-\omega z. $$

と表わされる. これは本質的に所謂Cardanoの公式(カルダノの公式)である.

問題: 以上の計算を確認し, さらに解の公式を実際に作ってみよ. $\QED$

解答略.

In [6]:
# 1の原始3乗根

x, y, z = symbols("x y z")
ω₃ = factor((-1+√Sym(-3))/2)
latexstring(raw"\ds ω =", latex(ω₃))
Out[6]:
$\ds ω =\frac{-1 + \sqrt{3} i}{2}$
In [7]:
# 因数分解の公式の確認

ω = symbols("ω")
f3_factored = (x+y+z)*(x+ω*y+ω^2*z)*(x+ω^2*y+ω*z)
f3 = simplify(f3_factored(ω=>ω₃))
latexstring(latex(f3_factored), "=", latex(f3))
Out[7]:
$\left(x + y + z\right) \left(x + y ω + z ω^{2}\right) \left(x + y ω^{2} + z ω\right)=x^{3} - 3 x y z + y^{3} + z^{3}$
In [8]:
pp = y*z
qq = y^3+z^3
latexstring("p=", latex(pp)) |> display
latexstring("q=", latex(qq)) |> display

p, q = symbols("p q")
latexstring(latex(x^3 - 3p*x + q), "=", latex((x^3 - 3pp*x + qq)))
$p=y z$
$q=y^{3} + z^{3}$
Out[8]:
$- 3 p x + q + x^{3}=x^{3} - 3 x y z + y^{3} + z^{3}$
In [9]:
# (m-y^3)(m-z^3) の係数

m = symbols("m")
f2_org = (m-y^3)*(m-z^3)
f2 = expand((m-y^3)*(m-z^3))
latexstring(latex(f2_org), "=", latex(f2)) |> display
c2 = coeffs(f2, m)
latexstring(raw"\text{coefficients:}\ ", latex(c2))
$\left(m - y^{3}\right) \left(m - z^{3}\right)=m^{2} - m y^{3} - m z^{3} + y^{3} z^{3}$
Out[9]:
$\text{coefficients:}\ \left[\begin{matrix}y^{3} z^{3}\\- y^{3} - z^{3}\\1\end{matrix}\right]$
In [10]:
# 2次方程式の解

p, q = symbols("p q")
equ = m^2-q*m+p^3
sol = factor.(solve(equ, m))
latexstring(latex(equ), "=0") |> display
latexstring(raw"\ds m = ", latex(sol[1]), ",", latex(sol[2]))
$m^{2} - m q + p^{3}=0$
Out[10]:
$\ds m = \frac{q - \sqrt{- 4 p^{3} + q^{2}}}{2},\frac{q + \sqrt{- 4 p^{3} + q^{2}}}{2}$
In [11]:
# 3次方程式の解が得られていることの確認

y = sol[2]^(Sym(1)/3)
z = p/y
X = -[
    y+z
    ω*y+ω^2*z
    ω^2*y+ω*z
]
equ = @. X^3 - 3p*X + q
res = @.(simplify((f->f(ω=>ω₃))(equ)))
for i in 1:3
    latexstring("x_{$i}^3-3px_{$i}+q=", latex(res[i])) |> display
end
latexstring(raw"\ds x_1 = ", latex(X[1])) |> display
latexstring(raw"\ds x_2 = ", latex(X[2])) |> display
latexstring(raw"\ds x_3 = ", latex(X[3])) |> display
$x_{1}^3-3px_{1}+q=0$
$x_{2}^3-3px_{2}+q=0$
$x_{3}^3-3px_{3}+q=0$
$\ds x_1 = - \frac{\sqrt[3]{2} p}{\sqrt[3]{q + \sqrt{- 4 p^{3} + q^{2}}}} - \frac{2^{\frac{2}{3}} \sqrt[3]{q + \sqrt{- 4 p^{3} + q^{2}}}}{2}$
$\ds x_2 = - \frac{\sqrt[3]{2} p ω^{2}}{\sqrt[3]{q + \sqrt{- 4 p^{3} + q^{2}}}} - \frac{2^{\frac{2}{3}} ω \sqrt[3]{q + \sqrt{- 4 p^{3} + q^{2}}}}{2}$
$\ds x_3 = - \frac{\sqrt[3]{2} p ω}{\sqrt[3]{q + \sqrt{- 4 p^{3} + q^{2}}}} - \frac{2^{\frac{2}{3}} ω^{2} \sqrt[3]{q + \sqrt{- 4 p^{3} + q^{2}}}}{2}$
In [12]:
# 3次方程式の解 (SymPyのsolve函数による直接計算)

x, p, q = symbols("x p q")
equ = x^3-3p*x+q
sol = solve(equ, x)
latexstring("x^3-3px+q=0") |> display
display(L"x = x_1,x_2,x_3")
latexstring(raw"\ds x_1 = ", latex(sol[1])) |> display
latexstring(raw"\ds x_2 = ", latex(sol[2])) |> display
latexstring(raw"\ds x_3 = ", latex(sol[3])) |> display
$x^3-3px+q=0$
$x = x_1,x_2,x_3$
$\ds x_1 = - \frac{3 p}{\sqrt[3]{\frac{27 q}{2} + \frac{\sqrt{- 2916 p^{3} + 729 q^{2}}}{2}}} - \frac{\sqrt[3]{\frac{27 q}{2} + \frac{\sqrt{- 2916 p^{3} + 729 q^{2}}}{2}}}{3}$
$\ds x_2 = - \frac{3 p}{\left(- \frac{1}{2} - \frac{\sqrt{3} i}{2}\right) \sqrt[3]{\frac{27 q}{2} + \frac{\sqrt{- 2916 p^{3} + 729 q^{2}}}{2}}} - \frac{\left(- \frac{1}{2} - \frac{\sqrt{3} i}{2}\right) \sqrt[3]{\frac{27 q}{2} + \frac{\sqrt{- 2916 p^{3} + 729 q^{2}}}{2}}}{3}$
$\ds x_3 = - \frac{3 p}{\left(- \frac{1}{2} + \frac{\sqrt{3} i}{2}\right) \sqrt[3]{\frac{27 q}{2} + \frac{\sqrt{- 2916 p^{3} + 729 q^{2}}}{2}}} - \frac{\left(- \frac{1}{2} + \frac{\sqrt{3} i}{2}\right) \sqrt[3]{\frac{27 q}{2} + \frac{\sqrt{- 2916 p^{3} + 729 q^{2}}}{2}}}{3}$

ある4次式の展開公式から4次方程式の解法へ

$f$ を次のように定める:

$$ f = (w+x+y+z)(w+x-y-z)(w-x+y-z)(w-x-y+z). $$

このとき,

$$ p = x^2+y^2+z^2, \quad q = xyz, \quad r = x^2y^2 + x^2z^2 + y^2z^2 \tag{$*$} $$

とおくと,

$$ f = w^4 - 2pw^2 + 8qw + p^2-4r. $$

ゆえに, もしも与えられた $p,q,r$ に対して, 条件($*$)を満たす $x,y,z$ を求めることができたならば, $w$ に関する4次方程式 $f=0$ は次のように解ける:

$$ w = -x-y-z, \ -x+y+z, \ x-y+z, \ x+y-z. $$

与えられた $p,q,r$ に対して条件 ($*$) を満たす $x,y,z$ を求めるためには, 条件

$$ x^2+y^2+z^2 = p, \quad x^2y^2+x^2z^2+y^2z^2 = r, \quad x^2y^2z^2 = q^2 \tag{$**$} $$

を満たす $x^2,y^2,z^2$ を求め, それらの平方根を取ればよい. ただし, 平方根の取り方には $\pm1$ 倍の不定性があることに注意せよ. 条件 $xyz=q$ より, $x,y,z$ のうち2つが決まれば残りは一意的に決まる.

条件 ($**$) を満たす $x^2,y^2,z^2$ は3次方程式の解と係数の関係より, 次の3次方程式の解である:

$$ \lambda^3 - p\lambda^2 + r\lambda - q^2 = 0. $$

この3次方程式は $\lambda = \Lambda+p/3$ とおけば次の形になる:

$$ \Lambda^3 - P\Lambda + Q = 0, \quad P = \frac{p^2}{3} - r, \quad Q = -\frac{2p^3}{27} + \frac{pr}{3} - q^2. $$

この形の3次方程式は前節の結果を用いれば解ける.

以上の方法はEulerの方法と呼ばれているらしい(https://en.wikipedia.org/wiki/Quartic_function).

問題: 以上の計算を確認し, さらに解の公式を実際に作ってみよ. $\QED$

解答略.

In [13]:
# 展開結果の確認

w, x, y, z = symbols("w x y z")
f4_org = (w+x+y+z)*(w+x-y-z)*(w-x+y-z)*(w-x-y+z)
f4 = expand(f4_org)
latexstring(latex(f4_org)) |> display
latexstring("=", latex(f4)) |> display
$\left(w - x - y + z\right) \left(w - x + y - z\right) \left(w + x - y - z\right) \left(w + x + y + z\right)$
$=w^{4} - 2 w^{2} x^{2} - 2 w^{2} y^{2} - 2 w^{2} z^{2} + 8 w x y z + x^{4} - 2 x^{2} y^{2} - 2 x^{2} z^{2} + y^{4} - 2 y^{2} z^{2} + z^{4}$
In [14]:
# 展開結果の 0,1,2,3,4 次の係数の確認.
# 3次の係数は0になっている.

display(L"\text{coefficients:}\ ")
c4 = coeffs(f4, w)
$\text{coefficients:}\ $
Out[14]:
\[ \left[ \begin{array}{r}x^{4} - 2 x^{2} y^{2} - 2 x^{2} z^{2} + y^{4} - 2 y^{2} z^{2} + z^{4}\\8 x y z\\- 2 x^{2} - 2 y^{2} - 2 z^{2}\\0\\1\end{array} \right] \]
In [15]:
p = c4[2+1]/(-2)
latexstring("p=", latex(p))
Out[15]:
$p=x^{2} + y^{2} + z^{2}$
In [16]:
q = c4[2]/8
latexstring("q=", latex(q))
Out[16]:
$q=x y z$
In [17]:
r = x^2*y^2 + x^2*z^2 + y^2*z^2
@show simplify(c4[1] - (p^2-4r))
latexstring("r=", latex(r))
simplify(c4[1] - (p ^ 2 - 4r)) = 0
Out[17]:
$r=x^{2} y^{2} + x^{2} z^{2} + y^{2} z^{2}$
In [18]:
# p,q,rを使った公式の確認

ff4 = w^4 - 2p*w^2 + 8q*w + (p^2-4r)
simplify(f4 - ff4) |> display
latexstring("w^4-2pw^2+8qw+(p^2-4r)") |> display
latexstring("=", latex(f4)) |> display
\begin{equation*}0\end{equation*}
$w^4-2pw^2+8qw+(p^2-4r)$
$=w^{4} - 2 w^{2} x^{2} - 2 w^{2} y^{2} - 2 w^{2} z^{2} + 8 w x y z + x^{4} - 2 x^{2} y^{2} - 2 x^{2} z^{2} + y^{4} - 2 y^{2} z^{2} + z^{4}$
In [19]:
m = symbols("m")
equ = m^3 - p*m^2 + r*m - q^2
sol = simplify(factor(equ))
latexstring(latex(equ), "=", latex(sol))
Out[19]:
$m^{3} - m^{2} \left(x^{2} + y^{2} + z^{2}\right) + m \left(x^{2} y^{2} + x^{2} z^{2} + y^{2} z^{2}\right) - x^{2} y^{2} z^{2}=\left(m - x^{2}\right) \left(m - y^{2}\right) \left(m - z^{2}\right)$
In [20]:
# 補助的な3次方程式の形の確認

p, q, r, m, M = symbols("p q r m M")
(f3 = m^3 - p*m^2 + r*m - q^2) |> display
(g3 = simplify(expand(f3(m => M+p/3)))) |> display
(c3 = coeffs(g3, M))
\begin{equation*}m^{3} - m^{2} p + m r - q^{2}\end{equation*}
\begin{equation*}M^{3} - \frac{M p^{2}}{3} + M r - \frac{2 p^{3}}{27} + \frac{p r}{3} - q^{2}\end{equation*}
Out[20]:
\[ \left[ \begin{array}{r}- \frac{2 p^{3}}{27} + \frac{p r}{3} - q^{2}\\- \frac{p^{2}}{3} + r\\0\\1\end{array} \right] \]
In [21]:
# w, p, q, r = symbols("w p q r")
# factor.(solve(w^4 - 2p*w^2 + 8q*w + (p^2-4r), w))

べき乗和とベルヌイ多項式

高校数学ではべき乗和

$$ \begin{aligned} & 1+2+\cdots+n = \frac{n(n+1)}{2}, \\ & 1^2+2^2+\cdots+n^2 = \frac{n(n+1)(2n+1)}{6}, \\ & 1^3+2^3+\cdots+n^3 = \frac{n^2(n+1)^2}{4} \end{aligned} $$

について習う. これらの公式の背景にベルヌイ多項式が控えていることを解説したい.

ベルヌイ多項式については以下のツイッターにおける以下のスレッドも参照せよ:

Bernoulli多項式

Bernoulli多項式(ベルヌイ多項式) $B_k(x)$ が次のTaylor展開で定義される:

$$ \frac{ze^{zx}}{e^z - 1} = \sum_{k=0}^\infty \frac{B_k(x)}{k!}z^k. $$

これの左辺をBernoulli多項式の母函数と呼ぶ.

Bernoulli数: Bernoulli多項式の定数項 $B_k=B_k(0)$ はBernoulli数と呼ばれている.

$$ \begin{aligned} \frac{ze^{zx}}{e^z - 1} &= \frac{z}{e^z - 1} e^{xz} = \sum_{i=0}^\infty \frac{B_i z^i}{i!} \sum_{j=0}^\infty\frac{x^j z^j}{j!} \\ &= \sum_{i,j=0}^\infty \frac{(i+j)!}{i!j!}B_i x^j \frac{z^{i+j}}{(i+j)!} = \sum_{k=0}^\infty \sum_{j=0}^k \binom{k}{j} B_{k-j}x^j \frac{z^k}{k!} \end{aligned} $$

より, Bernoulli多項式はBernoulli数によって次のように表わされることがわかる:

$$ B_k(x) = \sum_{j=0}^k \binom{k}{j} B_{k-j}x^j. $$

Bernoulli多項式の微分: Benoulli多項式の定義式の両辺を $x$ で偏微分すると

$$ \frac{z^2 e^{zx}}{e^z - 1} = \sum_{k=0}^\infty \frac{B_k'(x)}{k!}z^k $$

となり, これの左辺は

$$ \frac{z^2 e^{zx}}{e^z - 1} = \sum_{m=0}^\infty \frac{B_m(x)}{m!}z^{m+1} = \sum_{k=1}^\infty \frac{B_{k-1}(x)}{(k-1)!}z^k $$

と書けるので, 上と比較して

$$ B_k'(x) = k B_{k-1}(x) $$

が得られる. $B_0(x)=1$ なので $B_k(x)$ は最高次の係数が $1$ である $k$ 次の多項式になる.

Bernoulli多項式の積分: 上の結果より,

$$ \frac{d}{dx}\frac{B_{k+1}(x)}{k+1}=B_k(x) $$

であるから,

$$ \int_a^b B_k(x)\,dx = \frac{B_{k+1}(b)-B_{k+1}(a)}{k+1}. $$

これの母函数表示は次の通り:

$$ \sum_{k=0}^\infty \int_a^b B_k(x)\,dx\;\frac{z^k}{k!} = \int_a^b \frac{ze^{zx}}{e^z - 1}\,dx = \left[\frac{e^{zx}}{e^z - 1}\right]_{x=a}^{x=b} = \frac{e^{zb}-e^{za}}{e^z - 1}. $$

特に $a=0$, $b=1$ のとき, 右辺は $1$ になるので,

$$ \int_0^1 B_k(x)\,dx = \delta_{k0} $$

となることもわかる. $a=x$, $b=x+1$ の場合には

$$ \sum_{k=0}^\infty \int_x^{x+1} B_k(y)\,dy\;\frac{z^k}{k!} = \frac{e^{z(x+1)}-e^{zx}}{e^z - 1} = e^{zx} = \sum_{k=0}^\infty x^k \frac{z^k}{k!} $$

となるので,

$$ \int_x^{x+1} B_k(y)\,dy = x^k. $$

Bernoulli多項式とべき乗和の関係

べき乗和 $S_k(n)$ が次のように定義される:

$$ S_k(n) = \sum_{j=1}^n j^k = 1^k+2^k+\cdots+n^k. $$

べき乗和の母函数は次のように計算される:

$$ \begin{aligned} \sum_{k=0}^\infty \frac{S_k(n)}{k!}z^k &= \sum_{k=0}^\infty \sum_{j=1}^n \frac{j^k}{k!}z^k = \sum_{j=1}^n \sum_{k=0}^\infty \frac{j^k}{k!}z^k \\ &= \sum_{j=1}^n e^{jz} = \frac{e^{(n+1)z}-e^z}{e^z-1}. \end{aligned} $$

Bernoulli多項式の積分に関する結果より,

$$ \begin{aligned} \frac{e^{(n+1)z}-e^z}{e^z-1} &= \sum_{k=0}^\infty \int_1^{n+1}B_k(x)\,dx\;\frac{z^k}{k!} \\ &= \sum_{k=0}^\infty \frac{B_{k+1}(n+1)-B_{k+1}(1)}{k+1} \frac{z^k}{k!}. \end{aligned} $$

したがって,

$$ S_k(n) = \int_1^{n+1} B_k(x)\,dx = \frac{B_{k+1}(n+1) - B_{k+1}(1)}{k+1}. $$

特に $S_k(n)$ は $n$ について $k+1$ 次の多項式になり, 最高次の係数は $1/(k+1)$ になることがわかる.

以上では母函数表示を経由して計算したが,

$$ \int_x^{x+1} B_k(y)\,dy = x^k, \quad \int B_k(x) dx = \frac{B_{k+1}(x)}{k+1} $$

を使えば

$$ \begin{aligned} S_k(n) &= \sum_{j=1}^n j^k = \sum_{j=1}^n \int_j^{j+1} B_k(x)\,dx \\ &= \int_1^{n+1} B_k(x)\,dx = \frac{B_{k+1}(n+1) - B_{k+1}(1)}{k+1} \end{aligned} $$

と同じ公式がより平易に得られる.

In [22]:
# ベルヌイ多項式のリスト k = 0,1,2,…,12

B(k,x) = sympy[:bernoulli](k,x)
SS(k,x) = (B(k+1,x+1) - B(k+1,Sym(1)))/(k+1)
x = symbols("x")
for k in 0:12
    latexstring("B_{$k}(x)=", latex(B(k,x))) |> display
end
$B_{0}(x)=1$
$B_{1}(x)=x - \frac{1}{2}$
$B_{2}(x)=x^{2} - x + \frac{1}{6}$
$B_{3}(x)=x^{3} - \frac{3 x^{2}}{2} + \frac{x}{2}$
$B_{4}(x)=x^{4} - 2 x^{3} + x^{2} - \frac{1}{30}$
$B_{5}(x)=x^{5} - \frac{5 x^{4}}{2} + \frac{5 x^{3}}{3} - \frac{x}{6}$
$B_{6}(x)=x^{6} - 3 x^{5} + \frac{5 x^{4}}{2} - \frac{x^{2}}{2} + \frac{1}{42}$
$B_{7}(x)=x^{7} - \frac{7 x^{6}}{2} + \frac{7 x^{5}}{2} - \frac{7 x^{3}}{6} + \frac{x}{6}$
$B_{8}(x)=x^{8} - 4 x^{7} + \frac{14 x^{6}}{3} - \frac{7 x^{4}}{3} + \frac{2 x^{2}}{3} - \frac{1}{30}$
$B_{9}(x)=x^{9} - \frac{9 x^{8}}{2} + 6 x^{7} - \frac{21 x^{5}}{5} + 2 x^{3} - \frac{3 x}{10}$
$B_{10}(x)=x^{10} - 5 x^{9} + \frac{15 x^{8}}{2} - 7 x^{6} + 5 x^{4} - \frac{3 x^{2}}{2} + \frac{5}{66}$
$B_{11}(x)=x^{11} - \frac{11 x^{10}}{2} + \frac{55 x^{9}}{6} - 11 x^{7} + 11 x^{5} - \frac{11 x^{3}}{2} + \frac{5 x}{6}$
$B_{12}(x)=x^{12} - 6 x^{11} + 11 x^{10} - \frac{33 x^{8}}{2} + 22 x^{6} - \frac{33 x^{4}}{2} + 5 x^{2} - \frac{691}{2730}$
In [23]:
# べき乗和の公式のリスト k = 0,1,2,…,12

x = symbols("x")
for k in 0:12
    latexstring("S_{$k}(x)=", latex(factor(SS(k,x)))) |> display
end
$S_{0}(x)=x$
$S_{1}(x)=\frac{x \left(x + 1\right)}{2}$
$S_{2}(x)=\frac{x \left(x + 1\right) \left(2 x + 1\right)}{6}$
$S_{3}(x)=\frac{x^{2} \left(x + 1\right)^{2}}{4}$
$S_{4}(x)=\frac{x \left(x + 1\right) \left(2 x + 1\right) \left(3 x^{2} + 3 x - 1\right)}{30}$
$S_{5}(x)=\frac{x^{2} \left(x + 1\right)^{2} \left(2 x^{2} + 2 x - 1\right)}{12}$
$S_{6}(x)=\frac{x \left(x + 1\right) \left(2 x + 1\right) \left(3 x^{4} + 6 x^{3} - 3 x + 1\right)}{42}$
$S_{7}(x)=\frac{x^{2} \left(x + 1\right)^{2} \left(3 x^{4} + 6 x^{3} - x^{2} - 4 x + 2\right)}{24}$
$S_{8}(x)=\frac{x \left(x + 1\right) \left(2 x + 1\right) \left(5 x^{6} + 15 x^{5} + 5 x^{4} - 15 x^{3} - x^{2} + 9 x - 3\right)}{90}$
$S_{9}(x)=\frac{x^{2} \left(x + 1\right)^{2} \left(x^{2} + x - 1\right) \left(2 x^{4} + 4 x^{3} - x^{2} - 3 x + 3\right)}{20}$
$S_{10}(x)=\frac{x \left(x + 1\right) \left(2 x + 1\right) \left(x^{2} + x - 1\right) \left(3 x^{6} + 9 x^{5} + 2 x^{4} - 11 x^{3} + 3 x^{2} + 10 x - 5\right)}{66}$
$S_{11}(x)=\frac{x^{2} \left(x + 1\right)^{2} \left(2 x^{8} + 8 x^{7} + 4 x^{6} - 16 x^{5} - 5 x^{4} + 26 x^{3} - 3 x^{2} - 20 x + 10\right)}{24}$
$S_{12}(x)=\frac{x \left(x + 1\right) \left(2 x + 1\right) \left(105 x^{10} + 525 x^{9} + 525 x^{8} - 1050 x^{7} - 1190 x^{6} + 2310 x^{5} + 1420 x^{4} - 3285 x^{3} - 287 x^{2} + 2073 x - 691\right)}{2730}$

問題: $k$ が3以上の整数のとき $B_k(0)=0$ となることを示せ.

証明: $B_k(x)$ の母函数で $x=0$ とおくと,

$$ \begin{aligned} \sum_{k=0}^\infty \frac{B_k(0)}{k!}z^k + \frac{z}{2} = \frac{z}{e^z - 1} + \frac{z}{2} = \frac{z}{2}\frac{e^z + 1}{e^z - 1} = \frac{z}{2}\frac{e^{z/2} + e^{-z/2}}{e^{z/2} - e^{-z/2}}. \end{aligned} $$

これは $z$ の偶函数なので, 左辺のべき級数の奇数次の係数はすべて消える. ゆえに $k$ が3以上の奇数ならば $B_k(0)=0$ となる. $\QED$

問題: 以下を示せ:

(1) $B_k(1-x)=(-1)^k B_k(x)$.

(2) $k$ が奇数のとき $B_k(1/2)=0$.

(3) $k$ が $3$ 以上の奇数のとき $B_k(1)=B_k(0)=0$.

(4) $k\geqq 2$ ならば $B_k(0)=B_k(1)$.

証明: (1) $B_k(x)$ の母函数で $x$ に $1-x$ を代入すると,

$$ \begin{aligned} \sum_{k=0}^\infty \frac{B_k(1-x)}{k!}z^k &= \frac{ze^{z(1-x)}}{e^z - 1} = \frac{ze^{-zx}}{1 - e^{-z}} \\ &= \frac{(-z)e^{(-z)x}}{e^{-z}-1} = \sum_{k=0}^\infty \frac{B_k(x)}{k!}(-z)^k. \end{aligned} $$

なので両辺を比較すると, $B_k(1-x)=(-1)^k B_k(x)$ となることがわかる.

(2) $x=1/2$ のとき $1-x = x$ であり, $k$ が奇数のとき $B_k(1-x)=-B_k(x)$ なので $B_k(1/2)=0$ となることがわかる.

(3) 1つ前の問題より, $k$ が3以上の奇数のとき $B_k(0)=0$ なので $B_k(1)=B_k(1-0)=-B_k(0)=0$ となる.

(4) $k\geqq 2$ であるとする. $k$ が奇数ならば $B_k(0)=0=B_k(1)$ となり, $k$ が偶数ならば $B_k(0)=B_k(1-1)=B_k(1)$ となる. $\QED$

問題: 以下を示せ:

(1) $S_k(x)$ は $x$ で割り切れる.

(2) $k\geqq 1$ のとき $S_k(x)$ は $x+1$ で割り切れる.

(3) $k$ が2以上の偶数ならば $S_k(x)$ は $x(x+1)(2x+1)$ で割り切れる.

(4) $k$ が3以上の奇数ならば $S_k(x)$ は $x^2(x+1)^2$ で割り切れる.

証明: (1) $S_k(0)=0$ を示せばよいが,

$$ S_k(0) = \frac{B_{k+1}(1)-B_{k+1}(1)}{k+1} = 0. $$

(2) $k\geqq 1$ のとき, 1つ前の問題の(4)より $B_{k+1}(0)=B_{k+1}(1)$ が成立するので,

$$ S_k(-1) = \frac{B_{k+1}(0)-B_{k+1}(1)}{m+1} = 0. $$

ゆえに $S_k(x)$ は $k+1$ で割り切れる.

(3) $k$ が2以上の偶数のとき, 1つ前の問題の(2),(3)より $B_{k+1}(1/2)=0$, $B_{k+1}(1)=0$ が成立するので

$$ S_k(-1/2) = \frac{B_{k+1}(1/2)-B_{k+1}(1)}{k+1} = 0. $$

ゆえに $S_k(x)$ は $2x+1$ で割り切れる. 上の(1),(2)より, $S_k(x)$ は $x$ と $x+1$ でも割り切れるので, $x(x+1)(2x+1)$ で割り切れることがわかる.

(4) $\ds S_k(x) = \int_1^{x+1} B_k(t)\,dt = \int_0^x B_k(t+1)\,dt$ より,

$$ S_k'(x) = B_k(x+1) $$

なので, 1つ前の問題の(3)より, $k$ が3以上の奇数ならば $S_k'(0)=B_k(1)=0$, $S_k'(-1)=B_k(0)=0$ となる. ゆえに $S_k'(x)$ は $x$ と $x+1$ で割り切れる. 上の(1),(2)より, $S_k(x)$ は $x$ と $x+1$ で割り切れる. これらより, $S_k(x)$ が $x^2(x+1)^2$ で割り切れることがわかる. $\QED$

問題: $S_1(x)$ が $x(x+1)$ で割り切れることを用いて, $\ds S_1(x)=\frac{x(x+1)}{2}$ となることを示せ.

証明: $S_1(x)$ は最高次の係数が $1/2$ の2次の多項式になるので, それが $x(x+1)$ で割り切れることを使えば, $\ds S_1(x)=\frac{x(x+1)}{2}$ となることがただちに導かれる. $\QED$

問題: $S_2(x)$ が $x(x+1)(2x+1)$ で割り切れることを用いて, $\ds S_2(x)=\frac{x(x+1)(2x+1)}{6}$ となることを示せ.

証明: $S_2(x)$ は最高次の係数が $1/3$ の3次の多項式になるので, それが $x(x+1)(2x+1)$ で割り切れることを使えば, $\ds S_2(x)=\frac{x(x+1)(2x+1)}{6}$ となることがただちに導かれる. $\QED$

問題: $S_3(x)$ が $x^2(x+1)^2$ で割り切れることを用いて, $\ds S_3(x)=\frac{x^2(x+1)^2}{4}$ となることを示せ.

証明: $S_3(x)$ は最高次の係数が $1/4$ の4次の多項式になるので, それが $x^2(x+1)^2$ で割り切れることを使えば, $\ds S_3(x)=\frac{x^2(x+1)^2}{4}$ となることがただちに導かれる. $\QED$

問題: $S_4(x)$ が $x(x+1)(2x+1)$ で割り切れることを用いて, $S_4(x)$ を求めよ.

解答例: $S_4(x)$ は最高次の係数が $1/5$ の5次の多項式になり, $x(x+1)(2x+1)$ で割り切れるので,

$$ S_4(x) = \frac{1}{10}x(x+1)(2x+1)(x^2+ax+b) $$

と書ける. $S_4(1)=1$, $S_4(2)=17$ より,

$$ \frac{3}{5}(1+a+b)=1, \quad 3(4+2a+b)=17. $$

左の等式の5倍を→の等式から引くと $3(3+a)=12$ となるので, $a=1$ が得られ, それを左の等式に代入すると $3(2+b)=5$ となり, $b=-1/3$ が得られる. したがって,

$$ S_4(x) = \frac{1}{10}x(x+1)(2x+1)(x^2+x-1/3) = \frac{1}{30}x(x+1)(2x+1)(3x^2+3x-1) $$

であることがわかる. $\QED$

問題: $S_5(x)$ が $x^2(x+1)^2$ で割り切れることを用いて, $S_5(x)$ を求めよ.

解答例: $S_5(x)$ は最高次の係数が $1/6$ の6次多項式になり, $x^2(x+1)^2$ で割り切れるので,

$$ S_5(x) = \frac{1}{6}x^2(x+1)^2(x^2+ax+b) $$

と書ける. $S_5(1)=1$, $S_5(2)=33$ より,

$$ \frac{2}{3}(1+a+b)=1, \quad 6(4+2a+b)=33. $$

前者の9倍を後者から引くと $6(3+a)=24$ となるので, $a=1$ が得られ, それを前者に代入すると, $2(2+b)=3$ となるので, $b=-1/2$ が得られる. ゆえに

$$ S_5(x)= \frac{1}{6}x^2(x+1)^2(x^2+x-1/2)= \frac{1}{12}x^2(x+1)^2(2x^2+2x-1). \qquad\QED $$

べき乗和の直接的な取り扱い

ツイッターでぴよぴよさんにBernoulli多項式に頼らない直接的で平易なべき乗和の取り扱いについて教わったのでその内容を以下で説明する.

定理: べき乗和 $S_k(n)$ は $n$ に関する $k+1$ 次の多項式になる.

証明: $k+1$ 次の多項式 $f(x)$ で $f(0)=0$, $f(x)=f(x-1)+x^k$ を満たすものが存在することを示せば十分である. (そのような $f(x)$ について $S_k(n) = f(n)$ となる.) $\ds f(x)=\sum_{m=0}^{k+1} a_m x^m$ とおき, $f(0)=0$, $f(x)=f(x-1)+x^k$ を満たす $a_m$ 達が一意に定まることを示そう. $f(x-1)$ は

$$ f(x-1) = \sum_{m=0}^{k+1} a_i \sum_{i=0}\binom{m}{i}(-1)^{m-i}x^i = \sum_{i=0}^{k+1}\left(\sum_{m=i}^{k+1}(-1)^{m-i}\binom{m}{i} a_m\right) x^i $$

と書けることから, 条件 $f(0)=0$, $f(x)=f(x-1)+x^k$ は係数 $a_m$ 達に関する以下の連立一次方程式に書き直される:

$$ \begin{aligned} & -(k+1)a_{k+1} + 1 = 0, \\ & \sum_{m=i+1}^{k+1} (-1)^{m-i} \binom{m}{i} a_m = 0 \qquad (i=k-1,k-2,\ldots,1) \\ & a_0 = 0. \end{aligned} $$

これより, $\ds a_{k+1}=\frac{1}{k+1}$ から順番に $a_k,a_{k-1},\ldots,a_1, a_0$ が決まり, この連立一次方程式の解 $(a_0,a_1,\ldots,a_m)$ が唯一つ存在することがわかる. $\QED$

注意: 上の証明より, $S_k(n)$ の最高次の係数は $\ds a_{k+1}=\frac{1}{k+1}$ になることがわかる. さらに, $a_k$ に関する方程式は $i=k-1$ の場合から得られ,

$$ -k a_k + \frac{(k+1)k}{2}a_{k+1} = 0 $$

になるので, $a_k=1/2$ となることもわかる. $\QED$

注意: $f(x)$ の次数が $k+1$ 次より大きいならば $f(x)-f(x-1)$ の次数は $k+1$ 次以上になるので, $f(x)-f(x-1)=x^k$ が成立することはありえない. このことから $S_k(n)$ は $n$ について $k+2$ 次以上の多項式になることはありえないことがわかる. $\QED$

定理: べき乗和を表す多項式 $S_k(x)$ は以下を満たしている.

(1) $S_k(x)$ は $S_k(0)=0$, $S_k(x)=S_k(x-1)+x^k$ という条件で一意的に特徴付けられ, その次数は $k+1$ であり, その最高次の係数は $1/(k+1)$ になる.

(2) $k\geqq 1$ ならば $S_k(-1)=0$ となり, $S_k(x)$ は $x(x+1)$ で割り切れる.

(3) $k\geqq 1$ ならば $S_k(x) = (-1)^{k+1}S_k(-1-x)$.

(4) $k$ が2以上の偶数ならば $S_k(-1/2)=0$ となり, $S_k(x)$ は $x(x+1)(2x+1)$ で割り切れる.

(5) $S_k'(x) = (-1)^k S_k'(-1-x)$.

(6) $k$ が3以上の奇数ならば $S_k'(0)=S_k'(-1)=0$ となり, $S_k(x)$ は $x^2(x+1)^2$ で割り切れる.

証明: (1)はすでに証明されている.

(2) $k\geqq 1$ のとき, $S_k(x)=S_k(x-1)+x^k$ で $x=0$ とおくと, $0=S_k(-1)$ が得られる. そのとき, $S_k(x)$ は $x+1$ で割り切れ, $S_k(0)=0$ より $x$ でも割り切れる.

(3) $S_k(x)=S_k(x-1)+x^k$ の $x$ に $-x$ を代入すると, $S_k(-x)=S_k(-x-1)+(-1)^k x^k$. これは $-S_k(-x-1)=-S_k(-1-(x-1))+(-1)^k x^k$, $(-1)^{k+1}S_k(-x-1)=(-1)^{k+1}S_k(-1-(x-1))+x^k$ と書き直される. $k\geqq 1$ のとき, $S_k(-1-x)$ で $x=0$ とおくと $S_k(-1-0)=S_k(-1)=0$ となる. ゆえに, $(-1)^{k+1}S_k(-1-x)$ は $S_k(x)$ を一意的に特徴付ける条件を満たしているので, $(-1)^{k+1}S_k(-1-x)=S_k(x)$ となることがわかる.

(4) $k$ は2以上の偶数であると仮定する. このとき, (3)より $S_k(x)=-S_k(-1-x)$ となる. ゆえに $x=-1/2$ とおくと $S_k(-1/2)=0$ が得られる. そのとき $S_k(x)$ は $2x+1$ で割り切れ, (2)より $x(x+1)$ でも割り切れる.

(5)は(3)からただちに得られる.

(6) $k$ は3以上の奇数であると仮定する. このとき, (5)より $S_k'(x)=-S_k'(-1-x)$ となり, 特に $S_k'(0)=-S_k'(-1)$ が得られる. $S_k(x)=S_k(x-1)+x^k$ の両辺を微分すると $S_k'(x)=S_k'(x-1)+kx^{k-1}$ なので, 特に $S_k'(0)=S_k'(-1)$ が得らえる. それらより, $S_k'(0)=S_k'(-1)=0$ が得られる. $S_k(0)=S_k(-1)=0$ と合わせると, $S_k(x)$ は $x^2$ と $(x+1)^2$ で割り切れることがわかる. $\QED$

第2種Stirling数とべき乗和

以下の内容については https://twitter.com/genkuroki/status/1052837557732433921 も参照せよ.

集合 $\{1,2,\ldots,n\}$ を空でない $k$ 個の部分集合への分割($k$ 分割)の個数を第2種Stirling数と呼び, $\ds \stirlingsecond{n}{k}$ と書くことにする. 集合 $\{1,2,\ldots,n,n+1\}$ の $k$ 分割は, $\{1,2,\ldots,n\}$ の $k-1$ 分割と $\{n+1\}$ で構成された分割と $\{1,2,\ldots,n\}$ の $k$ 分割中の $k$ 個の部分集合のどれかに $n+1$ を付け加えてできる分割のどちらかになるので,

$$ \stirlingsecond{n+1}{k} = \stirlingsecond{n}{k-1} + k\stirlingsecond{n}{k} $$

を満たしている. この漸化式と $\ds \stirlingsecond{0}{k}=\delta_{k0}$ によって第2種Stirling数は一意的に特徴付けられる.

定理: $\partial=d/dx$ とおく. 微分作用素 $x\partial$ の $n$ 乗は以下のように表わされる:

$$ (x\partial)^n = \sum_{k=0}^n \stirlingsecond{n}{k} x^k\partial^k. \tag{$*$} $$

証明: $n$ に関する数学的帰納法. $n=1$ のとき $\ds \stirlingsecond{1}{k}=\delta_{k1}$ より($*$)は成立している. $n$ について($*$)が成立していると仮定する. このとき

$$ \begin{aligned} (x\partial)^{n+1} &= \sum_{k=0}^n \stirlingsecond{n}{k} x\partial x^k\partial^k = \sum_{k=0}^n \stirlingsecond{n}{k} (x^{k+1}\partial^{k+1} + k x^k\partial^k) \\ &= \sum_{l=1}^{n+1} \stirlingsecond{n}{l-1} x^l\partial^l + \sum_{k=0}^n k\stirlingsecond{n}{k} x^k\partial^k \\ &= \sum_{k=0}^{n+1} \left(\stirlingsecond{n}{k-1} + k\stirlingsecond{n}{k}\right) x^k\partial^k = \sum_{k=0}^{n+1} \stirlingsecond{n+1}{k} x^k\partial^k. \end{aligned} $$

これで $n$ が $n+1$ の場合にも($*$)が成立することがわかった. $\QED$

注意: 上の定理の公式は帰納法によらずに「項と $k$ 分割の一対一対応」を構成することによっても証明可能である.

に簡単な説明がある. $\QED$

系: 次が成立している:

$$ a^n = \sum_{k=0}^n \stirlingsecond{n}{k}a(a-1)\cdots(a-k+1). $$

証明: $x^a$ に上の定理の公式の両辺を作用させ, さらに両辺を $x^a$ で割ればこの公式が得られる.

$a(a-1)\cdots(a-r)$ ($r+1$ 個の因子の積)と $a(a-1)\cdots(a-r+1)$ ($r$ 個の因子の積)ついて

$$ (a+1)a\cdots(a-r+1) - a(a-1)\cdots(a-r) = (r+1)a(a-1)\cdots(a-r+1). $$

これの両辺を $a=n,n-1,\ldots,1,0$ について足し上げて, 全体を $r+1$ で割ると,

$$ \frac{(n+1)n(n-1)\cdots(n-r+1)}{r+1} = \sum_{a=0}^n a(a-1)\cdots(a-r+1). $$

したがって, 上の系の公式を書き直した

$$ a^k = \sum_{r=0}^k \stirlingsecond{k}{r}a(a-1)\cdots(a-r+1) $$

を $a=0,1,2,\ldots,n$ について足し上げると,

$$ \sum_{a=0}^n a^k = \sum_{r=0}^k \stirlingsecond{k}{r} \frac{(n+1)n(n-1)\cdots(n-r+1)}{r+1}. $$

左辺は $k=0$ のとき $1+S_0(n)=n+1$ に一致し, $k\geqq 1$ のとき $S_k(n)$ に一致する. $\ds\stirlingsecond{k}{0}=\delta_{k0}$ であることに注意せよ. $\QED$

注意: 第2種Stirling数は次の母函数表示を持つ:

$$ \exp(x(e^t - 1)) = \sum_{n=0}^\infty\sum_{k=0}^n\stirlingsecond{n}{k} x^k \frac{t^n}{n!}. $$

このことは $\exp(x)$ に $\exp(tx\partial)$ を作用させると,

$$ \exp(tx\partial)\exp(x) = \exp(x e^t) $$

となり, 上の定理の公式より,

$$ \begin{aligned} \exp(tx\partial)\exp(x) &= \sum_{n=0}^\infty (x\partial)^n\exp(x) \frac{t^n}{n!} \\&= \sum_{n=0}^\infty \sum_{k=0}^n \stirlingsecond{n}{k}x^k\partial^k\exp(x) \frac{t^n}{n!} = \exp(x)\sum_{n=0}^\infty \sum_{k=0}^n \stirlingsecond{n}{k}x^k\frac{t^n}{n!} \end{aligned} $$

となることからわかる. $\QED$

In [24]:
# a(a-1)…(a-r+1) の和

a = symbols("a", integer=true)
n = symbols("n", integer=true, positive=true)
ff(a,r) = iszero(r) ? typeof(a)(1) : prod(a-i for i in 0:r-1)

for r in 0:4
    s = Sum(ff(a,r), (a,0,n))
    latexstring(latex(s), "=", latex(factor(doit(s)))) |> display
end
$\sum_{a=0}^{n} 1=n + 1$
$\sum_{a=0}^{n} a=\frac{n \left(n + 1\right)}{2}$
$\sum_{a=0}^{n} a \left(a - 1\right)=\frac{n \left(n - 1\right) \left(n + 1\right)}{3}$
$\sum_{a=0}^{n} a \left(a - 2\right) \left(a - 1\right)=\frac{n \left(n - 2\right) \left(n - 1\right) \left(n + 1\right)}{4}$
$\sum_{a=0}^{n} a \left(a - 3\right) \left(a - 2\right) \left(a - 1\right)=\frac{n \left(n - 3\right) \left(n - 2\right) \left(n - 1\right) \left(n + 1\right)}{5}$
In [25]:
# Σ_{a=0}^n a^k を a(a-1)…(a-r+1) の和に帰着する方法で計算

stirlingsecond(n,k) = sympy[:functions][:combinatorial][:numbers][:stirling](n, k, kind=2)
n = symbols("n", integer=true, positive=true)
SSS(k,n) = expand(sum(stirlingsecond(k,r)*ff(n+1, r+1)/(r+1) for r in 0:k))

for k in 0:12
    latexstring(raw"\sum_{j=0}^n", "j^{$k} =", latex(factor(SSS(k,n)))) |> display
end
$\sum_{j=0}^nj^{0} =n + 1$
$\sum_{j=0}^nj^{1} =\frac{n \left(n + 1\right)}{2}$
$\sum_{j=0}^nj^{2} =\frac{n \left(n + 1\right) \left(2 n + 1\right)}{6}$
$\sum_{j=0}^nj^{3} =\frac{n^{2} \left(n + 1\right)^{2}}{4}$
$\sum_{j=0}^nj^{4} =\frac{n \left(n + 1\right) \left(2 n + 1\right) \left(3 n^{2} + 3 n - 1\right)}{30}$
$\sum_{j=0}^nj^{5} =\frac{n^{2} \left(n + 1\right)^{2} \left(2 n^{2} + 2 n - 1\right)}{12}$
$\sum_{j=0}^nj^{6} =\frac{n \left(n + 1\right) \left(2 n + 1\right) \left(3 n^{4} + 6 n^{3} - 3 n + 1\right)}{42}$
$\sum_{j=0}^nj^{7} =\frac{n^{2} \left(n + 1\right)^{2} \left(3 n^{4} + 6 n^{3} - n^{2} - 4 n + 2\right)}{24}$
$\sum_{j=0}^nj^{8} =\frac{n \left(n + 1\right) \left(2 n + 1\right) \left(5 n^{6} + 15 n^{5} + 5 n^{4} - 15 n^{3} - n^{2} + 9 n - 3\right)}{90}$
$\sum_{j=0}^nj^{9} =\frac{n^{2} \left(n + 1\right)^{2} \left(n^{2} + n - 1\right) \left(2 n^{4} + 4 n^{3} - n^{2} - 3 n + 3\right)}{20}$
$\sum_{j=0}^nj^{10} =\frac{n \left(n + 1\right) \left(2 n + 1\right) \left(n^{2} + n - 1\right) \left(3 n^{6} + 9 n^{5} + 2 n^{4} - 11 n^{3} + 3 n^{2} + 10 n - 5\right)}{66}$
$\sum_{j=0}^nj^{11} =\frac{n^{2} \left(n + 1\right)^{2} \left(2 n^{8} + 8 n^{7} + 4 n^{6} - 16 n^{5} - 5 n^{4} + 26 n^{3} - 3 n^{2} - 20 n + 10\right)}{24}$
$\sum_{j=0}^nj^{12} =\frac{n \left(n + 1\right) \left(2 n + 1\right) \left(105 n^{10} + 525 n^{9} + 525 n^{8} - 1050 n^{7} - 1190 n^{6} + 2310 n^{5} + 1420 n^{4} - 3285 n^{3} - 287 n^{2} + 2073 n - 691\right)}{2730}$

第2種Stirling数とBernoulli数の関係

Bernoulli数(正確にはBernoulli多項式 $B_n(x)$ の $x=1$ での値)を第2種Stirling数で表す公式が知られている:

$$ B_n(1) = \sum_{m=0}^\infty (-1)^m m! \stirlingsecond{n+1}{m+1}\frac{1}{m+1}. $$

そしてさらに, 二項係数がPascalの三角形で計算できるのと同様に, Akiyama-Tanigawa法によって, Bernoulli数を計算できることを示せる. そのことは, $a_{0m}$ ($m=0,1,2,\ldots$) から $a_{nm}$ ($n\geqq 1$) を帰納的に

$$ a_{n+1,m} = (m+1)(a_{nm} - a_{n,m+1}) $$

によって定めると,

$$ a_{n0} = \sum_{m=0}^\infty (-1)^m m! \stirlingsecond{n+1}{m+1}a_{0m} $$

が成立することからわかる. $a_{0m}=1/(m+1)$ のとき $a_{n0}=B_n(1)$ となる.

以上の結果の証明については次の論文を参照せよ.

  • Masanobu Kaneko. The Akiyama-Tanigawa algorithm for Bernoulli numbers. Journal of Integer Sequences, Vol. 3 (2000), Article 00.2.9. Google Scholar
In [26]:
struct AkiyamaTanigawa{T,S<:Integer}
    a::Array{T,2}
    N::S
end

Base.length(AT::AkiyamaTanigawa) = AT.N

function AkiyamaTanigawa(a0::AbstractArray{T,1}) where T
    N = size(a0,1)
    a = zeros(eltype(a0), N, N)
    a[0+1,:] = a0
    for n in 0:N-2
        for m in 0:N-n-2
            a[(n+1)+1,m+1] = (m+1) * (a[n+1, m+1] - a[n+1, (m+1)+1])
        end
    end
    AkiyamaTanigawa(a, N)
end

function displayAT(AT::AkiyamaTanigawa)
    N = length(AT)
    s = raw"\begin{matrix}" * "\n"
    for n in 0:N-1
        s *= prod(x * raw"&" for x in @.(latex(Sym(AT.a[n+1,1:N-n]))))
        s = replace(s, r"&$"=>"")
        s *= "& "^n * raw"\\\\" * "\n"
    end
    s *= raw"\end{matrix}" * "\n"
    l = latexstring(raw"\displaystyle", s)
    display(l)
end

L = 10
a0 = 1 .// collect(1:L+1)
AT = AkiyamaTanigawa(a0)
displayAT(AT)
$\displaystyle\begin{matrix} 1&\frac{1}{2}&\frac{1}{3}&\frac{1}{4}&\frac{1}{5}&\frac{1}{6}&\frac{1}{7}&\frac{1}{8}&\frac{1}{9}&\frac{1}{10}&\frac{1}{11}\\ \frac{1}{2}&\frac{1}{3}&\frac{1}{4}&\frac{1}{5}&\frac{1}{6}&\frac{1}{7}&\frac{1}{8}&\frac{1}{9}&\frac{1}{10}&\frac{1}{11}& \\ \frac{1}{6}&\frac{1}{6}&\frac{3}{20}&\frac{2}{15}&\frac{5}{42}&\frac{3}{28}&\frac{7}{72}&\frac{4}{45}&\frac{9}{110}& & \\ 0&\frac{1}{30}&\frac{1}{20}&\frac{2}{35}&\frac{5}{84}&\frac{5}{84}&\frac{7}{120}&\frac{28}{495}& & & \\ - \frac{1}{30}&- \frac{1}{30}&- \frac{3}{140}&- \frac{1}{105}&0&\frac{1}{140}&\frac{49}{3960}& & & & \\ 0&- \frac{1}{42}&- \frac{1}{28}&- \frac{4}{105}&- \frac{1}{28}&- \frac{29}{924}& & & & & \\ \frac{1}{42}&\frac{1}{42}&\frac{1}{140}&- \frac{1}{105}&- \frac{5}{231}& & & & & & \\ 0&\frac{1}{30}&\frac{1}{20}&\frac{8}{165}& & & & & & & \\ - \frac{1}{30}&- \frac{1}{30}&\frac{1}{220}& & & & & & & & \\ 0&- \frac{5}{66}& & & & & & & & & \\ \frac{5}{66}& & & & & & & & & & \\ \end{matrix} $

以上の第 $n+1$ 行目が $a_{n0},a_{n1},\ldots,$ である. 隣り合った $a_{nm}$ と $a_{n,m+1}$ の差を取り, $m+1$ 倍したものが $a_{n+1,m}$ になっている. 例えば, 2行目の $a_{12}=1/4$ と $a_{13}=1/5$ の差 $1/20$ の3倍が3行目の $3/20$ になっている. そのように計算した結果の左端の $a_{n0}$ が $B_n(1)$ に一致していることを, 以下のセルの計算結果と比較するとわかる.

In [27]:
[B(n,1) for n in 0:L]
Out[27]:
\[ \left[ \begin{array}{r}1\\\frac{1}{2}\\\frac{1}{6}\\0\\- \frac{1}{30}\\0\\\frac{1}{42}\\0\\- \frac{1}{30}\\0\\\frac{5}{66}\end{array} \right] \]

べき乗和とHurwitzのゼータ函数の関係

$s>1$, $x\ne 0,-1,-2,\ldots$ に対して, Hurwitz(フルヴィッツ)のゼータ函数 $\zeta(s,x)$ が

$$ \zeta(s,x) = \sum_{k=0}^\infty\frac{1}{(x+k)^s} = \frac{1}{x^s} + \frac{1}{(x+1)^s} + \frac{1}{(x+2)^s} + \cdots $$

によって定義される. 形式的には $m=0,1,2,\ldots$ に対して

$$ \begin{aligned} \zeta(-m,x) - \zeta(-m,x+n) &= (x^m + \cdots + (x+n)^m + (x+n+1)^m + \cdots) - ((x+n)^m + (x+n+1)^m + \cdots) \\ & = x^m + (x+1)^m + \cdots + (x+n)^m \end{aligned} $$

なので, 特に

$$ \zeta(-m,1) - \zeta(-m,n+1) = 1^m+2^m+\cdots+n^m = S_m(n). $$

この公式はHurwitzのゼータ函数の解析接続によって論理的に正当化される.

一方, ガンマ函数の応用としてよく使われる公式

$$ \frac{1}{a^s} = \frac{1}{\Gamma(s)}\int_0^\infty e^{-at} t^{s-1}\,dt $$

の $a=x,x+1,x+2,\ldots$ の場合をHurwitzのゼータ函数の定義式に代入して, 無限和と積分の順序を交換して, 等比級数の和の公式を使うと,

$$ \zeta(s,x) = \frac{1}{\Gamma(s)} \sum_{k=0}^\infty \int_0^\infty e^{-(x+k)t} t^{s-1}\,dt = \frac{1}{\Gamma(s)} \int_0^\infty \frac{e^{-xt}}{1-e^{-t}} t^{s-1}\,dt = \frac{1}{\Gamma(s)} \int_0^\infty \frac{t e^{(1-x)t}}{e^t-1} t^{s-2}\,dt. $$

このようにして, 自然にBernoulli多項式に $1-x$ を代入したものの母函数

$$ \frac{t e^{(1-x)t}}{e^t-1} = \sum_{k=0}^\infty B_k(1-x)\frac{t^k}{k!} $$

が出て来る. この結果はべき乗和を無限和に拡張して得られるHurwitzのゼータ函数の中に自然にBernoulli多項式の母函数が現われることを意味している. さらに, $0$ から $\infty$ までの積分を $0$ から $1$ までの積分と $1$ から $\infty$ までの積分の和に分解し, $0$ から $1$ までの積分の中の $B_k(1-x)$ の母函数 $\ds \frac{t e^{(1-x)t}}{e^t-1}$ をそれから $\ds\sum_{k=0}^N B_k(1-x)\frac{t^k}{k!}$ を引いて足したもので置き換え, 足した分から得らえる項を $0$ から $1$ まで積分することによって, 次が得られる:

$$ \zeta(s,x) = \frac{1}{\Gamma(s)}\left[ \int_1^\infty \frac{t e^{(1-x)t}}{e^t-1} t^{s-2}\,dt + \int_0^1 \left(\frac{t e^{(1-x)t}}{e^t-1} - \sum_{k=0}^N B_k(1-x)\frac{t^k}{k!}\right)t^{s-2}\,dt + \sum_{k=0}^N \frac{B_k(1-x)}{k!}\frac{1}{s+k-1} \right]. $$

この公式の右辺は $\imag s > -N$ で意味を持ち, そこへの $\zeta(s,x)$ の解析接続を与える. $m\in\Z$, $0\leqq m < N$ のとき $s\to -m$ とすることによって,

$$ \zeta(-m,x) = \frac{(-1)^m B_{m+1}(1-x)}{m+1} = -\frac{B_{m+1}(x)}{m+1}. $$

ここで $B_k(1-x)=(-1)^k B_k(x)$ となることを使った. この結果を使っても, べき乗和をBernoulli多項式で表す公式

$$ S_m(n) = \zeta(-m,1) - \zeta(-m,n+1) = \frac{B_{m+1}(n+1)-B_{m+1}(1)}{m+1} $$

が得られる.

以上の経路でのこの公式の証明はHurwitzのゼータ函数という解析学の対象を用いた分だけ難しくなっているが, Bernoulli多項式の母函数がどのような形で自然に現われるかがよくわかる証明になっている.

べき乗和を真に理解するためにはHurwitzのゼータ函数のような解析学の対象にまで視界を広げる必要がある.

平面上の点と直線の距離

$a,b,c$ は実数であり, $(a,b)\ne(0,0)$ であると仮定する.

高校の数学の教科書には, $xy$ 平面上の直線 $ax+by+c=0$ と $xy$ 平面上の点 $(X,Y)$ の距離 $d$ が

$$ d = \frac{|aX+bY+c|}{\sqrt{a^2+b^2}} $$

と表わされることが書いてある. これは, そこに登場する様々な量の幾何学的な意味を理解していれば自明な公式に過ぎないことを以下で説明したい.

$xyz$ 空間内の傾いた平面 $z=ax+by+c$ を考えよう. この平面の傾きは $(a,b)$ で決まっている.

定理: $xyz$ 空間内における $z=ax+by+c$ のグラフはベクトル $(a,b)$ の方向が登り方向の傾いた平面になり, その方向の傾きの大きさは $\ds\sqrt{a^2+b^2}$ になる. すなわち, 単位ベクトル $\ds\frac{(a,b)}{\sqrt{a^2+b^2}}$ の分だけ $(x,y)$ をずらすと高さが $\sqrt{a^2+b^2}$ だけ増す.

証明: $z=ax+by+c$ は $(x,y)$ を $(\Delta x, \Delta y)$ だけずらすと, $a\Delta x+b\Delta y$ の分だけ変化する. Cauchy-Schwartzの不等式より,

$$ \begin{aligned} & -\sqrt{a^2+b^2}\sqrt{(\Delta x)^2+(\Delta y)^2} \\ & \qquad\qquad \leqq a\Delta x+b\Delta y \\ & \qquad\qquad\qquad \leqq \sqrt{a^2+b^2}\sqrt{(\Delta x)^2+(\Delta y)^2} \end{aligned} $$

が成立している. ゆえに $\sqrt{(\Delta x)^2+(\Delta y)^2}=1$ という条件のもとでの $a\Delta x+b\Delta y$ の最大値は $\ds(\Delta x,\Delta y)=\frac{(a,b)}{\sqrt{a^2+b^2}}$ のときの $\sqrt{a^2+b^2}$ である. $\QED$

このように $z = ax+by+c$ における $(a,b)$ は平面の傾きの方向と大きさを記述している.

$xy$ 平面上の点 $(X,Y)$ から直線 $ax+by+c=0$ への距離を $d$ と書き, 点 $(X,Y)$ から直線 $ax+by+c=0$ におろした垂線の足を点 $(X_0, Y_0)$ と書くことにする. このとき, 点 $(X,Y)$ は $(X_0, Y_0)$ からベクトル $\pm (a,b)$ と同じ方向に距離 $d$ の位置にある. したがって, $z = ax+by+c$ の点 $(X,Y)$ における値は

$$ aX+bY+c = \pm\sqrt{a^2+b^2}\;d $$

になる. $(X,Y)$ が $(X_0,Y_0)$ から見てベクトル $(a,b)$ と同じ方向にあれば符号は $+$ になり, その反対側にあれば符号は $-$ になる. これより,

$$ d = \frac{|aX+bY+c|}{\sqrt{a^2+b^2}}. $$

補足: 平面 $z=ax+by+c$ の傾き方を調べることは2つのベクトル $(a,b)$ と $(\Delta x, \Delta y)$ の内積

$$ a\Delta x + b\Delta y = \sqrt{a^2+b^2}\sqrt{(\Delta x)^2+(\Delta y)^2}\;\cos\theta $$

を調べることに他ならない. ここで $\theta$ はそれら2つのベクトルのなす角度である. この公式から, $\sqrt{(\Delta x)^2+(\Delta y)^2}=1$ という条件のもとで $a\Delta x+b\Delta y$ が最大になるのは $\cos\theta=1$ のときであり, 最大値は $\sqrt{a^2+b^2}$ であることがわかる. さらに, $\cos\theta=1$ は 2つのベクトル $(a,b)$ と $(\Delta x, \Delta y)$ が同じ方向を向いていることを意味するので, そのことから, $\sqrt{(\Delta x)^2+(\Delta y)^2}=1$ という条件のもとで $a\Delta x+b\Delta y$ が最大になるのは, $\ds(\Delta x,\Delta y)=\frac{(a,b)}{\sqrt{a^2+b^2}}$ のときであることもわかる.

高校での授業で「点と直線の距離の公式は内積を使えば容易に導ける」と習った人がいるかもしれないが, 内積の使用は実質的に「平面 $z=ax+by+c$ の傾き方」を調べていることに他ならない. $\QED$

In [28]:
a, b, c = 0.8, 0.5, 1.0
f(x,y) = a*x + b*y + c
x = -10:0.1:5
y = -10:0.1:15
surface(x, y, abs.(f.(x',y)), colorbar=false, size=(400,300))
plot!(title="\$z = |$a x + $b y + $c|\$")
Out[28]:

Jensenの不等式と相加相乗調和平均

相加相乗平均の不等式はそれより圧倒的に一般的なJensenの不等式の特別な場合になっていることを解説する. さらに, 相加相乗調和平均の一般化になっている $p$ 乗平均についても解説する.

Jensenの不等式

$I$ は実数の区間であるとする. 例えば $I=\R$, $I=(0,\infty)$ のような場合を考える.

$a_1,\ldots,a_n\in I$ であるとし, $p_1,\ldots,p_n\geqq 0$, $p_1+\cdots+p_n=1$ と仮定する.

区間 $I$ 上の実数値函数 $f(x)$ に対して, 実数 $E[f(x)]$ を対応させる函数(汎函数) $E[\ ]$ を

$$ E[f(x)] = p_1 f(a_1) + \cdots + p_n f(a_n) $$

と定めると, $I$ 上の実数値函数 $f(x), g(x)$ と実数 $\alpha$, $\beta$ に対して以下が成立している.

(1) 線形性: $E[\alpha f(x)+\beta g(x)]=\alpha E[f(x)] + \beta E[g(x)]$.

(2) 単調性: $I$ 全体上で $f(x)\leqq g(x)$ ならば $E[f(x)]\leqq E[g(x)]$.

(3) 規格化条件: $I$ 上の定数値函数 $\alpha$ に対して, $E[\alpha]=\alpha$.

区間 $I$ 上の実数値函数 $f(x)$ が上に凸な函数であるとは,

$$ a,b\in I,\ 0<t<1 \implies (1-t)f(a)+tf(b)\leqq f((1-t)a+tb) $$

が成立することだと定める. 下に凸な函数は不等式の向きを逆転することによって定義される.

In [29]:
# log x は上に凸な函数

x = 0:0.01:2.0
a, b = 0.3, 1.5
f(x) = log(x)
t = 0:0.01:1.0
g(a,b,t) = (1-t)*f(a) + t*f(b)
h(a,b,t) = (1-t)*a + t*b
plot(size=(400,250), legend=:topleft, xlims=(0,2.0), ylims=(-2.0, 0.8))
plot!(x, f.(x), label=L"y = \log\,x")
plot!(h.(a,b,t), g.(a,b,t), label="")
plot!([a,a], [-10.0, f(a)], label=L"x = a", ls=:dash)
plot!([b,b], [-10.0, f(b)], label=L"x = b", ls=:dashdot)
Out[29]:
In [30]:
# e^x は下に凸な函数

x = -1:0.01:2
a, b = -0.3, 1.5
f(x) = e^x
t = 0:0.01:1.0
g(a,b,t) = (1-t)*f(a) + t*f(b)
h(a,b,t) = (1-t)*a + t*b
plot(size=(400,250), legend=:topleft, xlims=(-1,2), ylims=(0,8))
plot!(x, f.(x), label=L"y = e^x")
plot!(h.(a,b,t), g.(a,b,t), label="")
plot!([a,a], [-0.0, f(a)], label=L"x = a", ls=:dash)
plot!([b,b], [-0.0, f(b)], label=L"x = b", ls=:dashdot)
Out[30]:

Jensenの不等式: $f(x)$ が区間 $I$ 上の上に凸な函数ならば $E[f(x)]\leqq f(E[x])$. (下に凸ならば不等式の向きが逆になる.)

証明: $f(x)$ が $C^1$ 級の場合に限定して証明する. そのように仮定しない場合には接線の存在を微分に頼らずに直接示す必要が出て来る.

$f(x)$ は上に凸であると仮定し, $\mu=E[x]=p_1a_1+\cdots+p_na_n$ とおく. $E[f(x)]\leqq f(\mu)$ を示したい. $x=\mu$ における $y=f(x)$ の接線を $y=a(x-\mu)+f(\mu)$ と書く. $f(x)$ が上に凸であることより, $I$ 全体上で

$$ f(x) \leqq a(x-\mu)+f(\mu) $$

が成立する. ゆえに $E[\ ]$ の性質より,

$$ E[f(x)]\leqq E[a(x-\mu)+f(\mu)]=a(E[x]-\mu)+f(\mu) = f(\mu). $$

最初の等号で $E[\ ]$ の単調性を使い, 2つ目の等号で $E[\ ]$ の線形性と規格化条件を使い, 3つ目の等号で $E[x]=\mu$ を使った. $\QED$

注意: 以上の証明法ならば $n$ に関する数学的帰納法を使わずに, しかも $E[\ ]$ の定義に直接触れずに, その基本性質だけを使って証明をできた. $E[\ ]$ と同じ性質を持つものの例として, 確率密度函数 $p(x)$ に対する

$$ E[f(x)] = \int_I f(x)p(x)\,dx $$

がある. これは確率密度函数 $p(x)$ を持つ確率分布における $f(x)$ の期待値である. $E[\ ]$ は期待値汎函数(expected value functional)と呼ばれる. $\QED$

In [31]:
# 上に凸な函数 f(x) = log x の接線

x = 0:0.01:2.0
μ = 0.7
f(x) = log(x)
g(μ,x) = (1/μ)*(x-μ) + f(μ)
plot(size=(500,350), legend=:topleft, xlims=(0,1.7), ylims=(-2.2, 0.8))
plot!(x, f.(x), label=L"y = \log\,x")
plot!(x, g.(μ,x), label=L"y = a(x-\mu)+f(\mu)", ls=:dashdot)
plot!([μ, μ], [-3.0, f(μ)], label=L"x=\mu", ls=:dash)
plot!(size=(400,250))
Out[31]:

相加相乗調和平均の不等式

一般の相加相乗平均の不等式は $p_1=p_2=\cdots=p_n=1/n$ と $f(x)=\log x$ の場合にJensenの不等式からただちに得られる. そのとき, $a_1,\ldots,a_n>0$ に対して,

$$ \begin{aligned} & E[\log x] = \frac{\log a_1+\cdots+\log a_n}{n} = \log(a_1\cdots a_n)^{1/n}, \\ & E[x] = \frac{a_1+\cdots+a_n}{n} \end{aligned} $$

なので, Jensenの不等式より,

$$ \begin{aligned} & \log(a_1\cdots a_n)^{1/n} = E[\log x], \\ & \log E[x] = \log \frac{a_1+\cdots+a_n}{n} \end{aligned} $$

なので, $\log x$ が単調増加函数であることより,

$$ (a_1\cdots a_n)^{1/n} \leqq \frac{a_1+\cdots+a_n}{n}. $$

この不等式の $a_i$ 達をそれらの逆数で置き換えて, 全体の分子分母を交換することによって,

$$ \frac{n}{\dfrac{1}{a_1}+\cdots+\dfrac{1}{a_n}} \leqq (a_1,\ldots,a_n)^{1/n} $$

も得られる.

p乗平均

$x_1,\ldots,x_n>0$ の $p$ 乗平均 $M_p(x_1,\ldots,x_n)$ を, $p\ne 0$ に対して

$$ M_p(x_1,\ldots,x_n) = \left(\frac{1}{n}\sum_{i=1}^n x_i^p\right)^{1/p} $$

と定め, $p=0$ に対して

$$ M_0(x_1,\ldots,x_n) = (x_1,\ldots,x_n)^{1/n} $$

と定める. $M_0$ は相乗平均である. そして,

$$ \begin{aligned} & M_1(x_1,\ldots,x_n) = \frac{x_1+\cdots+x_n}{n}, \\ & M_{-1}(x_1,\ldots,x_n) = \frac{n}{\dfrac{1}{x_1}+\cdots+\dfrac{1}{x_n}}. \end{aligned} $$

なので, $M_1$ は加法平均で, $M_{-1}$ は調和平均である.

$p\to 0$ における $p$ 乗平均の挙動を調べよう.

$$ \begin{aligned} \frac{1}{n}\sum_{i=1}^n x_i^p &= \frac{1}{n}\sum_{i=1}^n e^{p\log x_i} \\ &= \frac{1}{n}\sum_{i=1}^n (1 + p\log x_i + O(p^2)) \\ &= 1 + p\log(x_1\cdots x_n)^{1/n} + O(p^2) \end{aligned} $$

なので, $\log(1+X)=X+O(X^2)$ を使うと,

$$ \begin{aligned} \log M_p(x_1,\ldots,x_n) &= \frac{1}{p}\log \frac{1}{n}\sum_{i=1}^n x_i^p \\ &= \frac{1}{p}\log\left(1 + p\log(x_1\cdots x_n)^{1/n} + O(p^2)\right) \\ &= \log(x_1\cdots x_n)^{1/n} + O(p) \\ &= M_0(x_1,\ldots,x_n) + O(p) \end{aligned} $$

これより, $M_p(x_1,\ldots,x_n)$ は $p=0$ でも解析的であることがわかる.

以下, $M_p = M_p(x_1,\ldots,x_n)$ とおき, $M_p$ の $p$ に関する依存性について調べたい.

$$ \begin{aligned} \frac{d}{dp}\log M_p &= \frac{d}{dp}\frac{1}{p}\log \frac{1}{n}\sum_{i=1}^n x_i^p \\ &= -\frac{1}{p^2}\log \frac{1}{n}\sum_{i=1}^n x_i^p +\frac{1}{p}\frac{(1/n)\sum_{i=1}^n x_i^p\log x_i}{(1/n)\sum_{i=1}^n x_i^p} \\ &= \frac{1}{p^2(1/n)\sum_{i=1}^n x_i^p} \\ &\times \left( \frac{1}{n}\sum_{i=1}^n x_i^p\log x_i^p - \frac{1}{n}\sum_{i=1}^n x_i^p\log \frac{1}{n}\sum_{i=1}^n x_i^p \right). \end{aligned} $$

$f(x)=x\log x$ とおくと, $f'(x)=\log x + 1$, $f''(x)=1/x>0$ なので $f(x)$ は下に凸な函数である. Jensenの不等式を $E[f(x)] = \frac{1}{n}\sum_{i=1}^n f(x_i^p)$ と下に凸な函数 $f(x)=x \log x$ に適用すると,

$$ \begin{aligned} \frac{1}{n}\sum_{i=1}^n x_i^p \log x_i^p &= E[x\log x] \geqq E[x]\log E[x] \\ &= \frac{1}{n}\sum_{i=1}^n x_i^p \log\frac{1}{n}\sum_{i=1}^n x_i^p. \end{aligned} $$

これで $\ds \frac{d}{dp}\log M_p \geqq 0$ であることがわかった. $M_p$ は $p$ について単調増加函数になる:

$$ p\leqq q \implies M_p(x_1,\ldots,x_n) \leqq M_q(x_1,\ldots,x_n). $$

この不等式は相加相乗平均の不等式の大幅な一般化になっている. 例えば $M_{-1}\leqq M_0\leqq M_1$ より相加相乗調和平均の不等式

$$ \frac{n}{\dfrac{1}{x_1}+\cdots+\dfrac{1}{x_n}} \leqq (x_1,\ldots,x_n)^{1/n} \leqq \frac{x_1+\cdots+x_n}{n} $$

が得られる.

問題: $p\to\infty$ のとき $M_p(x_1,\ldots,x_n)\to \max\{x_1,\ldots,x_n\}$ となることを示せ.

解答例: $x_1=\cdots=x_k>x_{k+1}\geqq\cdots\geqq x_n$ と仮定してよい.

$$ \sum_{i=1}^n x_i^p = k x_1^p\left(1 + \sum_{i>k} \left(\frac{x_i}{x_1}\right)^p\right) $$

なので,

$$ \begin{aligned} \log M_p(x_1,\ldots,x_n) &= \frac{1}{p}\log \frac{1}{n}\sum_{i=1}^n x_i^p \\ &= - \frac{1}{p}\log n + \frac{1}{p}\log k + \log x_i \\ &\,+ \frac{1}{p}\log\left(1 + \sum_{i>k} \left(\frac{x_i}{x_1}\right)^p\right). \end{aligned} $$

であり, $i>k$ のとき $0<x_i/x_1<1$ なので, これは $p\to \infty$ のとき $\log x_1$ に収束し, $M_p(x_1,\ldots,x_n)\to x_1=\max\{x_1,\ldots,x_n\}$ となることがわかる. $\QED$

注意: 全く同様にして, $p\to-\infty$ のとき $M_p(x_1,\ldots,x_n)\to \min\{x_1,\ldots,x_n\}$ となることを示せる. $\QED$

プロット: $p\ne 0$ のとき, $\ds M_p(x,y) = \left(\frac{x^p+y^p}{2}\right)^{1/p}$ なので $M_p(x,y)=1$ と $y=(2-x^p)^{1/p}$ と同値であり, $M_0(x,y)=\sqrt{xy}$ なので $M_0(x,y)=1$ と $y=1/x$ は同値である. $M_p(x,y)=1$ のグラフをプロットしよう.

In [32]:
# M_p(x,y) = 1 のプロット

f(p,x) = iszero(p) ? 1/x : (2 - x^p)^(1/p)
P = plot(size=(500,500))
ps = [-10, -2, -1, 0, 1, 2, 10]
for p in ps
    a = 2^(1/p)
    if p > 0
        Δx = 2^(1/p)/1000
        x = Δx:Δx:a
    else
        Δx = 3/1000
        x = a+eps():Δx:3
    end
    plot!(x, f.(p,x), label="p = $p", ls=:auto)
end
plot(P, xlim=(0,3), ylim=(0,3), size=(300,300))
Out[32]:

単位円に内接する多角形の周長と面積の最大値

正弦函数 $\sin\alpha$ が $0\leqq\alpha\leqq\pi$ において上に凸な函数であることにJensenの不等式を適用することによって, 単位円に内接する $n$ 角形の周長と面積が最大になるのは正 $n$ 角形の場合であることを示そう. 一般に上に凸な函数 $f(x)$ についてJensenの不等式より,

$$ \frac{1}{n}\sum_{i=1}^n f(x_i) \leqq f\left(\frac{1}{n}\sum_{i=1}^n x_i\right). $$

が成立している. さらに, $f(x)$ が強い意味で上に凸ならば($f(x)$ のグラフに局所的に直線になっている部分が存在しなければ), 等号が成立するための必要十分条件は $x_1=\cdots=x_n$ となることである.

$\theta_1<\cdots<\theta_n<\theta_{n+1}=\theta_1+2\pi$ と仮定し, $A_i = (\cos\theta_i, \sin\theta_i)$ ($i=1,\ldots,n$) とおき, 単位円に内接する $n$ 角形 $A_1\cdots A_n$ を考える.

$\alpha_i = \theta_{i+1}-\theta_i$ とおく. もしも $\alpha_i > \pi$ となる $i$ が存在するならば, 直線 $A_i A_{i+1}$ をそれに平行な原点を通る直線で線対称変換して得られる直線と単位円の交点を $A'_i$, $A'_{i+1}$ とし, $A_i,A_{i+1}$ のぞれぞれを $A'_i,A'_{i+1}$ で置き換えて得られる単位円に内接する $n$ 角形を考えることによって, 単位円に内接する $n$ 角形の周長と面積を真に大きくすることができる. ゆえに, 単位円に内接する $n$ 角形で周長の面積の最大化に興味があるならば, すべての $i=1,\ldots,n$ について $\alpha_i \leqq\pi$ であると仮定してよい. 以下ではそのように仮定する.

補足: $\alpha_i = \theta_{i+1} - \theta_i > \pi$ のとき, $\theta'_i = \theta_i + (\alpha_i-\pi) = \theta_{i+1}-\pi$, $\theta'_{i+1}=\theta_{i+1}-(\alpha_i-\pi) = \theta_i+\pi$, $A'_i = (\cos\theta'_i, \sin\theta'_i)$, $A'_{i+1} = (\cos\theta'_{i+1}, \sin\theta'_{i+1})$ とおくと, 線分 $\overline{A_i A_{i+1}}$ と線分 $\overline{A'_i A'_{i+1}}$ は平行で同じ長さになり, $n$ 角形 $A_1\cdots A'_i A'_{i+1}\cdots A_n$ の周長と面積は $n$ 角形 $A_1\cdots A_n$ のそれらよりも真に大きくなる. 図を描いてみよ! $\QED$

以上の設定のもとで, $n$ 角形 $A_1\cdots A_n$ の周長 $L$ と面積 $S$ について以下が成立している.

線分 $\overline{A_i A_{i+1}}$ の長さは $2\sin(\alpha_i/2)$ に等しいので,

$$ \begin{aligned} L = 2\sum_{i=1}^n \sin\frac{\alpha_i}{2} = 2n\,\frac{1}{n}\sum_{i=1}^n \sin\frac{\alpha_i}{2} \leqq 2n \sin\left(\frac{1}{n}\sum_{i=1}^n\frac{\alpha_i}{2}\right) = 2n\sin\frac{\pi}{n}. \end{aligned} $$

この計算中の不等号は $\sin\alpha$ が $0\leqq\alpha\leqq\pi/2$ で上に凸であることとJensenの不等式から従う. この不等式の最右辺は単位円に内接する正 $n$ 角形の周長に等しい. $\sin\alpha$ が $0\leqq\alpha\leqq\pi/2$ で強い意味で凸であることを使えば, 逆に周長 $L$ が最大になるのは単位円に内接する $n$ 角形 $A_1\ldots A_n$ が正 $n$ 角形になるときであることもわかる.

三角形 $\triangle A_iOA_{i+1}$ の面積は $(1/2)\sin\alpha_i$ に等しいので,

$$ \begin{aligned} S = \frac{1}{2}\sum_{i=1}^n \sin\alpha_i = \frac{n}{2}\,\frac{1}{n}\sum_{i=1}^n \sin\alpha_i \leqq \frac{n}{2} \sin\left(\frac{1}{n}\sum_{i=1}^n\alpha_i\right) = \frac{n}{2}\sin\frac{2\pi}{n}. \end{aligned} $$

この計算中の不等号は $\sin\alpha$ が $0\leqq\alpha\leqq\pi$ で上に凸であることとJensenの不等式から従う. この不等式の最右辺は単位円に内接する正 $n$ 角形の面積に等しい. $\sin\alpha$ が $0\leqq\alpha\leqq\pi$ で強い意味で凸であることを使えば, 逆に面積 $S$ が最大になるのは単位円に内接する $n$ 角形 $A_1\ldots A_n$ が正 $n$ 角形になるときであることもわかる.

In [33]:
# α_i > π ならば周長と面積をより大きくできること

t = range(0, 2π, length=400)
theta = 2π * [0, 3/20, 14/20, 16/20, 18/20, 1]
phi = copy(theta)
phi[2] = theta[3] - π
phi[3] = theta[2] + π
plot(size=(300,300), aspect_ratio=1, legend=false)
plot!(cos.(t), sin.(t), lw=0.5, color=:black)
plot!(cos.(theta), sin.(theta), color=:blue)
plot!(cos.(phi), sin.(phi), ls=:dash, color=:red)
Out[33]:

三角函数の微積分

高校数学の範囲内で三角函数の微分積分学を再構成してみせる. その結果は直接楕円函数論に一般化可能である.

高校の数学の教科書の方針

高校の数学の教科書では以下のような筋道で $\sin x$ の導函数を求めている.

$0< x <\pi/2$ のとき, 「面積の大小関係」によって

$$ \frac{1}{2}\sin x < \frac{1}{2}x < \frac{1}{2}\frac{\sin x}{\cos x} $$

が得られ, 全体に $2$ をかけて, 逆数を取って, $\sin x$ をかけると,

$$ 1 > \frac{\sin x}{x} > \cos x $$

となることから, 挟み撃ちによって

$$ \lim_{x\to 0} \frac{\sin x}{x}=1 $$

を示す. そのとき $\ds\frac{\sin(-x)}{-x}=\frac{\sin x}{x}$ であることに注意せよ. これより

$$ \frac{\cos x - 1}{x^2} = \frac{\cos^2 x - 1}{x^2(\cos x+1)} = \frac{\sin^2 x}{x^2(\cos x+1)} \to \frac{1}{2} \quad (x\to 0) $$

も得られる.

そして, 三角函数の加法公式

$$ \begin{aligned} & \cos(x+y) = \cos x\;\cos y - \sin x\;\sin y, \\ & \sin(x+y) = \cos x\;\sin y + \sin x\;\cos y. \end{aligned} $$

を使って, $h\to 0$ のとき

$$ \begin{aligned} & \frac{\cos(x+h)-\cos x}{h} = \frac{\cos x\;\cos h - \sin x\;\sin h - \cos x}{h} \\ &\quad = h\frac{\cos x\,(\cos h - 1)}{h^2} - \frac{\sin x\;\sin h}{h} \to -\sin x, \\ & \frac{\sin(x+h) - \sin x}{h} = \frac{\cos x\;\sin h + \sin x\;\cos h - \sin x}{h} \\ &\quad = h\frac{\sin x\,(\cos h - 1)}{h^2} + \frac{\cos x\;\sin h}{h} \to \cos x \end{aligned} $$

となることを示す. これで

$$ (\cos x)' = -\sin x, \quad (\sin x)' = \cos x $$

であることが示された.

しかし, 以上の方針は次の節の方針と比較すると, 非常に遠回りになっており, 弧度法の意味での角度の定義(単位円弧の長さで角度を定義すること)が不明瞭になっているという問題がある.

In [34]:
showimg("image/jpeg", "images/Jikkyo20140125limitsinc.jpg", scale="60%")