Redundanz

僕の言葉は、人と話をするためにあるんじゃない。

0928

 予測という課題も実際は分類なのだ、ということに気付いた。というか、(これは妙な表現なのだがとにかく僕にはそういうことがある)、以前気付いていたことがようやく腑に落ちた。つまりこういうことである。いかに物理学とはいえ、あらゆる意味で未来を予知することは出来ない。というのもその意味での予測とは宇宙そのものであるから。物理学にできるのは、「ある現象」のその先を予測することである。すなわちある現象がある現象であるときちんと分類できてはじめて、われわれは予測を行うことができるのだ。そして現象の分類は、時間というものをたんなるもう一つの奥行きと考えれば、結局は物体の分類と同じことである。違いがあるとすればそれは分類すべきデータが「見切れている」ことだろう。例えるならば、猫の上半身の写真を見て下半身の姿を推測すること、これが予測である。

 こう考えると、予測というタスクがむつかしい理由を説明できる気がする。要は教師データの問題なのだ。人間がつくる画像分類タスク用教師データは、分類すべき対象が画像の中心に見切れることなく写っている。これは人間が容易に対象を分類できるからだが、予測の場合はそうではない。人間には出来ないことを計算機にやらせるわけだから、一定の系列と直後の情報という人間が直接知りうる情報の中から、計算機は自分一人で「対象」を見出さねばならない。これは本質的に半教師あり学習であり、また、画像認識に例えるならば、教師データの中に大量の見切れた画像や意味をなさない画像が含まれていることを意味する。さらに予測機をじっさいに運用するとなると、きれいに切り取られたわけではない時系列データの中から兆候を発見する必要があるわけで、これは要はdetectionタスクである。難しくて当たり前だという気分になる。どうにかして解決したい。

 至極当たり前のことを書いた気がしてきた。