データ源の説明

このチュートリアルで使う主要の実データについて概説する。ここでは主にダウンロード方法等について述べる。入手してからの手順はチュートリアルの別のページで詳説する。


MNIST手書き文字

パターン認識の典型的なベンチマークデータ。下記のリンクにて公開されている:

http://yann.lecun.com/exdb/mnist/

インターネットに接続できれば誰でも利用できる。登録等は不要。

入手後、data/MNISTに保存されていることを前提とする。

チュートリアルのリンク: 二値データを整える


視覚刺激と脳活動

被験者に提示した刺激画像とそのときの脳活動を計測したvim-2というデータセット。別名「Gallant Lab Natural Movie 4T fMRI Data set」である。CRCNS (Collaborative Research in Computational Neuroscience)のホームページから入手可能である:

https://crcns.org/data-sets/vc/vim-2

公開されているデータではあるが、CRCNS.orgへの登録が必要である。費用はないが、下記のリンク

https://crcns.org/request-account

で申請してから処理するのに一定の時間が要される。無条件に公開しているわけではなく、主に研究目的に絞られている模様。

入手後、data/vim-2に保存されていることを前提とする。

チュートリアルのリンク: エンコーダ用の階層型データを整える