2014-09-01から1ヶ月間の記事一覧

deep learning(google)

google論文に書かれていた3つのポイント1. local receptive fields 局所的な特徴抽出を積み重ねる2. L2 pooling 偏差???をとることにより、少しのずれを無視して、大きく特徴をとらえることができる。3. local contrast normalization 正規化←何を基準に…

ホップフィールド・ネットワーク

ニューラルネットワークの一つパーセプトロンは階層構造になっており、階層間にしかエッジが存在しないが、 ホップフィールド・ネットワークは階層構造をとらず、完全単純グラフである。各ノードは0または1を出力する。 ノード間には、各エッジには重みが割…

迷路の難易度

「障害物密度に応じた迷路探索問題の難易度指標と実時間探索アルゴリズムの性能解析」 http://eprints.lib.hokudai.ac.jp/dspace/handle/2115/14559

学習の評価

機械学習において、どのように学習が進んでいくかをみるために、 教師あり学習(多層パーセプトロン)である問題aと、強化学習(Q学習)である問題bについて 学習の達成度について指標を入れ、横軸に学習回数、縦軸に達成度の指標をプロットした。問題a xorの分…

Q学習

Q学習とは、TD学習の一つのモデル。Q学習では、行動の評価値をQ値と呼び、以下のように更新していく。Q値は、状態と行動の組に対して定まる値である。 状態下でとることのできる行動の一つをaとする。 行動前のその行動のQ値を、実際行動してみた後のその行…

TD学習

TD学習とは、強化学習の一つ報酬にたどりついて初めて自分の行動の良し悪しを判断すると効率が悪いので、 常に自分の選択肢の価値を評価し更新することがTD学習の特徴。TD学習はTD誤差というものを0に近づくよう評価値を更新していく手法のこと。TD誤差とは…

強化学習

強化学習とは、"経験"として"報酬が得られた"ことを用いる学習のこと。 強化学習では、学習主体のことをエージェントと呼びます。 エージェントが行動を選択することで、環境が環境に推移し、 そのことにより報酬を受け取ります。 強化学習とは、この報酬の…

学習の定義

学習とは、"経験を通じて行動に持続的な変化が生じる、ないし行動パターンが変化する現象のこと"である。 (wikipedia"学習"より引用)行動パターンに変化を及ぼす現象は他にも存在するが、"経験を通じて"というところで他とは区別される。教師あり学習をこの…

パーセプトロンのまとめ

a. 仮説 b. 仮説を基としたパーセプトロンの特性 c. 他のサイトのパーセプトロンの説明で納得いかなかった部分の解釈 a. 仮説 第i層が個(i=1,2,3)のノードを持つパーセプトロンを考える。 を0もしくは1を要素として持つ長さのベクトル全体の集合 を0もしくは…