強化学習(Reinforcement Learning)とは、エージェント(通常は、コンピュータ・プログラム)が状態を観測し、行動を選択し、その行動の結果に基づいてより効果的な行動を学習するというアルゴリズム論のことです。
結論からいうと、わかりにくいです。少なくとも強化学習の初学者が手に取るべきレヴェルの本ではありません。難しいというのもありますが、それよりも強化学習についての基本的素養がないと分かりづらいことが原因です。強化学習とは何に使えるのか、どういう考え方なのか、今、どういう状況の何を説明しているのか・・・というあたりがあいまいで、木を見て森を見ず・・・のような説明が延々と続きます。たとえば、数式がよく出てくるのですが、数式の説明は薄い。読んでいるうちに「あー、そーいう前提で話してるのか」とわかるところもありますが、それは「わかりにくい説明」だともいえます。
控えめに言っても、この本から「強化学習」や「機械学習」の世界に入ろうとするのはやめた方がいいと思います。
・・・昔から感じるのですが、森北出版の技術解説書は不親切な傾向にあるような気がする(まぁ本書は訳書なんですが)。