IBMでTAKMIの開発に関わった筆者のテキストマイニングにかける思いが読み取れる良書です。
テキストマイニングに関する技術的な側面は、様々な領域で研究されており、その活用の知見がciniiなどでも読めるようになってきました。この本は、そういった技術的な側面よりも、テキストマイニングの創世記からこの技術に関わった筆者の、テキストマイニングという技術を好きでたまらないという気持ちが読み取れる一冊です。テキストマイニングを使っていくつかのプロジェクトに携わった筆者が、膨大なテキストの山から有用な知見を掘り起こし、「ほらね!」と誇らしい気持ちで会議に臨む様子が行間から見えるようです。その意味で、一般的な知的読み物としても面白く読む事ができました。
この本の購入希望の方は、おそらく技術的な側面を指向されているのだと思います。その側面からは、技術的なTipsよりテキストマイニングの限界と特長、収集すべきテキストのフォーマットなど、技術以前の部分に多くの記述が裂かれています。読者は、この部分の知見を多く持つことでより本質的な分析が可能となり、ぶれのないプロジェクトの推進が可能となります。従って、テキストマイニングをやってみようと考える人は、まず最初に手にすべき一冊だと思います。
私は、この本を通勤列車で読みました。技術的なテキストを帰りの列車で読むのは辛いこともありますが、この本に関してはとても面白く、わくわくしながら読み進めることができました。純粋な技術書としてでなく、企業小説でも読むつもりで読まれるのもいいのではないでしょうか。