Amazon.co.jp
「データマンジング」とは聞き慣れない言葉だが、本書によれば「あるフォーマットのデータを受け取り、その他のフォーマットに変換することすべて」を表すそうだ。言葉自体は一般的でないにせよ、概念自体は一般的なものだ。たとえば、異なるデータフォーマットを集計のために統合したりということは、プログラミングやシステム構築上、日常的に意識されているものだろう。本書はPerlをベースに、データ変換の手法を解説する。
実際には、一口にデータといっても原始的なテキストファイルから、XMLのように高度に構造化されたものまでさまざまだが、本書ではそれらをまんべんなく取り上げ、具体的な手法を解説する。ASCIIテキストファイルからはじまり、レコード指向データ、CSV、固定長データ、バイナリデータ、HTML、XMLと、実際に使用されているほぼすべてのデータ形態を網羅している。そして、最終的には独自のパーサを作成するところまでを説明する。
一般的にPerlはCGIとして利用されるケースが多いが、CGI用に開発されたわけではなく、豊富な活用シーンを持っている。データもいたる所に存在し、処理されることを待っているので、広義においても本書の言うようにデータマンジングにはPerlが向いていると言えるだろう。幅広い事例はもちろん参考になるが、考え方に重点が置かれているため、Perl初心者から上級者まで読みごたえのある内容となっている。データが単独のシステム内で完結することが少ない今、多くのプログラマーやSEに読まれることを期待したい。(大脇太一)
内容(「BOOK」データベースより)
本書は、データマンジングを日常業務の一部として行っていて、より効率的なコードを書きたいと思っている人を主な対象としています。本書では、データマンジングのためのテクニックを議論し、新たなテクニックや、慣れ親しんだ手法の斬新な使い方を紹介します。いくつかのアプローチはどの言語にも適用可能ですが、ここではPerlを使って、こうしたテクニックをこの多芸な言語に適用することの容易さを証明します。
内容(「MARC」データベースより)
Perl言語の、中・上級者向け解説書。構造化されていないデータ、レコード指向データ、固定長データ、バイナリデータ、独自パーサ構築、日付と数値のフォーマットなど、Perlを武器にあらゆるデータと闘う方法を伝授。
著者略歴 (「BOOK著者紹介情報」より)
クロス,デイビッド
ロンドンのコンサルティング会社Magnum Solutionsの代表。IT業界に12年以上勤務し、多くの時間をデータマンジングに費やしてきた。London Perl Mongersの創設者、かつリーダーで、Perlmonthへの記事投稿もしている
宮川 達彦
1977年生/東京大学理学部情報科学科卒。株式会社オン・ザ・エッヂにて、Webアプリケーションのフレームワーク整備や、品質管理を担当。業務で得られたソリューションの多くは、モジュールとしてCPANに登禄しており、その数は50を超えている。また、mod_perl日本語メーリングリストの管理も行う(本データはこの書籍が刊行された当時に掲載されていたものです)
ロンドンのコンサルティング会社Magnum Solutionsの代表。IT業界に12年以上勤務し、多くの時間をデータマンジングに費やしてきた。London Perl Mongersの創設者、かつリーダーで、Perlmonthへの記事投稿もしている
宮川 達彦
1977年生/東京大学理学部情報科学科卒。株式会社オン・ザ・エッヂにて、Webアプリケーションのフレームワーク整備や、品質管理を担当。業務で得られたソリューションの多くは、モジュールとしてCPANに登禄しており、その数は50を超えている。また、mod_perl日本語メーリングリストの管理も行う(本データはこの書籍が刊行された当時に掲載されていたものです)