¥ 3,218
通常配送無料 詳細
残り10点(入荷予定あり) 在庫状況について
この商品は、Amazon.co.jp が販売、発送します。 ギフトラッピングを利用できます。
Rubyによるクローラー開発技法 巡回・解析機能の... がカートに入りました
この商品をお持ちですか? マーケットプレイスに出品する
裏表紙を表示 表紙を表示
サンプルを聴く 再生中... 一時停止   Audible オーディオエディションのサンプルをお聴きいただいています。
2点すべてのイメージを見る

Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例 単行本 – 2014/8/22

5つ星のうち 4.2 34件のカスタマーレビュー

その他(2)の形式およびエディションを表示する 他のフォーマットおよびエディションを非表示にする
Amazon 価格
新品 中古品
Kindle版
"もう一度試してください。"
単行本
"もう一度試してください。"
¥ 3,218
¥ 2,863 ¥ 2,550

AmazonStudent

Amazon Student会員なら、この商品は+10%Amazonポイント還元(Amazonマーケットプレイスでのご注文は対象外)。

click to open popover

キャンペーンおよび追加情報


よく一緒に購入されている商品

  • Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例
  • +
  • JS+Node.jsによるWebクローラー/ネットエージェント開発テクニック
総額: ¥6,674
ポイントの合計: 201pt (3%)
選択された商品をまとめて購入

Kindle 端末は必要ありません。無料 Kindle アプリのいずれかをダウンロードすると、スマートフォン、タブレットPCで Kindle 本をお読みいただけます。

  • Apple
  • Android
  • Android

無料アプリを入手するには、Eメールアドレスを入力してください。



【Amazon Global】OTAKU Store
Figures, Video Games, Blu-ray, DVD and Music of Japanese Anime, Games and Pop Culture Shop now

商品の説明

内容紹介

Webクローラーの作り方をディープに解説!

Webから任意の情報を引き出す「クローラー」技術の概要と、
クローラーの作成方法を解説します。
汎用的なクローラーの作成から、
ブログ・Twitter・Facebookなどターゲットごとの活用法まで、
データ収集効率を劇的にアップするクローラー技術をディープに解説します。

■本書の「はじめに」より
本書はRubyでクローラーを開発・運用できるようにするための本です。
クローラーを使えば情報収集のスピードが速くなり、
最新情報をいち早く入手できるようになります。
本書を通じてクローラーを実際に開発・運用して、それを体感してください。

クローラーというのは、自動的にWebサイトを巡回して情報収集するプログラムのことです。
Google botなどの検索エンジンロボットが代表的ですが、
個人・ビジネスに関わらず、さまざまな場面で使われています。
そう聞くと難しそうに感じるかもしれませんが、
まったくそんなことはなく、小規模なクローラーはRuby初級者でも書けます。
実は、ファイルから情報を抜き出す普通のRubyスクリプトに、
たった1行加えるだけでクローラーに変身してしまいます。
もしかしたら知らず識らずのうちにあなたもクローラーを作っていたのかもしれません。
クローラーは身近な存在です。

■本書に掲載するクローラーサンプル
・Googleの検索結果を取得する
・ブログへのクローリング
・Amazonのデータを取得する
・Twitterのデータ収集
・Facebookへのクローリング
・画像を収集する
・YouTubeから動画を収集する
・iTunes Storeの順位を取得する
・Google Playの順位を取得する
・SEOに役立てる
・Wikipediaのデータを活用する
・キーワードを収集する
・流行をキャッチする
・企業・株価情報を収集する
・為替情報・金融指標を収集する
・郵便番号と緯度経度情報を取得する
・新刊情報を収集する
・荷物を追跡する
・不動産情報を取得する
・官公庁のオープンデータを活用する
・聞の見出しを集める

■目次
Chapter 1 10分クローラーの作成
Chapter2 クローラー作成の基礎
Chapter 3 収集したデータを分析する
Chapter 4 高度な利用方法
Chapter 5 目的別クローラーの作成
Chapter 6 クローラーの運用

内容(「BOOK」データベースより)

Google、Twitter、Facebookからのデータ収集、iTunes Store、Google Playのランキング情報、企業・株価情報・為替情報・金融指標の取得、SEOやマネジメントに役立つ情報の収集etc…データ収集効率を劇的にアップするクローラー技術をディープに解説。

商品の説明をすべて表示する

登録情報

  • 単行本: 448ページ
  • 出版社: SBクリエイティブ (2014/8/22)
  • 言語: 日本語
  • ISBN-10: 4797380357
  • ISBN-13: 978-4797380354
  • 発売日: 2014/8/22
  • 商品パッケージの寸法: 21 x 14.8 x 2.8 cm
  • おすすめ度: 5つ星のうち 4.2 34件のカスタマーレビュー
  • Amazon 売れ筋ランキング: 本 - 61,454位 (本の売れ筋ランキングを見る)
  •  カタログ情報を更新する画像についてフィードバックを提供する、または さらに安い価格について知らせる

  • 目次を見る

カスタマーレビュー

トップカスタマーレビュー

形式: 単行本 Amazonで購入
◼️文字コード
2014年8月22日
「Rubyによるクローラー開発技法」サンプルスクリプト
[…]
のzipファイルのサンプルはそのままでは動作しない。UTF-8への変換が必要(以下は上書きなので注意)です。

find RubyCrawlerSample/ -type f | xargs -n 10 nkf -w --overwrite

このサンプルは、著者というより出版社が用意したような感じなので、出版社側の問題なような気がしますが、修正をお願いします。
>SBクリエイティブ様

MACではfindはあってもnkfは標準ではないので、brew install nkfなどでインストール。

・MACでの注意点
MAC環境では、¥ではなく、バックスペース\(オプションキーを押しながら¥で入力)入力が必要であることに注意。私のように¥とバックスペースが同じと思っている人はハマるかも。。

・その他感想
rubyの勉強がてら動かしていますが、%rによる正規表現(/xxx/の代わりに%r!xxx!とかく)、map |(aurl,atitle),ymd|の理解、*ymdでの*による配列展開、[x, y, z, ...]
...続きを読む ›
コメント 3人のお客様がこれが役に立ったと考えています. このレビューは参考になりましたか? はい いいえ 評価を送る...
フィードバックありがとうございました。
申し訳ありませんが、お客様の投票の記録に失敗しました。もう一度試してください。
違反を報告
形式: 単行本 Amazonで購入
wgetコマンドの使い方から始まり、本格的なクローラーの作成方法が学べる良書だと思います。

Rubyについて熟知している必要はありませんが、多少の予備知識は必要な気がします。

少し残念なのは、サンプルコードで動かないものがいくつかありました。
原因は単純なものですが、サンプルコードがちゃんと動作確認されているのか不安になります。

・文字コードがUTR-16になっており、実行時エラーとなる
===============================
$ ruby sbcr1-parse.rb
sbcr1-parse.rb:1: invalid multibyte char (UTF-8)
===============================

・空白文字が入っており、実行時エラーとなる
===============================
$ ruby rss-reader.rb
Amazon.co.jp: Kindleストア > Kindle本 > コンピュータ・ITのベストセラー
rss-reader.rb:11:in `block in <main>
...続きを読む ›
コメント 5人のお客様がこれが役に立ったと考えています. このレビューは参考になりましたか? はい いいえ 評価を送る...
フィードバックありがとうございました。
申し訳ありませんが、お客様の投票の記録に失敗しました。もう一度試してください。
違反を報告
形式: 単行本
近年ではビッグデータの有効利用がさけばれていますが、ビッグデータの収集方法として
「Webスクレイピング」が注目されています。
インターネット上に存在する膨大なページからビッグデータに相当するデータを収集する事を指します。
ツイッターのつぶやきデータの収集等が有名な例としてあげられると思います。

本書では、この「Webスクレイピング」を実現するために「クローラー」を作成するとの流れになっています。

本書を読む事で
・「クローラー」の概要と作成する上で基本となる考え方
・「クローラー」作成に必要なライブラリの利用方法と生データの解析方法(形態素解析を含む自然言語処理)の概要
・より実用的な「クローラー」に育てて行くための考え方
・目的別「クローラー」の作成方法
・「クローラー」の運用方法
等の知識が学べます。

利用しているライブラリは「nokogiri」、「anemone」となっています。
「nokogiri」はHTMLやXMLをパース(解析)するためのライブラリです。
「anemone」は「クローラー」作成用のライブラリ(フレームワークの方が相応しい!?)です。

「クローラー」を初めて作
...続きを読む ›
コメント 23人のお客様がこれが役に立ったと考えています. このレビューは参考になりましたか? はい いいえ 評価を送る...
フィードバックありがとうございました。
申し訳ありませんが、お客様の投票の記録に失敗しました。もう一度試してください。
違反を報告
形式: 単行本 Amazon Vine レビュー ( 詳しくはこちら )
googleのサイト巡回のボットなどがそうであるように、この本に書かれている技術を使えば、ちょっとした検索エンジンのようなものが作れたり、RSSの自作もできます。サイト巡回のボットや、まとめサイトのようなものも作ることができます。最近流行りのニュースまとめサイトや、(アプリと組み合わせれば)ニュースアプリを作るのにも役に立つと思います。
特定のテーマや分野に特化したポータルサイトを作る際にも良いと思います。

実際、この本でも、実例として「amazonのサイトをクロールして、ベストセラーランキングの情報をごっそり持ってくる方法」なども紹介されていたりします。これを使って自分のサイトのバナー部分に貼ったりすれば、「amazonに見に行かなくてもウチのサイト見れば最新情報わかるよ」ってなサイトが作れるわけです。
「2chで盛り上がってるスレ」や「はてなで今一番見られている投稿」「Twitterでいま一番話題になっている動画」などなど、「急上昇ワードランキング」みたいなものも自作できます。

■開発言語rubyについて・難易度について
rubyはオブジェクト指向の言語であるため、XCODEのobjective-Cのようなわかりにくいものを連想していたのですが、記述に必要な文字数も少なく、すっきりとしたコードでとても理解
...続きを読む ›
コメント 20人のお客様がこれが役に立ったと考えています. このレビューは参考になりましたか? はい いいえ 評価を送る...
フィードバックありがとうございました。
申し訳ありませんが、お客様の投票の記録に失敗しました。もう一度試してください。
違反を報告

最近のカスタマーレビュー



フィードバック