蔵書情報
この資料の蔵書に関する統計情報です。現在の所蔵数 在庫数 予約数などを確認できます。
資料情報
各蔵書資料に関する詳細情報です。
No. |
所蔵館 |
資料番号 |
資料種別 |
配架場所 |
別置 |
帯出 |
状態 |
1 |
鶴舞 | 0237400395 | 一般和書 | 2階開架 | パソコン | | 在庫 |
関連資料
この資料に関連する資料を 同じ著者 出版年 分類 件名 受賞などの切り口でご紹介します。
Tomasz Drabas Denny Lee 玉川竜司
書誌詳細
この資料の書誌詳細情報です。
請求記号 |
0076/06545/ |
書名 |
入門PySpark PythonとJupyterで活用するSpark2エコシステム |
著者名 |
Tomasz Drabas/著
Denny Lee/著
玉川竜司/訳
|
出版者 |
オライリー・ジャパン
|
出版年月 |
2017.11 |
ページ数 |
22,303p |
大きさ |
24cm |
ISBN |
978-4-87311-818-5 |
原書名 |
原タイトル:Learning PySpark |
分類 |
0076
|
一般件名 |
分散処理(コンピュータ)
|
書誌種別 |
一般和書 |
内容紹介 |
大規模なデータを処理し、活用したいエンジニアのために、PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウを解説。高速になったSpark2の特徴も紹介する。 |
書誌・年譜・年表 |
文献:p295 |
タイトルコード |
1001710070483 |
要旨 |
PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウ。はじめに高速になったSpark2.0の特徴とアーキテクチャを解説し、構造化及び非構造化データの読み取り、PySparkで利用できる基本的なデータ型、MLlibとMLパッケージによる機械学習モデルの構築を説明。GraphFramesを使ったグラフの操作、ストリーミングデータの読み取り、クラウドへのモデルのデプロイなどの方法を豊富なサンプルと一緒に学ぶ。ローカルでのSpark+Python+Jupyter環境の構築方法も紹介。 |
目次 |
1章 Sparkを理解する 2章 耐障害性分散データセット 3章 DataFrame 4章 データのモデリングの準備 5章 MLlib 6章 MLパッケージ 7章 GraphFrames 8章 TensorFrames 9章 Blazeによるポリグロットパーシステンス 10章 Structured Streaming 11章 Sparkアプリケーションのパッケージ化 |
著者情報 |
ドラバス,トマズ シアトル在住のMicrosoftに勤めるデータサイエンティスト。ヨーロッパ、オーストラリア、北米という3つの大陸で先端的なテクノロジー、航空、テレコミュニケーション、金融、コンサルティングといった数多くの分野に関わり、データ分析とデータサイエンスの経験を13年以上にわたって積んできた(本データはこの書籍が刊行された当時に掲載されていたものです) リー,デニー MicrosoftのAzure Cosmos DBチームのプリンシパルプログラムマネージャー。インターネットスケールのインフラストラクチャ、データプラットフォーム、オンプレミスとクラウド両方の環境の予測分析システムの開発経験を18年以上も持っている、分散システムおよびデータサイエンスの現場のエンジニアである(本データはこの書籍が刊行された当時に掲載されていたものです) 玉川 竜司 Sky株式会社。本業はソフト開発(本データはこの書籍が刊行された当時に掲載されていたものです) |
内容細目表:
前のページへ