当サイトではアフィリエイト広告を利用しています
|
|
実データを扱う演習課題をR言語のプログラミングを行って解き進めながらデータ分析の基礎を学ぶ.プログラミング初学者にも対応.統計ソフトの使い方だけでなく,データサイエンスの基礎となる統計学などの理論面も丁寧に解説する.---本書は,データを利活用するための基本技術に関心をもつ幅広い層を読者として想定し,データサイエンスに基づく現象の基本的な見方や応用する際の考え方を身につけることを目標としています.平均的な読者として,コンピュータのプログラミングの経験はある程度あるが,データの分析は行ったことがないという人を想定し,データから情報を得るための方法,データを基にものごとをどのように考えるとよいか,という見方について具体的に紹介します.統計学や確率の専門的な知識がなくても,計算機のプログラミングを通してデータがもつメッセージを読み取ることができるように工夫しました.一方で大学の課程で統計や確率を学んでいる人にとっても,本書の演習を通して統計や確率の活きた利用の仕方が学べるようにしました.本書の中心は計算機を用いて,実際のデータを処理しながら情報を得る点にあります.データ解析系言語であるRを用いて,コンピュータプログラムを実行しながらデータの分析と評価を行う演習を用意しました.演習をコンピュータ上で行いながら,データをみて考える力をトレーニングしていきます.演習は基礎的な問題からやや実践的な問題まで段階的に用意し,計算機のプログラミングが苦手な読者にとっても,各章の基礎的な演習を進めていくだけでデータの見方が理解できるようにしました.今回の改訂では,これまでの版において不十分であった説明を改めるとともに,これまで扱ってこなかった属性のデータに関するモデル化の方法を加筆しました.具体的には,アンケートの集計結果のように複数の選択肢のなかから選んだカテゴリカルデータを用いてさまざまな分析を行うためのモデル化の方法と,その数学的背景について取り上げています.また,このモデル分析をR環境で実行するための計算技術を紹介するとともに,演習問題を通して客観的に分析,評価する力が養成できるように工夫しました.【主要目次】第1章 データの利活用とデータサイエンス第2章 R言語基礎プログラミング第3章 データの概観第4章 関係性の推測とモデル化第5章 時間変動の分析
|