1. はじめに
DataExplorer
は、データ探索を手助けしてくれるパッケージです。データ解析する前に、どのようなデータなのかを知ることは非常に重要です。これがなかなか大変なのですが、このパッケージを使うとそれを簡単にできます。
2. インストール
CRANからインストールできます。
install.packages("DataExplorer")
3. つかってみる
もう、これ一発でほぼOKです!htmlで出力されます。
library(DataExplorer) library(modeldata) data("penguins") create_report(penguins)
Data Profiling Report
Basic Statistics
Raw Counts
Name | Value |
---|---|
Rows | 344 |
Columns | 7 |
Discrete columns | 3 |
Continuous columns | 4 |
All missing columns | 0 |
Missing observations | 19 |
Complete Rows | 333 |
Total observations | 2,408 |
Memory allocation | 16.1 Kb |
Percentages
Data Structure
Missing Data Profile
Univariate Distribution
Histogram
Bar Chart (with frequency)
QQ Plot
## Warning: Removed 8 rows containing non-finite values (stat_qq).
## Warning: Removed 8 rows containing non-finite values (stat_qq_line).
Correlation Analysis
Principal Component Analysis
この他にも様々な関数があります。
4. さいごに
こんなに簡単にデータ探索できるなら使わない手はないですね。