【R】DataExplorer

1. はじめに

DataExplorerは、データ探索を手助けしてくれるパッケージです。データ解析する前に、どのようなデータなのかを知ることは非常に重要です。これがなかなか大変なのですが、このパッケージを使うとそれを簡単にできます。

2. インストール

CRANからインストールできます。

install.packages("DataExplorer")

3. つかってみる

もう、これ一発でほぼOKです!htmlで出力されます。

library(DataExplorer)
library(modeldata)
data("penguins")
create_report(penguins)
Data Profiling Report

Basic Statistics

Raw Counts

Name Value
Rows 344
Columns 7
Discrete columns 3
Continuous columns 4
All missing columns 0
Missing observations 19
Complete Rows 333
Total observations 2,408
Memory allocation 16.1 Kb

Percentages

Data Structure

Missing Data Profile

Univariate Distribution

Histogram

Bar Chart (with frequency)

QQ Plot

## Warning: Removed 8 rows containing non-finite values (stat_qq).
## Warning: Removed 8 rows containing non-finite values (stat_qq_line).

Correlation Analysis

Principal Component Analysis

この他にも様々な関数があります。

4. さいごに

こんなに簡単にデータ探索できるなら使わない手はないですね。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です