データ分析効率UP!Jupyter Notebook/Labの基本的な使い方
データ分析を実践する上で、効率的な作業環境の構築は非常に重要です。様々なツールが存在しますが、Pythonを使ったデータ分析において、多くの専門家や学習者が利用しているのが「Jupyter Notebook」あるいはその後継である「Jupyter Lab」です。これらのツールは、コードの実行、結果の確認、そして分析過程の文書化を一つの環境で行えるため、データ分析の作業効率を大幅に向上させることができます。
この記事では、これからデータ分析を始めたいと考えている方向けに、Jupyter Notebook/Labの基本的な使い方について解説します。既にPythonの環境構築は済んでいるものとして、Jupyterの起動方法から、簡単なコード実行、データの可視化まで、実践的なステップをご紹介します。
Jupyter Notebook/Labとは
Jupyter NotebookおよびJupyter Labは、対話型の実行環境を提供するオープンソースのWebアプリケーションです。コード、実行結果、テキスト、数式、画像などを一つのドキュメントにまとめられる「ノートブック」形式で作業を進めることができます。
このノートブック形式には、以下のようなメリットがあります。
- 対話的な実行: コードセルごとに実行結果を即座に確認できるため、試行錯誤しながら分析を進めやすいです。
- 分析過程の記録: コードだけでなく、分析の目的や考察をMarkdown形式で記述できるため、分析の流れを体系的に記録・共有できます。
- 豊富な表示機能: データフレームの表形式表示やグラフの埋め込みなど、結果を分かりやすく表示できます。
多くのPython環境構築には、Jupyter Notebookが標準で含まれています。特に、データ分析向けのライブラリ群がパッケージ化されたAnacondaディストリビューションを利用している場合は、既にJupyter Notebook/Labを利用できる状態になっていることが多いです。
Jupyter Notebook/Labを起動する
Jupyter NotebookまたはJupyter Labを起動するには、コマンドプロンプト(Windows)またはターミナル(Mac/Linux)を使用するのが一般的です。
Anacondaをインストールしている場合:
- コマンドプロンプトまたはターミナルを開きます。
-
以下のコマンドを実行します。
- Jupyter Notebookを起動する場合:
jupyter notebook
- Jupyter Labを起動する場合:
jupyter lab
- Jupyter Notebookを起動する場合:
コマンドを実行すると、Webブラウザが自動的に起動し、Jupyterのインターフェースが表示されます。表示された画面が、Jupyterの作業環境となります。特別な設定をしない限り、ファイルはコマンドを実行したディレクトリを起点に表示されます。
基本的な使い方:ノートブックを作成・操作する
ブラウザで開かれたJupyterの画面では、以下の操作が可能です。
1. ノートブックの作成
画面右上の「New」ボタンをクリックし、「Python 3」などのカーネル(実行環境)を選択すると、新しいノートブックが作成され、別タブで開かれます。
2. セルの操作
ノートブックは「セル」と呼ばれる入力・出力ブロックの集まりで構成されています。主なセルの種類は以下の2つです。
- コードセル: Pythonなどのコードを記述し、実行するためのセルです。
- Markdownセル: テキスト、見出し、箇条書き、数式、画像などを記述し、整形されたドキュメントを作成するためのセルです。分析のメモや解説に使います。
3. コードの実行
コードセルにPythonコードを記述し、以下のいずれかの方法で実行します。
Shift + Enter
: セルを実行し、カーソルを次のセルに移動または新しいセルを作成します。Ctrl + Enter
(またはCmd + Enter
): セルを実行し、カーソルを現在のセルにとどめます。- ツールバーの実行ボタン(▶アイコン)をクリックします。
実行結果は、コードセルの直下に表示されます。
4. Markdownセルの使用
Markdownセルにテキストを記述し、Shift + Enter
などで実行すると、整形されたテキストが表示されます。見出しは#
の数、箇条書きは-
や*
、太字は**テキスト**
のように記述します。
5. セルの追加、削除、移動
- セルの追加: ツールバーの「+」ボタンをクリックするか、セルを選択した状態でキーボードショートカット(Esc → a で上に挿入、Esc → b で下に挿入)を使用します。
- セルの削除: セルを選択した状態でツールバーのハサミアイコンをクリックするか、キーボードショートカット(Esc → dd)を使用します。
- セルの移動: セルを選択し、ツールバーの上下矢印アイコンをクリックするか、キーボードショートカット(Esc → ↑/↓ で選択、Esc → m/k で上下移動)を使用します。
6. ノートブックの保存
ツールバーのフロッピーディスクアイコンをクリックするか、Ctrl + S
(または Cmd + S
) でノートブックを保存できます。ノートブックは.ipynb
という拡張子で保存されます。
実践:簡単なデータ分析を試す
Jupyter Notebook/Labを使って、簡単なデータ分析を試してみましょう。ここでは、データ分析でよく使われるライブラリであるpandas
とmatplotlib
を使用します。
まず、新しいノートブックを作成し、以下のコードをコードセルに記述して実行してください。
# データ分析ライブラリpandasとグラフ描画ライブラリmatplotlibをインポートします
import pandas as pd
import matplotlib.pyplot as plt
# matplotlibでグラフをノートブック内に表示するための設定です
%matplotlib inline
次に、簡単なデータを作成し、データフレームとして表示してみます。
# サンプルデータを作成します
data = {'Category': ['A', 'B', 'C', 'D', 'E'],
'Value': [10, 25, 15, 30, 20]}
# データフレームを作成します
df = pd.DataFrame(data)
# データフレームを表示します
print(df)
実行すると、以下のようにデータフレームが整形されて表示されます。
Category Value
0 A 10
1 B 25
2 C 15
3 D 30
4 E 20
最後に、このデータを簡単な棒グラフで可視化してみましょう。
# 棒グラフを作成します
plt.figure(figsize=(8, 5)) # グラフのサイズを指定します
plt.bar(df['Category'], df['Value'], color='skyblue') # 棒グラフを描画します
plt.title('Sample Data Visualization') # グラフタイトルを設定します
plt.xlabel('Category') # X軸ラベルを設定します
plt.ylabel('Value') # Y軸ラベルを設定します
plt.grid(axis='y', linestyle='--', alpha=0.7) # Y軸グリッド線を表示します
# グラフを表示します
plt.show()
このコードを実行すると、データに基づいた棒グラフがノートブック内に表示されます。このように、Jupyter Notebook/Labでは、コード実行、データの確認、可視化、そしてそれらの結果に関するテキストでの説明を一つの環境でシームレスに行うことができます。
まとめ
Jupyter Notebook/Labは、データ分析の学習と実践において非常に強力なツールです。対話的なコード実行、分析過程の記録、分かりやすい結果表示といった特長は、初心者の方でもデータ分析のステップを一つずつ確認しながら進める上で役立ちます。
まずは今回ご紹介した基本的な操作を試してみてください。簡単なデータセットを使って、コードを書いて実行し、結果を確認するサイクルを繰り返すことが、Jupyter Notebook/Labの習熟、そしてデータ分析スキル習得への第一歩となります。慣れてきたら、より複雑なデータ処理や様々なグラフ描画にも挑戦してみましょう。