スキルUP!データ分析実践

データ分析効率UP!Jupyter Notebook/Labの基本的な使い方

Tags: Jupyter Notebook, Jupyter Lab, Python, データ分析環境, 学習方法

データ分析を実践する上で、効率的な作業環境の構築は非常に重要です。様々なツールが存在しますが、Pythonを使ったデータ分析において、多くの専門家や学習者が利用しているのが「Jupyter Notebook」あるいはその後継である「Jupyter Lab」です。これらのツールは、コードの実行、結果の確認、そして分析過程の文書化を一つの環境で行えるため、データ分析の作業効率を大幅に向上させることができます。

この記事では、これからデータ分析を始めたいと考えている方向けに、Jupyter Notebook/Labの基本的な使い方について解説します。既にPythonの環境構築は済んでいるものとして、Jupyterの起動方法から、簡単なコード実行、データの可視化まで、実践的なステップをご紹介します。

Jupyter Notebook/Labとは

Jupyter NotebookおよびJupyter Labは、対話型の実行環境を提供するオープンソースのWebアプリケーションです。コード、実行結果、テキスト、数式、画像などを一つのドキュメントにまとめられる「ノートブック」形式で作業を進めることができます。

このノートブック形式には、以下のようなメリットがあります。

多くのPython環境構築には、Jupyter Notebookが標準で含まれています。特に、データ分析向けのライブラリ群がパッケージ化されたAnacondaディストリビューションを利用している場合は、既にJupyter Notebook/Labを利用できる状態になっていることが多いです。

Jupyter Notebook/Labを起動する

Jupyter NotebookまたはJupyter Labを起動するには、コマンドプロンプト(Windows)またはターミナル(Mac/Linux)を使用するのが一般的です。

Anacondaをインストールしている場合:

  1. コマンドプロンプトまたはターミナルを開きます。
  2. 以下のコマンドを実行します。

    • Jupyter Notebookを起動する場合: jupyter notebook
    • Jupyter Labを起動する場合: jupyter lab

コマンドを実行すると、Webブラウザが自動的に起動し、Jupyterのインターフェースが表示されます。表示された画面が、Jupyterの作業環境となります。特別な設定をしない限り、ファイルはコマンドを実行したディレクトリを起点に表示されます。

基本的な使い方:ノートブックを作成・操作する

ブラウザで開かれたJupyterの画面では、以下の操作が可能です。

1. ノートブックの作成

画面右上の「New」ボタンをクリックし、「Python 3」などのカーネル(実行環境)を選択すると、新しいノートブックが作成され、別タブで開かれます。

2. セルの操作

ノートブックは「セル」と呼ばれる入力・出力ブロックの集まりで構成されています。主なセルの種類は以下の2つです。

3. コードの実行

コードセルにPythonコードを記述し、以下のいずれかの方法で実行します。

実行結果は、コードセルの直下に表示されます。

4. Markdownセルの使用

Markdownセルにテキストを記述し、Shift + Enterなどで実行すると、整形されたテキストが表示されます。見出しは#の数、箇条書きは-*、太字は**テキスト**のように記述します。

5. セルの追加、削除、移動

6. ノートブックの保存

ツールバーのフロッピーディスクアイコンをクリックするか、Ctrl + S (または Cmd + S) でノートブックを保存できます。ノートブックは.ipynbという拡張子で保存されます。

実践:簡単なデータ分析を試す

Jupyter Notebook/Labを使って、簡単なデータ分析を試してみましょう。ここでは、データ分析でよく使われるライブラリであるpandasmatplotlibを使用します。

まず、新しいノートブックを作成し、以下のコードをコードセルに記述して実行してください。

# データ分析ライブラリpandasとグラフ描画ライブラリmatplotlibをインポートします
import pandas as pd
import matplotlib.pyplot as plt

# matplotlibでグラフをノートブック内に表示するための設定です
%matplotlib inline

次に、簡単なデータを作成し、データフレームとして表示してみます。

# サンプルデータを作成します
data = {'Category': ['A', 'B', 'C', 'D', 'E'],
        'Value': [10, 25, 15, 30, 20]}

# データフレームを作成します
df = pd.DataFrame(data)

# データフレームを表示します
print(df)

実行すると、以下のようにデータフレームが整形されて表示されます。

  Category  Value
0        A     10
1        B     25
2        C     15
3        D     30
4        E     20

最後に、このデータを簡単な棒グラフで可視化してみましょう。

# 棒グラフを作成します
plt.figure(figsize=(8, 5)) # グラフのサイズを指定します
plt.bar(df['Category'], df['Value'], color='skyblue') # 棒グラフを描画します
plt.title('Sample Data Visualization') # グラフタイトルを設定します
plt.xlabel('Category') # X軸ラベルを設定します
plt.ylabel('Value') # Y軸ラベルを設定します
plt.grid(axis='y', linestyle='--', alpha=0.7) # Y軸グリッド線を表示します

# グラフを表示します
plt.show()

このコードを実行すると、データに基づいた棒グラフがノートブック内に表示されます。このように、Jupyter Notebook/Labでは、コード実行、データの確認、可視化、そしてそれらの結果に関するテキストでの説明を一つの環境でシームレスに行うことができます。

まとめ

Jupyter Notebook/Labは、データ分析の学習と実践において非常に強力なツールです。対話的なコード実行、分析過程の記録、分かりやすい結果表示といった特長は、初心者の方でもデータ分析のステップを一つずつ確認しながら進める上で役立ちます。

まずは今回ご紹介した基本的な操作を試してみてください。簡単なデータセットを使って、コードを書いて実行し、結果を確認するサイクルを繰り返すことが、Jupyter Notebook/Labの習熟、そしてデータ分析スキル習得への第一歩となります。慣れてきたら、より複雑なデータ処理や様々なグラフ描画にも挑戦してみましょう。