Google Colaboratoryとは?:使い方とGUPを使用したPython環境の構築

時計 2023.01.07 / 時計

Google Colaboratoryとは?:使い方とGUPを使用したPython環境の構築

記事ではGoogle Colaboratory(グーグルコラボラトリー)について詳しく解説していきます。

Google Colaboratoryは大量のデータ処理を必要とする機械学習やディープラーニングなどで利用されることが多いです。

機械学習について詳しくは以下記事をご参照ください。

機械学習やディープラーニングを学習しててまず最初に困ることが、Pythonを実行する環境を構築することです。

Google Colaboratoryは無料で簡単にPython環境を構築でき、かつGPUも利用できるため非常にお勧めです。本記事を通して、Google Colaboratoryの使い方について理解を深めてください。

Google Colaboratory

Google Colaboratoryとは

Google Colaboratory(略称:Colab)とはGoogleが提供しているWebサービスの一つで、ブラウザ上で無料で利用できるJupyter Notebook環境です。

つまりブラウザ上でPythonを実行できるサービスということです。

作成したプログラムはクラウド上で実行されるため、使用しているパソコンのスペックや環境を考える必要はありません。

Google ColaboratoryはGPUが無料で利用できるためPythonによる機械学習・ディープラーニング・データ分析といった重い処理にも利用できます。GPUについて詳しくは以下記事をご参照ください。

インストール不要で簡単にハイスペックなPython環境を構築できるため、Google Colaboratoryを利用するほとんどの人が機械学習・ディープラーニング・データ分析で使っている印象があります。

Google Colaboratoryには有料版もあり、よりハイスペックなGPUやメモリを利用できます。Colab Proであれば月額1,072円で利用できるため、無料版では物足りない方は有料版の利用を検討してください。

Google Colaboratory:Colab Proの金額

Google Colaboratoryで使用できるPCスペック

2023年1月現在のGoogle ColaboratoryのPCスペックは以下の通りです。

  • OS:Ubuntu 18.04
  • CPU:Intel(R) Xeon(R) CPU @ 2.30GHz
  • GPU:NVDIA Tesla K80
  • RAM:13GB

特徴

Google Colaboratoryの特徴を以下に記します。

Google Colaboratoryの特徴
  • Googleアカウントを作成すれば無料で利用できる(有料版もあり)
  • インストール不要でハイスペックなPython実行環境をクラウド上で利用できる
  • 機械学習に必要なライブラリが最初からインストールされている
  • 無料でGPUが利用できる
  • 連続利用可能な時間は12時間
  • 90分間利用がなければ自動的にシャットダウンされる
  • シャットダウンされると初期化される(データが消える)
  • 簡単に共有できる

Google Colaboratoryの使用方法

Google Colaboratoryへのアクセス

Google Colaboratoryにアクセスする前にGoogleアカウントでログインしてください。その後、下記に記すリンクからGoogle Colaboratoryのサイトへアクセスしてください。

Google Colaboratory

ノートブックの新規作成

Google Colaboratoryではノートブックを作成し、そこにPythonのコードを記入してプログラムを作成していきます。

そのためまずはコードを記入する場所であるノードブックを以下の流れで作成します。

  1. 左上の「ファイル」<「ノートブックを新規作成」をクリック
  2. Google Colaboratory:左上の「ファイル」<「ノートブックを新規作成」をクリック
  3. 新規のノートブックが表示される
  4. Google Colaboratory:新規のノートブックが表示される

ノートブックは①タイトル、②セル、③セル操作などから構成されています。

Google Colaboratory:ノートブックの構成

タイトルはクリックすると編集モードになりますので、好きなタイトルに変更できます。

作成したノートブックは自動的にGoogle Driveに自動的に保存されます。保存される場所は「マイドライブ」<「Colab Notebooks」内です。

Google Colaboratory:ノートブックのGoogle Driveでの保存場所

コードセルとテキストセル

ノートブックのセル(cell)とは入力フィールドのことです。ノートブックには以下2種類のセルが備わっています。

  • コードセル
  • テキストセル

コードセル

コードセルはPythonのコードを記述する場所です。ノートブックを新規作成するとコードセルが一つ追加された状態となっております。

Google Colaboratory:コードセル

コードセルはPythonのコードを入力する場所と、入力したPythonを実行するボタンで構成されています。

Google Colaboratory:コードセルの構成

コードセルにPythonのコードを入力して実行ボタンを押下すると、以下例のように実行結果が表示されます。

Google Colaboratory:コードセルの実行結果

コードセルを追加したい場合は「+コード」をクリックします。

Google Colaboratory:+コードをクリック

テキストセル

テキストセルはノートブックの説明やコードの説明、見出しなどメモ書きができるセルです。

テキストセルを追加するには「+テキスト」をクリックします。

Google Colaboratory:テキストセルを追加するには「+テキスト」をクリック

テキストセルはマークダウン記法を用いて記述します。以下に主に利用するマークダウン記法を記します。

要素 記述方法
見出し # 見出し1
## 見出し2
### 見出し3
リスト - リスト1
- リスト2
順番付きリスト 1. リスト
2. リスト
Google Colaboratory:テキストセルによるマークダウン記法

GPUの設定

ノートブック作成時はGPUが有効になっていません。そのためGPUを利用してコードを実行したい場合は、コードを実行する前に以下の流れでGPUを有効にしてください。

  1. メニューから「ランタイム」<「ランタイムのタイプを変更」を選択
  2. Google Colaboratory:メニューから「ランタイム」<「ランタイムのタイプを変更」を選択
  3. ハードウェアアクセラレータを「None」から「GPU」に変更し、「保存」をクリック
  4. Google Colaboratory:ハードウェアアクセラレータを「None」から「GPU」に変更し、「保存」をクリック

上記操作によりGPUが有効になります。ディープラーニングなど重い処理を行う場合は必ずGPUを有効にしておきましょう。

Pythonライブラリのインストール

Google Colabには最初から様々なライブラリ、特に機械学習で利用するライブラリがインストールされています。

Google Colabにインストールされている主なライブラリ
  • Numpy
  • Tensorflow
  • PyTorch
  • Matplotlib
  • Pandas
  • scikit-learn
  • Pillow

Google Colabにインストールされているライブラリすべてを確認したい場合は以下コマンドを実行してください。

pip list

事前にインストールされていないライブラリを新たにインストールしたい場合、以下構文に従ってコマンドを実行します。

構文

!pip install ライブラリ名

シェルコマンドの実行

コードセルに入力するコマンドの先頭に「!」をつけることで、シェルコマンドを実行できます。

構文

! shell command

Google Colaboratory:シェルコマンドの実行

シェルとシェルコマンド

シェルとはカーネルとユーザーの仲立ちをしているユーザーインターフェースです。シェルはユーザーが入力したコマンドを解釈し、カーネルへ実行を依頼、結果をユーザーに返すという流れで動いています。

シェルコマンドとはシェルが解釈できるユーザーが入力するコマンドのことです。

ファイルのアップロード

ノートブックで利用したいファイルはアップロードする必要があります。ファイルをアップロードする方法は以下の2通りです。

  • サイドバーのファイルボタンを利用
  • files.upload()コマンドを実行

サイドバーのファイルボタンを利用

最も簡単な方法が、サイドバーにあるファイルボタンを押して展開された画面にファイルをドラッグ&ドロップすることです。

サイドバーを利用したファイルのアップロード

アップロードが無事完了すると、アップロードしたファイル名が追加されます。

注意

Google Colaboratoryの特徴で述べたように、アップロードしたファイルや生成されたファイルはシャットダウンされるとすべて削除されます

files.upload()コマンドを実行

files.upload()コマンドを実行することでファイルをアップロードすることもできます。files.upload()コマンドを利用する前に、google.colabからfilesをインポートする必要があります。

from google.colab import files
uploaded = files.upload()

上記コマンドを実行すると「ファイル選択」ボタンが表示されます。ボタンをクリックしてファイルをアップロードできます。

Google Colaboratory:files.upload()によるファイルのアップロード

ファイルのダウンロード

Google Colaboratoryがシャットダウンするとすべてのファイルが削除されてしまいます。そのため作成したデータファイルなどは削除される前にご自身のパソコンにダウンロードしておく必要があります。

Google Colaboratoryにアップロードしたファイルや生成したファイルをダウンロードする方法は以下の2通りです。

  • ファイルボタンで表示されるファイル一覧からダウンロード
  • files.download()コマンドからダウンロード

ファイルボタンで表示されるファイル一覧からダウンロード

サイドバーのファイルボタンを押して表示されるファイル一覧画面からファイルをダウンロードする方法は以下の通りです。

  1. 「ファイル」ボタンをクリック
  2. 対象のファイルにマウスカーソルを乗せる
  3. ファイル名の右側に表示される「…」をクリック<「ダウンロード」を選択する
  4. Google Colaboratory:ファイル名の右側に表示される「…」をクリック<「ダウンロード」を選択

files.download()コマンドからダウンロード

files.download()コマンドを実行することで、引数で指定したファイル名のファイルをダウンロードできます。

from google.colab import files
files.download("test.pdf")