基礎データ分析

【3分で利用開始】Google Colaboratoryの初心者向けガイド

転職_フリーランス

Pythonプログラミングの練習をしたいけど環境構築が面倒。どうしたらいいの?

Pythonの勉強環境として最適なGoogle Colaboratoryの利用方法について解説していきます!

3分で利用開始できるので、お手元にパソコンを用意してご覧ください!

この記事を書いた人

ふみと

ふみと

Google Colaboratoryとは?

Google Colaboratory

Googleアカウントがあれば、3分でPythonプログラミングを開始できるクラウドサービスです。

Google Colaboratory (以降Google Colab)にアクセスするだけで、すぐにデータサイエンスを行うために必要な深層学習・機械学習用のアプリケーションまで設定なしかつ無料で利用開始することが可能です。

また、クラウドツールなので一般購入すると高価なCPU/GPU/TPUなどのリソースもGoogleのクラウドコンピュータのリソースとして追加費用なしで利用できます。

現時点で、WEB上でのプログラミング環境トップのサービスです!

Google Colabのメリットデメリット

次にGoogle Colabのメリットとデメリットについてご紹介します。

メリット

  • プログラミング環境構築の手間がない
  • PCスペックに依存せず、高価なCPU/GPU/TPUを無料で使用可能(数十万クラス)
  • 携帯からでもプログラム開発が可能

デメリット

  • WEB上で動くサービスなので、会社データの分析に不向き(セキュリティ観点)
  • 連続使用時間が12時間なので長時間の処理は回しずらい
  • ローカルデータを接続するのに一手間必要(Google Driveへのマウント)

十分すぎるメリットがありますが、唯一の弱点は「セキュリティ観点でビジネス利用に不向きな点です。

ビジネスで利用するデータは、顧客情報や社外秘情報を含むことが多いためクラウドサービスにあげることはNGです。

勉強用に利用する場合は、Google Colabの利用がオススメです。

ビジネスで活用する場合は、ローカル環境で動作するAnacondaの利用オススメです。

マイペースに働く人
Anaconda Navigatorのインストールに関する究極のガイド

AnacondaでPython実行環境を準備したいからやり方教えてほしい 今回は、Pythonプログラムをビジネス目的で利用したい方向けにAnaconda Navigatorのインストール~プログラム ...

はじめかた

実際にGoogle Colabの利用を開始してみましょう。

Google Colabはブラウザで使います。

Google Colabの起動方法

  • Google Colabにアクセスし起動
  • Colaboratoryへようこそ画面で「ノートブックの新規作成」を押下
  • 立ち上がったノートブックにPythonプログラムを記載し実行

下記のボタンを押下して起動してみましょう。

Google Colabの起動

すると、「Colaboratoryへようこそ」という画面がでてきます。

右下の「ノートブックを新規作成」をクリックしましょう。

Google Colabトップ画面
Google Colabトップ画面
ノートブックを新規作成押下後
ノートブックを新規作成押下後(すぐに書ける!)

これだけです。

たったこれだけでPythonプログラムを書く準備ができました!

Google Colaboratoryでのプログラム管理方法

Google Colabで作成したPythonプログラムはGoogle Driveに保存されます。

オートセーブ機能がついているので、意識的に保存をしなくても自動でプログラムを更新してくれます!

ディレクトリ構造(格納先)

Google Drive内のMyDrive配下に.ipynbという拡張子で保存される。

.ipynbはJupyter Notebookに適用した汎用拡張子なので、Google Colab環境だけではなくローカル環境のAnacondaでも開くことが可能です。

プログラム開発は実行速度が速いGoogle Colabで実施して、実力はローカル環境で動くAnacondaを使うなどの棲み分けもありですね!

【参考】csvデータを取り込むときの注意点

Pandasなどのアプリケーションを使ってcsvファイル読み取る操作をすることが実務上よくあります。

が、そのままではGoogle Colabでパソコンのローカルファイルに直接アクセスすることはできず、Google Drive上にファイルを置いてからアクセスする必要があります。

よく躓くエラーなので、必ずこの機会に一度手を動かしてください。(1回やればなんてことはないです。)

全体ステップ

  • Google Drive上に操作をするファイルを配置
  • Google ColabからDriveにマウント処理を実行する
    • 認証コードのコピー(下記 GIF 画像右側)
    • 「Enter your authorization code」部分に認証コードの貼り付け
    • 貼り付けた場所で Enter 実行

②のマウント処理は以下の通りです。この処理を冒頭に追加し実行ください。

from google.colab import drive
drive.mount('/content/drive')

実行するとURLが表示されるので、クリックします。

Googleアカウントの選択画面が開くので、自信のアカウントを選択します。

Googleがアクセス許可のリクエストをしてくるので、許可します。
※許可しないとマウントできません。

表示された認証コードをコピーし、Google Colabに戻ってEnter your authorization codeにコードを貼り付け、Enterを押します。

これで準備は完了です!

これでPandasのpd.read_csv('ファイルパス')のような処理も通るようになります。

うまくいかない場合は、こちらの記事も併せてご覧ください。

まとめ

以上がGoogle Colabの利用方法でした。

環境のインストールは簡単ですが、実際のプログラミングスキルをつけるのは一朝一夕でできるものではありません。

当ブログでは、実際のデータと合わせてデータ分析プログラミングのケーススタディも展開しております。

是非最初の一歩に活用ください!

最近のコメント

    • この記事を書いた人
    • 最新記事

    ふみと

    このブログでは、データサイエンティストとして市場価値を上げる方法を独自にまとめて発信しています。 もし記事を気に入っていただけたらサイトをブックマークもしくは、Twitterをフォローお願いします! 【経歴】
    日系大手企業勤務
    データサイエンティスト歴:7年
    【保有資格】
    JDLA E資格 , Advancesd Marketer , ビジネス統計スペシャリスト , 統計検定2級 , TOEIC 805点
    【スキル】
    Python/Tableau/SQL/HTML/CSS/機械学習/Deep Learning/RPA

    著書

    Pythonの独学専用pdf教材発売中!

    -基礎データ分析