今回は機械学習をご自身のパソコンで実装するために必要な必要最低限の環境構築についてご紹介いたします。一重に環境構築と言ってもウェブ上でオールインワンパッケージにまとめられている開発ツールがあるのでまずはそちらをご紹介させていただき、順を追って開発ツールのインストールまでみなさまに情報を共有させていただこうと考えております。

インストール不要で使えるColaboratoryについて

Google が機械学習の研究目的、または、学習用に公開している「Colaboratory』は、PCへのインストール不要で、Web ブラウザーからすぐに機械学習を実践できます。手軽に Python を試すことができる開発環境、Colaboratory の使い方を紹介します。

Google Colaboratory とは?

Anaconda という Python を中心とした機械学習の開発環境を整える方法を紹介します。オールインワンのパッケージなので、大規模アプリになってしまい、環境を構築するためには、なかなか労力が必要です。しかし、Google が提供しているColaboratory を使うと、インストール不要で機械学習の開発を始めることができます。必要なのは、HTML5 に対応した Web ブラウザーだけです。しかも、PCである必要はなく、iPhone/iPad や Androidでも機械学習を実践できます。

画像colaboratoryの画面

Colaboratory を使うメリット

Colaboratory を使えば、Python 環境をインストールする必要がありません。Colaboratoryには、最初から機械学習でよく使うライブラリーの一式がインストールされています。しかも、必要であれば任意のPython ライブラリーや Linux コマンドをインストールできます。と言うのも、Colaboratory が提供する Python や機械学習エンジンは、Google が用意したサーバー上で動きます。さらに言うなら、このサーバーのOS は、Ubuntu(Linux) なので、Ubuntu で動作するツールやライブラリーであれば、自由にインストールして動かすことができます。Colaboratory の仕組みですが、サーバー上で計算が行われ、その結果だけが Web ブラウザーに返されて表示されるというものになっています。Web ブラウザー上ですべてが動くわけではないので、ディープラーニング(深層学習)のような重たい処理も実行できるという訳です。そのため、自分のマシンスペックが低くても、Colaboratory を使えば快適に機械学習を進めることができます。Colaboratoryは無料でありながら、機械学習に特化したマシン構成、どんなスペックのマシン上でも機械学習を実践できるのです。Colaboratory が実行されるマシンですが、Linux コマンドを実行することで、スペックを調べることができます。

Colaboratory の制約

ただし、無料であるがゆえの制約もあります。Colaboratory の実行結果(プログラムの出力した結果)は、Google Drive に保存される仕組みになっています。しかし、一定期間 Colaboratory を操作しない状態が続くと、仮想マシンは停止してしまいます。仮想マシンは停止すると、初期化される仕組みになっています。せっかくダウンロードしたデータや、インストールしたライブラリーやツールも、全部初期化されてしまいます。そのため、長時間プログラムを実行したい場合には、PCをスリープ状態にしないようにして、常時タブを開いておくといった工夫が必要です。また、最大利用時間の制約があるので、それを超えて実行すると初期化されてしまいます。こうした制約があるとしても、無料で使える Colaboratory を使わない手はありません。しかも、原稿執筆時点では、最大利用時間は 12時間となっており、よほど本格的なプログラムでない限り 12時間実行しっぱなしということはないでしょう。本記事上にて実行するプログラムの多くは、Colaboratory 上で動かすことができますが、インストールされているライブラリのバージョンの差異によって正しく動かない場合もあります。記事最後にご紹介させていただく文献を参考にして該当するバージョンのライブラリで試してみてください。

Colaboratoryの基本的な使い方

それでは、Colaboratory の基本的な使い方を確認していきましょう。と言っても、はじめるのは簡単です。 Web ブラウザーで、以下のURL にアクセスするだけです。なお、Colaboratory を使うには、Google アカウントが必要です。Google アカウントでログインした状態で URL にアクセスしましょう。

Google Colaboratory[URL] https://colab.research.google.com/

すると、以下のように「最近のノートブック」の画面が表示されます。そこで、画面右下にある「ノートブックを新規作成」のボタンをクリックしましょう。

画像最近のノートブックの画面

そして、「PYTHON3 の新しいノートブック」を選ぶと、新規ノートブックが作成されます。

画像 新規ノートブックを作ってみよう

簡単なプログラムを実行してみよう

新しいノートブックに簡単なプログラムを書いて実行してみましょう。ここでは、以下のようにPython のプログラムを記述して、エディターの左側にある実行ボタンを押しましょう。すると、プログラムのすぐ下に実行結果が表示されます。

画像Python のプログラムを実行したところ

さらにプログラムを記述するには、Colaboratory のメニューから[挿入> コードセル]をクリックします。すると、新たなプログラムを入力して実行させることができます。

同様に数式を指定して、グラフを描画することもできます。

画像グラフの描画も可能

素材ファイルをアップロードしよう

Colaboratory は Google のサーバー上で実行されるため、ローカル(PC 上)にあるファイルをプログラムから使う際には、ファイルをサーバーにアップロードする必要があります。そのために用意されているのが、google.colab モジュールです。このモジュールは最初からインストールされており、以下の2行のプログラムを記述して実行すると、素材ファイルをアップロードするフォームが表示されます。

from google.colab import filesuploaded= files.upload ()

ここで「ファイルを選択」ボタンを押すと、ローカルファイルをアップロードできます。

画像ファイルのアップロードフォームを表示するために2行のコードを記述する

応用のヒント

ここまで紹介したように、Colaboratory は、Web ブラウザーさえあれば、PC さえ用意することなく、ダブレットやスマートフォンでも機械学習を実践することができます。機械学習の初歩の初歩で、とりあえず試してみたいという場合に、まずColaboratoryでプログラムを動かしてみましょう。また、Colaboratory を実行するマシンのスペックはそれほど悪くないので、自分の PCのスペックが足りない場合に使うこともできます。

この節のまとめ

・Colaboratory はインストール不要の機械学習の実行環境

・Ubuntu(Linux) 上に構築されており、自由にライブラリーやモジュールをインストールできる

・実行結果は、Google Drive に保存される

・利用制限があり、一定時間経つと初期化されてしまうので注意が必要

いかがでしたでしょうか、環境構築や機械学習というとそれなりに手間のかかる手順を踏む必要があると勘違いされていた方も多いのではないでしょうか。実際手軽にプログラミングから機械学習までオンライン上で実装が可能で初学者にも敷居がそこまで高くないと思います。本記事でご興味を持った方は是非ともブラウザ上で検索していただき、シンプルなプログラミングソースを実装ないしは自身でコーディングしてみてはいかがでしょうか?