任意の文章に対してワードクラウドを生成したい要件があるとき、非エンジニアでも行えるようにするには、ウェブアプリケーションとして提供するのもよいが、この程度のちょっとしたスクリプトのような用途であれば Google Colaboratory でもいいんじゃね、となったのでやってみた。結果できた。
日本語の文章を入力として、分かち書きした出現頻度をもとにワードクラウドを生成する。
『走れメロス』でこんな感じになります。
Colaboratory には変数のもつデータをフォームで指定させる方法があるので、なんとなく使い方がわかるはず。複数行入力できそうな見た目のフォームはなかったけど……。
形態素解析器には Janome を利用した。pip だけでインストールできるので非常に簡単だった。