詩と創作・思索のひろば

ドキドキギュンギュンダイアリーです!!!

Fork me on GitHub

Colaboratoryでワードクラウドを生成する

任意の文章に対してワードクラウドを生成したい要件があるとき、非エンジニアでも行えるようにするには、ウェブアプリケーションとして提供するのもよいが、この程度のちょっとしたスクリプトのような用途であれば Google Colaboratory でもいいんじゃね、となったのでやってみた。結果できた。

日本語の文章を入力として、分かち書きした出現頻度をもとにワードクラウドを生成する。

日本語WordCloud

走れメロス』でこんな感じになります。

Colaboratory には変数のもつデータをフォームで指定させる方法があるので、なんとなく使い方がわかるはず。複数行入力できそうな見た目のフォームはなかったけど……。

形態素解析器には Janome を利用した。pip だけでインストールできるので非常に簡単だった。

はてなで一緒に働きませんか?