ブログのURLを入力すると、以下のように分析してくれる。
http://3.1415.jp/sites/default/files/blogger_importer/11/this-blog-is-duty-fulfiller.html



<p>
こちらがそのサイト。
http://www.typealyzer.com/
</p>

<p>
当然ながらというか、残念ながら、日本語には対応していない。このブログを試したらタイ語には対応してません、といわれた。
<blockquote>
Detected language Thai. The only supported languages are English and Swedish. But stay tuned, we are expanding.
</blockquote>
</p>

<p>では、自分で書いた英文を読み込ませてみよう。</p>

<img style=”display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;width: 320px; height: 158px;” src=”http://3.1415.jp/sites/default/files/blogger_importer/s320/img1.PNG” border=”0” alt=”“id=”BLOGGER_PHOTO_ID_5274297428244425826” />

<img style=”display:block; margin:0px auto 10px; text-align:center;cursor:pointer; cursor:hand;width: 320px; height: 231px;” src=”http://3.1415.jp/sites/default/files/blogger_importer/s320/img2.PNG” border=”0” alt=”“id=”BLOGGER_PHOTO_ID_5274297528357204738” />

<blockquote>
<p>ESTP型 - 実行家</p>

<p>積極的で陽気なタイプです。周りの人や物事を調和させ、エネルギッシュでよく喋り、冗談をいい、外で身体を動かすことが好きなタイプです。</p>

<p>注意力と集中力が要求される、身体を動かす仕事をしているときに最も喜びを感じます。非常に衝動的で、誰かについていくよりも自分で何かを始めることを強く望みます。じっと座っていることや、静かにしていることができません。</p>
</blockquote>

<p>ぜんぜん違うじゃん。。。</p>


<p>言語判定は、自動収集した training data を language classifier に読み込ませて作っている。日本語の training data は無いのだろう。また、分析対象のテキストは与えられたURLに載っているもののみで、そこから先のクロールはしていない。</p>

<p>集合知と機械学習を使って文章スタイルから性格判定するという発想が面白い。</p>

<p>ところで、このサイトは uClassify というフリーの text classfier ウェブサービスを使っている。

http://www.uclassify.com/</p>

<p>このサービスが日本語形態素解析に対応して、training data として日本語ブログを与えれば、日本語ブログの性格判定もできるはず。training data の分類は手作業になるのだろう。</p>

<p>uClassify を使ったサービスは他にも存在する。性別判定サービスがそのひとつ。

http://www.genderanalyzer.com/</p>

<p>先ほどの文章を GenderAnalyzer に読み込ませてみると、</p>

<blockquote>
Results



We think http://xxx.xxx.xxx/ is written by a woman (68%).
</blockquote>

<p>68%の確率で女性だそう。こちらのサービスでは、現時点で4000のブログを training data として用いている。</p>