Takai Voice: テキストデータの蓄積

これから定性分析やテキストマイニングの世界にチャレンジしますが、そうは言っても私もまだテキストマイニングの世界は殆ど分かりません。

会社としてこの世界に参入するので、私もできるだけの知識やネットワークを作りたいと考えています。そのため、アマゾンで検索して、テキスト分析に関係しそうな本を５、６冊買って週末に読み始めました。

当社にはまだ定性分析やテキストマイニングのノウハウがありませんが、定性データを沢山持っている会社ではあります。

秋に日本電子通信学会が開催の「テキストマイニング・シンポジウム」に、森、栗田、鮎沢、高井の４人で参加して、その後で、森さんと２人で懇親会に潜り込んで、キーとなりそうな方との接点を作るために動いてきました。

シンポジウムの委員長は、岡山大学の先生で、副委員長がＮＴＴドコモと、日本ＩＢＭで、言語処理を研究している方でした。

そのため、懇親パーティでは、この３人と名刺交換をして少しお話をさせていただき、その後、メールでいくつかの提案をしてきたのですが、彼らが興味を持ってくれたのがＭｙＥＬにある豊富なテキストデータでした。

テキストデータ解析を研究している方が、研究に使えるテキストデータが不足していることが分かったので、「当社には１６年前から集め続けている大量のテキストデータがあります。もし学会発表に必要なら協力しますよ。」という提案をしてみました。

そして、１２月に副委員長のＮＴＴドコモと、日本ＩＢＭのお２人が来社されて、２月の５日、６日に大阪で行なわれる学会で、ＭｙＥＬのデータを使った研究発表をしたいので、協力してほしいとのご依頼がありました。

研究発表の時に、マイボイスコムと、「アンケートデータベース（ＭｙＥＬ）」の紹介をしてもらうことと、参加者全員にＭｙＥＬの資料を配ってもらうことを条件に、いくつかのデータを提供することにしました。

当日も学会に来て、リサーチにおけるテキストマイニングの必要性について話してくれというお誘いもいただいたのですが、既にいくつかのアポがあって行けませんでしたが、テキストマイニングの関係者に対する、ＭｙＥＬや当社の認知向上には役立つと思います。

次は今年の秋には東京で３００人規模の学会シンポジウムがあります。彼らとの交流を続けながら、森さんが「テキストボイスＡＳＰ」の発表ができるように地ならしをしたいと思います。

森さん、がつんと良い発表ができるように、準備をして行きましょう！

Takai Voice