テキストデータの蓄積
これから定性分析やテキストマイニングの世界にチャレンジしますが、そうは言っても私もまだテキストマイニングの世界は殆ど分かりません。
会社としてこの世界に参入するので、私もできるだけの知識やネットワークを作りたいと考えています。そのため、アマゾンで検索して、テキスト分析に関係しそうな本を5、6冊買って週末に読み始めました。
当社にはまだ定性分析やテキストマイニングのノウハウがありませんが、定性データを沢山持っている会社ではあります。
秋に日本電子通信学会が開催の「テキストマイニング・シンポジウム」に、森、栗田、鮎沢、高井の4人で参加して、その後で、森さんと2人で懇親会に潜り込んで、キーとなりそうな方との接点を作るために動いてきました。
シンポジウムの委員長は、岡山大学の先生で、副委員長がNTTドコモと、日本IBMで、言語処理を研究している方でした。
そのため、懇親パーティでは、この3人と名刺交換をして少しお話をさせていただき、その後、メールでいくつかの提案をしてきたのですが、彼らが興味を持ってくれたのがMyELにある豊富なテキストデータでした。
テキストデータ解析を研究している方が、研究に使えるテキストデータが不足していることが分かったので、「当社には16年前から集め続けている大量のテキストデータがあります。もし学会発表に必要なら協力しますよ。」という提案をしてみました。
そして、12月に副委員長のNTTドコモと、日本IBMのお2人が来社されて、2月の5日、6日に大阪で行なわれる学会で、MyELのデータを使った研究発表をしたいので、協力してほしいとのご依頼がありました。
研究発表の時に、マイボイスコムと、「アンケートデータベース(MyEL)」の紹介をしてもらうことと、参加者全員にMyELの資料を配ってもらうことを条件に、いくつかのデータを提供することにしました。
当日も学会に来て、リサーチにおけるテキストマイニングの必要性について話してくれというお誘いもいただいたのですが、既にいくつかのアポがあって行けませんでしたが、テキストマイニングの関係者に対する、MyELや当社の認知向上には役立つと思います。
次は今年の秋には東京で300人規模の学会シンポジウムがあります。彼らとの交流を続けながら、森さんが「テキストボイスASP」の発表ができるように地ならしをしたいと思います。
森さん、がつんと良い発表ができるように、準備をして行きましょう!
コメント