修論タイトル:「チャットルームにおけるユーザの特徴を用いたトピック抽出システム」 (2009年度 修士論文)

氏名:川端 聖

概要:

インターネットの普及に伴い、インターネットを利用したコミュニケーションが増大している。これは、電子メールのような1 対1 で行うものもあれば、電子掲示板 のような、主に不特定多数の中で行うものもある。特に近年、Blog、SNS、Twitter、 チャット等、様々な形態の不特定多数のコミュニケーションを含むサービスが注目 を浴びている。本研究では、リアルタイムに行うコミュニケーションへの興味の高 まりから、この内のチャットに着目する。
チャットとは、ネットワーク上に用意された1ヵ所のスペースにおいて、複数のユー ザが、リアルタイムにテキストベースの会話を行うシステムのことである。チャッ トを行うユーザは、チャットルームと呼ばれる場所で会話を行う。チャットルームに は、テーマが静的に付けられている。テーマとは、そのチャットルームで推奨され る会話の内容をユーザに伝えるものである。たとえば、食べ物、政治、経済のよう なテーマがあり、ユーザはこれらのテーマから自分の好みのチャットルームを選択 する。
不特定多数の人が集う大規模なチャットには、各ユーザの興味を満たすために様々 なテーマのチャットルームが存在する。しかし、実際のチャットルームでは、その チャットルームのテーマに沿った、自分の興味のある話をしているとは限らない。逆 に、自分の興味のないテーマのチャットルームで、自分の興味のある話をしている こともある。また、最初は興味のある話をしていても、人の入れ替りや時間の経過 とともにチャットルームの話題が変わる可能性があるため、興味のない話に変わっ てしまうことがある。つまり、テーマによってチャットルームを選んでも、自分に 最も適しているチャットルームに行けるわけではないという問題がある。この問題 から、各チャットルームで実際に話されている内容にふさわしいテーマを知り、自 分に合ったチャットルームを選びたいという要求がある。
そこで本研究では、会話の内容から動的に決まるトピックをテーマとして代用し、 チャットルームのトピックを抽出することで、各チャットルームで実際に話されて いる内容にふさわしいテーマを見つけるシステムを提案した。なお、ここで言うト ピックとは、チャット内での会話を特徴付ける名詞群の上位概念のカテゴリを指す。
このシステム有効性を検証するために、提案したシステムを設計、実装し、実際 のチャットルームのトピック抽出の精度を測る実験を行った。実験の結果、提案し たシステムは、信頼度が高く推定されたトピックにおいて高い精度を示すことがで きた。また、より継続性のあるトピックを抽出できることも示すことができた。


[修論pdf][研究室内部向け情報]