2026年3月6日~8日に松山大学にて開催された情報処理学会第88回全国大会において、中村周吾研究室・卒業研究生の高田悠平さんが発表した研究「大規模言語モデルを用いた意見データセットの生成」が学生奨励賞を受賞いたしました。本研究は、情報連携学科の本多泰理教授、佐野崇准教授との共同研究です。
この大会は、情報分野の主要学会のひとつである一般社団法人情報処理学会によって年1回開催されている学会最大のイベントで、最新の学術・技術動向や研究成果の発表、意見交換などが活発に行われています。約1200件の一般講演発表に加えて、招待講演やパネル討論などのイベントもあわせて開催されています。
学生奨励賞は、学生セッションで学生会員によって発表された研究の中から、座長の裁量で優秀な発表に対して贈呈されるものです。高田さんの参加したセッションでは計9件の発表の中から、高田さんを含む2名が学生奨励賞を受賞しました。学会ホームページによる受賞者一覧はこちらです。
受賞の対象となった研究は、パブリックコメントのような「人の意見」を集めたデータセットを、大規模言語モデル (LLM) を用いて人工的に生成する新規手法の提案に関するものです。近年、パブリックコメントやSNSでの書き込みのような「人の意見」を多数集め、AI技術を用いて分析して学術・ビジネスなどに役立てる、自然言語処理によるデータマイニングの重要性が非常に高まっています。この分野では、多数のデータの処理を行う必要があるため、たとえばある書き込みが対象トピックに対して賛成か反対かを自動的に認識する、といったAIモデルの構築が必要不可欠です。この構築には、それぞれの意見に賛成か反対かの「正解ラベル」が付いた「意見データセット」が用いられますが、実際の人の意見データは、数が少ない、トピックが限られている、賛成と反対に大きな偏りがある、正解ラベルを人手でつけるのに膨大な手間がかかる、などの問題がありました。本研究はLLMを用いて、任意のトピックについて、これらの問題のない理想的な意見データセットを人工的に生成する方法を提案したものです。単にLLMに多種類のペルソナを設定して意見を生成させるだけでは、同じような意見ばかりが生成されたり、意見の内容が単純であるなど、実際の人の意見とは大きく異なってしまいます。提案手法は、各ペルソナに仮想的な経験を設定し、また1つのペルソナから複数意見を生成して多様性が保たれるように選択する多段階ステップによって意見生成を行うことで、人の意見と同程度の多様性をもち、また内容の人間らしさが、単純なペルソナ設定の約15倍向上した、より「人間らしい」意見データセットの生成に成功しました。このようなLLMを用いた理想的な意見データセットの生成は研究例が少なく、高い新規性をもつ本研究の将来の応用が期待されています。
高田悠平さんのコメント
このたび学生奨励賞をいただき、大変光栄に思います。研究する中でなかなか結果が出ず、苦しんだ時期もありましたが、中村周吾先生をはじめ、研究室の皆さん、家族、本実験に関わっていただいたすべての皆様のおかげでなんとか形にすることができました。特に中村先生には研究内容だけでなく、いろいろな物事に対する視点や姿勢も本研究を通して学び、多大なる支えをいただきました。ここで学んだことを活かして、社会に貢献できるよう精進してまいります。改めて、皆様のご支援とご協力に深く感謝を申し上げます。本当にありがとうございました。
中村周吾教授のコメント
高田さんは、自分の経験をもとに自ら研究テーマを立案し、4年生の1年間をかけて、しっかりとしたサーベイ、多数の試行錯誤と考察を行って、研究を完成させました。その努力が学生奨励賞の受賞という形で報われて、本当に良かったです。今後も社会で大きく羽ばたいてくれることを期待しています。


