Mine Laboratory 高度ソフトウェア工学講座 知的情報環境研究室

Projects

(English version)

いずれも,データ(規模は小規模から大規模までまちまち)に対して機械学習や深層学習を適用する点は共通です. 違いは,データの内容に合わせて,機械学習や深層学習を利用しデータの意味表現を学習したり, 機械学習や深層学習の適用方法を研究したり,データの意味やパタンなどを抽出したり,推薦などを行う点です.

Educational Data Mining

  1. 学習者の学習状況,学習能力を推定,成績変化の推定とその理由の説明
    • 利用データ:学習者の振り返り文,講師の報告文,定期試験の成績など
    • 予測対象:授業の成績,模擬試験の成績,講師が与える生徒の理解度
    • 内容:振り返り文や講師報告文の中から学習状況や学習能力に関連する特徴(語や表現)とその重要度を見つけ,学習状況や学習能力を推定する
    • コメント:これまで行ってきた大学生の振り返り文に加え,学習塾との共同研究で,中学生の振り返り文や講師の報告文等のデータを利用して, 成績予測や,学習状況推定,成績変化の推定,講師の報告文の生成などの研究を進めています.
  2. 学習者へのフィードバック文の自動生成
    • 利用データ:学習者の振り返り文,講師の報告文,定期試験の成績など
    • 生成対象:学習者へのアドバイス文,講師の報告文
    • 内容:機械学習や深層学習を利用し,振り返り文に対応するアドバイス文の生成や講師報告文を,数個のキーワードから自動生成する
  3. 短答式解答文の自動採点(大学入試センターとの共同研究)
    • 利用データ:ルーブリック(採点基準),模範解答,生徒の解答文
    • 推定対象:学習者の解答文の点数
    • 内容:機械学習や深層学習を利用し,ルーブリック(採点基準),模範解答に基づき, 生徒の解答文の採点結果(教師データ)をできるだけ使わずに,解答文の点数を推定する.
    • コメント:精度で新たなSOTAとなることはもちろん,学習時間の短い,効率の良い手法の開発を行っています.

Smart Mobility 

  1. バスプローブデータを利用したバス停間の走行時間,遅延時間の推定,九大学研都市駅での待ち時間推定
    • 利用データ: 昭和バスのプローブデータ,バスの時刻表,九大学研都市駅でのJR時刻表
    • 推定対象:バス停間の走行時間,遅延時間の推定,九大学研都市駅での待ち時間
    • 内容:伊都キャンパスに入る,昭和自動車の路線バスのプローブデータを取得し, 停車回数,停車時間,バス停間の移動時間・遅延時間,九大学研都市駅での待ち時間などを推定する. 道路状況,道路特性などの推定や,移動時間,遅れ時間の原因の究明のほか, バスと電車の接続性を考慮した乗客の満足度を下げるバス便とその状況や理由の特定などに応用. また,運転手特性の推定なども実施
  2. ドライブレコーダデータに基づく運転手特性,危険運転などの推定
    • 利用データ:プローブデータ(位置,日時,曜日,加速度,速度,車ID),天候情報,動画情報
    • 推定対象:運転手特性,危険運転状況,危険個所 など
  3. 地域コミュニティでのモビリティ状況の解析
    • 利用データ: オンデマンドバスの利用履歴データ
    • 推定対象:利用者の乗降パタン
    • 内容:オンデマンドバスのデータを基にした,地域のモビリティパタンの推定のほか,モビリティ状況の改善に役立つと思われる提案をデータ解析を通して行う

Recommendation and Data (Text) Mining

  1. 質問応答システム(チャットボット)の構築
    • 回答不能な質問(異なる意図や領域外の質問)の識別
      • 利用データ:オープンデータ(テキストデータ)
      • 推定対象:用意された回答と異なる意図を持っていたり領域外の質問,質問に対応する回答
      • 内容:企業との共同研究を通して,チャットボットシステムの開発を行っています.
        GAN (Generative Adversarial Network)を利用して疑似的に応答対象外の質問を生成し,これを利用する手法や,回答可能な領域内の情報だけを使って, 領域外質問を識別する手法の研究開発です.
    • 話者の感情推定
      • 利用データ:オープンデータ(テキストデータ,マルチモーダルデータ)
      • 推定対象:話者の感情
      • 内容:話者のテキスト表現などから,話者の悲しみ,喜び,怒り,平常,寂しさ,嬉しさなどの感情を推定します. これにより,話者との対話を,より円滑に行うための文章(回答)生成を目指します.
  2. 特許データからの固有表現抽出,固有表現の関係抽出
    • 利用データ:特許文書(特に材料科学関連)
    • 推定対象:抽出対象のタグ(元素,分量など)
    • 内容:少ない教師データを利用し,抽出対象の固有表現抽出を行う.現在,論文を投稿中で,出版されてから,詳細は記します.
  3. 商品データ(画像,テキストのマルチモーダルデータ)マイニング
    • Helpful Vote counts of Review
      • 利用データ:オープンデータ
      • 推定対象:Reviewが役に立ったと答えた人数 (Helpful Vote counts)
      • 内容:ReviewのHelpful Vote countsの分布が変化することに着目し,分布に適応したHelpful Vote countsの推定手法の研究
    • 多腕バンディッドを利用したクリックされる商品の推定
      • 利用データ:利用許諾付データ
      • 推定対象:クリックされる商品
      • 内容:クリックされる商品の推定に利用する推薦手法の有効性が,利用者の利用履歴や文脈(商品のカテゴリなど),時間変化に影響されることに着目し, 文脈や時間などの変化に迅速に対応する多腕バンディッドのポリシーの研究開発
    • 不正なReview度合(サクラ度)の推定
      • 利用データ:e-コマースサイトからスクレイピングしたデータ
      • 推定対象:不正なReview度合(サクラ度)
      • 内容:e-コマースサイトからデータをスクレイピングで収集し,サクラチェッカーのサクラ度を教師データとして, サクラ度を求めるのに必要かつ,公開されていない素性の発見を行います.
        その他,サクラ度なども加味した,個別化された推薦システムの研究開発なども行います.
  4. Web上の大規模テキストデータのマイニング
    • 利用データ:オープンデータ,APIの契約によって収集したデータ
    • 推定対象:利用者が求める商品や場所,その種類など
    • 内容:人がインタラクション(選択)した商品や場所などのデータから推薦に有用な特徴を, Graph Convolutional Network (GCN)を利用して獲得し,それを推薦や推定に生かす手法の研究
などについて研究を行っています.

科研費プロジェクト

キーワード: 深層学習,機械学習,自然言語処理,画像処理,テキストマイニング,データマイニング(時系列データ処理,グラフ構造データ), 情報推薦,マルチエージェント,高度交通システム(ITS),プローブデータ,マルチモーダルデータ,質問応答システム

発表論文など: 次のページをご覧ください. Recent Papers and Books