Projects

(English version)

いずれも，データ（規模は小規模から大規模までまちまち）に対して機械学習や深層学習を適用する点は共通です．違いは，データの内容に合わせて，機械学習や深層学習を利用しデータの意味表現を学習したり，機械学習や深層学習の適用方法を研究したり，データの意味やパタンなどを抽出したり，推薦などを行う点です．

Educational Data Mining

学習者の学習状況，学習能力を推定，成績変化の推定とその理由の説明

利用データ：学習者の振り返り文，講師の報告文，定期試験の成績など
予測対象：授業の成績，模擬試験の成績，講師が与える生徒の理解度
内容：振り返り文や講師報告文の中から学習状況や学習能力に関連する特徴（語や表現）とその重要度を見つけ，学習状況や学習能力を推定する
コメント：これまで行ってきた大学生の振り返り文に加え，学習塾との共同研究で，中学生の振り返り文や講師の報告文等のデータを利用して，成績予測や，学習状況推定，成績変化の推定，講師の報告文の生成などの研究を進めています．

振り返り文からのメタ認知情報の特定

利用データ：学習者や研修生の振り返り文
予測対象：メタ認知情報（特に，PDCAでの行動・評価に関する情報）
内容：学習者や研修生が，振り返りにおいて，メタ認知ができているか（自身のことをわかっているか）を明らかとするため，PDCAに着目し，その中で，特に自身の行動や評価が振り返り文中に記載されているかを特定する．
コメント：現在は，共同研究先から提供された研修生の振り返り文を基に，研究を進めていますが，一般の振り返り文に対しても実施可能です．

学習者へのフィードバック文の自動生成

利用データ：学習者の振り返り文，講師の報告文，定期試験の成績など
生成対象：学習者へのアドバイス文，講師の報告文
内容：機械学習や深層学習を利用し，振り返り文に対応するアドバイス文の生成や講師報告文を，数個のキーワードから自動生成する．また，メタ認知情報の特定結果を基に，メタ認知ができているか，自身の行動や評価，改善ができているかをフィードバック文として生成する．

短答式解答文の自動採点（大学入試センターとの共同研究）

利用データ：ルーブリック（採点基準），模範解答，生徒の解答文
推定対象：学習者の解答文の点数
内容：機械学習や深層学習を利用し，ルーブリック（採点基準），模範解答に基づき，生徒の解答文の採点結果（教師データ）をできるだけ使わずに，解答文の点数を推定する．
コメント：精度で新たなSOTAとなることはもちろん，学習時間の短い，効率の良い手法の開発を行っています．

　iTOChat: 高校生向けモバイル学科推薦システムの開発
研究室配属先選択支援システムの開発

Smart Mobility　

タクシープローブデータの活用

運転特性推定：
事故に関連する運転行動の抑制のため，プローブデータを活用した運転特性推定の研究を行っています．
空車時が，賃走時に比べて事故が多いと言われていることから，プローブデータの情報に基づき，乗降時を特定する手法の開発を行っています．
防犯への利用：
ドライブレコーダのデータを活用し，容疑者逮捕につながるデータの効率的な検索手法の研究を行っています．

バスプローブデータを利用したバス停間の走行時間，遅延時間の推定，九大学研都市駅での待ち時間推定

利用データ: 昭和バスのプローブデータ，バスの時刻表，九大学研都市駅でのJR時刻表
推定対象：バス停間の走行時間，遅延時間の推定，九大学研都市駅での待ち時間
内容：伊都キャンパスに入る，昭和自動車の路線バスのプローブデータを取得し，停車回数，停車時間，バス停間の移動時間・遅延時間，九大学研都市駅での待ち時間などを推定する．道路状況，道路特性などの推定や，移動時間，遅れ時間の原因の究明のほか，バスと電車の接続性を考慮した乗客の満足度を下げるバス便とその状況や理由の特定などに応用．また，運転手特性の推定なども実施

ドライブレコーダデータに基づく運転手特性，危険運転などの推定

利用データ：プローブデータ（位置，日時，曜日，加速度，速度，車ID），天候情報，動画情報
推定対象：運転手特性，危険運転状況，危険個所など

地域コミュニティでのモビリティ状況の解析 (終了)

利用データ: オンデマンドバスの利用履歴データ
推定対象：利用者の乗降パタン
内容：オンデマンドバスのデータを基にした，地域のモビリティパタンの推定のほか，モビリティ状況の改善に役立つと思われる提案をデータ解析を通して行う

Recommendation and Data (Text) Mining

質問応答システム（チャットボット）の構築

回答不能な質問（異なる意図や領域外の質問）の識別

利用データ：オープンデータ（テキストデータ）
推定対象：用意された回答と異なる意図を持っていたり領域外の質問，質問に対応する回答
内容：企業との共同研究を通して，チャットボットシステムの開発を行っています．（終了）
GAN (Generative Adversarial Network)を利用して疑似的に応答対象外の質問を生成し，これを利用する手法や，回答可能な領域内の情報だけを使って，領域外質問を識別する手法の研究開発です．

話者の感情推定

利用データ：オープンデータ（テキストデータ，マルチモーダルデータ）
推定対象：話者の感情
内容：話者のテキスト表現などから，話者の悲しみ，喜び，怒り，平常，寂しさ，嬉しさなどの感情を推定します．これにより，話者との対話を，より円滑に行うための文章（回答）生成を目指します．

特許データからの固有表現抽出，固有表現の関係抽出

利用データ：特許文書（特に材料科学関連）
推定対象：抽出対象のタグ（元素，分量など）
内容：少ない教師データを利用し，抽出対象の固有表現抽出を行う．

商品データ（画像，テキストのマルチモーダルデータ）マイニング

Helpful Vote counts of Review

利用データ：オープンデータ
推定対象：Reviewが役に立ったと答えた人数 (Helpful Vote counts)
内容：ReviewのHelpful Vote countsの分布が変化することに着目し，分布に適応したHelpful Vote countsの推定手法の研究

多腕バンディッドを利用したクリックされる商品の推定

利用データ：利用許諾付データ
推定対象：クリックされる商品
内容：クリックされる商品の推定に利用する推薦手法の有効性が，利用者の利用履歴や文脈（商品のカテゴリなど），時間変化に影響されることに着目し，文脈や時間などの変化に迅速に対応する多腕バンディッドのポリシーの研究開発

不正なReview度合（サクラ度）の推定 (停止中)

利用データ：e-コマースサイトからスクレイピングしたデータ
推定対象：不正なReview度合（サクラ度）
内容：e-コマースサイトからデータをスクレイピングで収集し，サクラチェッカーのサクラ度を教師データとして，サクラ度を求めるのに必要かつ，公開されていない素性の発見を行います．
その他，サクラ度なども加味した，個別化された推薦システムの研究開発なども行います．

Web上の大規模テキストデータのマイニング．

利用データ：オープンデータ，APIの契約によって収集したデータ
推定対象：利用者が求める商品や場所，その種類など
内容：人がインタラクション（選択）した商品や場所などのデータから推薦に有用な特徴を， Graph Convolutional Network (GCN)を利用して獲得し，それを推薦や推定に生かす手法の研究
コメント：現在は特に，人がどのような場所（Point of Interest: POI)を訪れるか，その行動特徴を基に，POIの特徴付け（カテゴリの再評価，有名度の明確化など）とPOIの推薦を行う手法の開発を進めています．従来の研究と異なり，あまり知られていないPOIの発掘と，そのようなPOIを好む人への推薦に着目しています．

国会会議録および政治資金収支報告書の分析基盤の構築

国会図書館のデータベースから，国会会議録および政治資金収支報告書のデータを収集し，データの分析基盤の構築を行っています．
　１次資料である国会会議録に基づき，ニュースの偏向報道や，SNSに投稿されるFake情報の特定，質疑で取り上げられている内容や資金の流れから，政治上の課題や政治の傾向などの特定を行っていきます．

大規模視覚言語モデル (Vision-Language Model: VLM) の活用

VLMの社会的バイアスの軽減とノイズ耐性向上に向けた表現学習 :
- 画像と言語を同時に扱うVLMの急速な発展とともに，様々な応用タスクでの利用が進んでいる．一方で，VLMの構築に利用された大量の画像データとそれに付与されたテキストデータの偏りから起こる公平性バイアスの問題，ならびに実運用で避けられない低照度・圧縮劣化・気象などのノイズによるVLMの脆弱性問題が，多くの研究で指摘されている．これらの問題は，社会的・公共的場面で利用されるAIシステムにおいて，解決すべき重要な問題であると同時に，感情認識を始めVLMを利用する多くの応用タスクに影響を与える重要な問題}である．にも関わらず，これまでの研究の多くは，公平性バイアスの緩和か，ノイズ耐性の向上のどちらかに焦点をあてて行われており，両方を同時に成立させる手法の研究は，まだ十分に行われていない．本研究は，VLMの生成する分散表現を改善することで，VLMが有する公平性バイアス問題と入力ノイズへの脆弱性問題を緩和する表現学習手法の提案する．
大規模視覚言語モデルを用いた画像に対応したユーモア表現生成 ：
- ユーモア表現生成は，人間らしいコミュニケーション機能の一つである．心理状態に着目したユーモア理論に基づき，大規模視覚言語モデルに画像データに適したユーモア表現を生成させる試みが行われているが，いまだ人間が生成するものには及ばない．本研究では，その問題解明のため，与えられた画像データの特徴と人が生成するユーモア表現の内容を分析し，論理的流れを求め，人に近いユーモア表現生成の仕組みの開発を目指す．

などについて研究を行っています．

科研費プロジェクト

2026年度～2028年度（基盤研究B) 26K03045 (代表) 学習者のメタ認知活動表現を考慮した学習状況の推定と改善
2026年度～2028年度（基盤研究B）26K00542 (分担) ⼤学⼊試における⽣成AIの活⽤ー⾃動採点と⾃動作問を中⼼としてー
23K28201（旧23H03511） (基盤研究B): 手書き文字認識を組み込んだ記述式自動採点システムの開発と改良 (1年延期して2026年度まで）

キーワード: 深層学習，機械学習，自然言語処理，画像処理，テキストマイニング，データマイニング（時系列データ処理，グラフ構造データ），情報推薦，マルチエージェント，高度交通システム(ITS)，プローブデータ，マルチモーダルデータ，質問応答システム

発表論文など: 次のページをご覧ください． Recent Papers and Books