ネットワークシステム学研究室2014の振り返り

ネットワークシステム学研究室は、変復調、信号処理、ワイヤレス通信やセンシング、組み込みシステムといった、いつでも・どこでも・何でもが繋がるユビキタスネットワークのための基盤技術の実現と評価に関する研究を行っています。情報科学研究科の中では比較的物理層に近い研究分野です。それではネットワークシステム学研究室の2014年の研究テーマなどを振り返ってみたいと思います。(特任助教 侯)

1. ワイヤレス給電システムの研究

近年、スマートフォン、携帯電話、電動歯ブラシ、コードレス電話などの電気デバイスを置くだけで充電できる充電器が出現しました。これらの今あるシステムでは、受電器である電気デバイスはあまり移動しませんが、今後の人間生活の更なる利便性を目指すために、移動中の電気デバイスや電気自動車、産業用ロボットなどにワイヤレスで給電できるシステムは必要と考えられます.

現在、主流のワイヤレス給電システムは送電側コイルと受電側コイルで構成され、これらのコイル間の磁気結合を利用することで、電力をワイヤレスで伝送しています。このシステムは、あまり移動しない電気デバイスへの給電は可能ですが、広域なエリアで移動する電気デバイスへの給電には展開が困難となります。なぜならば、その際、受電器の広い移動エリアにたくさんの送電側コイルを配置しなければならないからです。

Fig2

広域なワイヤレス給電の応用例

そこで、本研究は、受電器のモビリティへの対応を目指し、広域な給電エリアを展開できる新方式を提案しています。本提案では、図3に示すように、送電側のアンテナとしてコイルを用いずに、送電線2本で構成する平行2線路を用いることで給電エリアを簡易に拡大できています。高周波電源に接続した平行2線の周囲に磁界が発生するため、この磁界を受電側コイルで結合することで、ワイヤレス給電を可能にしています。その有効性を確認するために、電車模型を用いたワイヤレス給電デモを以下の動画でご覧いただけます。

Fig3NetworksystemLab2014

平行2線路を用いたワイヤレス給電の原理

動画:『NAIST ネットワークシステム学研究室 ワイヤレス給電デモ』

https://www.youtube.com/watch?v=diHCFyDdsSQ

上記の動画では、平行2線路により広域なワイヤレス給電が可能であることは明らかになりました。実用化までには以下のような課題を解決する必要があります。

  • 伝送効率の向上:高い効率で電力伝送を行うためには、受電側コイル形状・配置の工夫やインピーダンス整合などが必要となります。
  • 受電器の移動に対する受電電力の安定化:受電器が移動する時、電源から見た平行2線路のインピーダンスが変化するため、受電電力は変化します。受電デバイスを正常に動作させるために、受電電力の安定化が必要です。
  • 複数デバイス給電時の電力分配:複数デバイスへ給電する際、1つのデバイスが電力を取り過ぎると、他のデバイスは所望電力を受電できなくなるので、適切な電力分配が必要不可欠です。

上記以外、他に課題はまだ残されますが、本提案を用いることで、広域なエリアへのワイヤレス給電が可能と期待できます。また、本研究について、岡田実教授がNEジャパン・ワイヤレス・テクノロジー・アワード2014を受賞しました。(博士研究員:Duong Quang Thang)

2. 光ファイバ無線システムの研究結果

ネットワークシステム学研究室ではRoF (Radio over Fiber: 光ファイバ無線) に関する研究も行っています。RoFとは,同軸ケーブルと電流の代わりに光ファイバとレーザー光を使って無線信号を伝送する技術です。光の強さを無線信号の形に変調してアナログ信号として伝送します。光ファイバは信号を劣化させずに長い距離を伝送できるので、ケーブルテレビの信号を送ったり、たくさんのアンテナから信号を集めて1箇所の制御局で処理したりする用途に用いられます。一方で、光ファイバを使った通信というと光のON, OFFを切り替えて0, 1のデジタルのデータを伝えるものがあります。このような方法でデータを送る信号はOOK (On-Off Keying) 信号と呼ばれます。これはイーサネットなどで使われ,皆さんのパソコンもこのOOK信号を使ったインターネットで世界中とやりとりできています。RoFとOOK信号を送るためには普通それぞれに1本ずつで2本の光ファイバが必要ですが、本研究室ではこのRoFの信号とOOK信号を1本のファイバで送る方法を光OOK重畳ファイバ無線 (RoOOOK: Radio on Optical OOK) として提案し研究しています。同時に送るとき問題となるのは2つの信号の干渉で、この干渉を抑圧する方法をEEE COMS 関西チャプタ学生研究発表会で発表しBest Student Presentation Awardを受賞し、さらに抑圧効果を上げる方法をカンボジアで開かれた国際学会APSIPA ASC 2014で発表しBest Paper Awardを受賞しました。(M2:金子)

Fig4NetworksystemLab2014

 光OOK重畳ファイバ無線システム

本研究室では他にもRoFに関する研究を行っています。RoFの伝送において複数の無線信号を送ろうとすると相互変調歪 (IMD: Intermodulation Distortion) という邪魔な信号が発生してしまうことがあります。無線通信においてたくさんの人が一度に通信できるのは使っている周波数が異なるからです。ですが、AさんBさんCさんが通信しているときに、AさんとBさんの2つの信号から生まれた相互変調歪がCさんの使っている周波数を妨害してしまうことがあります。こうなるとCさんは通信できなくなってしまいます。相互変調歪が現れる周波数には規則があるので、相互変調歪ができない周波数にCさんの周波数を割り当てればよいのですが、今度はAさんとCさんの相互変調歪がDさんの周波数を妨害して……というようにたくさんの人が通信しようとすると大変です。このように無計画には周波数を割り当てられないので、たくさんの人が使う時でも可能な限りみんなが最大のデータを通信できるような周波数の組み合わせで周波数配置する方法を研究しています。さらに、この研究では、相互変調歪を弱めるためにプリディストーション (pre-distortion) という方法も導入しています。元々の無線信号は電気の信号ですが、これを光信号に変える変調器や、信号を強める増幅器の非線形性がこの相互変調歪を作っています。入力の電気信号に対して出力の光信号が全く同じ形でなく少し歪んでしまうことが相互変調歪の原因です。そこで、入力する電気信号を変調器の歪み方とは逆に歪ませることで、結果的に出力から歪みを無くします。あらかじめ前もって歪ませるのでプリディストーションと言います。以上のように、本研究室では周波数の配置とプリディストーションを使ってRoFにおける相互変調歪の影響を最小にして通信パフォーマンスを向上させるという研究も行っています。(D1:Withawat)

 3.デジタルテレビシステム

2012年から、日本では、世界の三大デジタルテレビ(DTV: digital television)規格の一つである統合サービスデジタル放送(ISDB-T)と呼ばれるサービスが導入されました。これにより、映像・音声・文字情報・静止画情報など、すべてをデジタル信号でまとめて1つの電波で放送するという新しい放送サービスの提供が始まりました。ISDB-Tは、モバイルと固定のテレビ受信機で高精細テレビを提供することだけではなく、1セグメント技術を使用して、ハンドヘルド受信機でTV受信が可能となります。

モバイルTV受信の場合には、放送局とテレビ受信機との間のチャネル(伝搬路)の特性は、急速に変化します。したがって、これらのチャネル特性の推定は、受信信号の良好な品質を達成するために非常に重要です。受信信号の品質と効率を向上させるために、本研究の一部として圧縮センシング(CS: compressed sensing)法に基づくチャネル推定法を検討しています。

圧縮センシング法は、わずかな測定値を使用して、スパース信号の回復を可能とする新しい技術です。無線チャネル推定、医療用画像処理、センサネットワークなど異なる用途で広い範囲において使用されています。本研究室では、CS法に基づき、1つのセグメントのモバイルTV受信端末においてチャネル推定のアルゴリズムを研究開発しています。提案法は既存法よりも高精度に伝搬路特性を推定でき、計算量の削減も達成しました。

Fig5NetworksystemLab2014

Example of a multipath wireless channel

また、電子制御導波器アレーアンテナ(ESPAR:electronically steerable passive array radiator)、或いはエスパアンテナと呼ばれる、特別なアレーアンテナ応用を研究開発しています。小型化かつ低消費電力など優れた特性を持つエスパアンテナは車載DTVシステムの受信端末において受信電力倍増などができ車載アンテナとして非常に適しています。発振器を調整して、周期的にエスパアンテナの放射パターンを変更し、更に信号処理技術を用いることで、信号品質を大きく改善できることが確認できます。本研究室では、エスパアンテナをテレビ受像機として使用し、CS法によるチャネル推定法を検討しています。

Fig6NetworksystemLab2014

 7-素子 ESPAR アンテナ

本研究室では、単に理論的な分析ではなく、ソフトウェア無線(SDR)のハードウェアおよびフィールドプログラマブルゲートアレイ(FPGA)を使って、上記のエスパアンテナを用いたISDB-T受信機のハードウェア実装を目指します。さらに、信号処理技術により、より効率的かつ低消費電力のハードウェアアーキテクチャを作成することを研究開発しています。(D2:Diego、D1:Rian、M2:Ryan)

4. 漏洩同軸ケーブルを基づくMIMOシステムの構築

近年、電波不感エリアにおける新しい無線通信基盤として漏洩同軸ケーブル(LCX)が着目されています。このLCXは外部導体に空けられた放射孔から電波が漏れ出すことにより、給電線とアレーアンテナの2つの特性を持つという特徴があります。もともとLCXは災害用の無線通信基盤として地下街やトンネル、無線通信による車両管理システムの利用を目的として新幹線の沿線などに敷設され古くから利用されており、近年ではオフィス用の無線通信システム等にも用いられており、このようなリニアセル通信環境の実現手段として漏洩同軸ケーブル(LCX)を用い、その高機能化と空間多重度を向上させる、高精度な無線端末位置検出研究開発を行っています。

LCXを用いたリニアセル無線システムと利用シーン

本研究では、開発したLCX-MIMO技術により、1本のLCXを2アンテナ相当として利用するMIMO伝送システムの構成を検討しています。従来は、1本のLCXでは1アンテナ相当の機能にとどまっています。今回開発した技術では、LCXから放射される電波が指向性を持つ性質を利用して、1本のLCXの両側から異なる信号系列を有する無線周波数帯の信号を同時に入力します。これにより、既存のMIMO伝送システムで2本のアンテナを使用して送信した場合と同様に、受信側ではそれぞれに入力された信号が異なる伝搬路を経由して受信されるため、MIMO伝送が可能となります。本LCX-MIMO技術を適用することにより、従来の2倍のスループットを安定して実現可能なことを伝送実験により確認しました。さらに、2本のLCXを近接して設置し4アンテナ相当としてMIMO伝送に利用可能なことを基礎実験により確認しました。提案したLCXによるMIMOシステムは、コスト削減効果と設置スペース制約条件が緩和できる特長から、リニアセルへの実用展開が期待されます。 このテーマについては、2014年10月に行われたIEEE Consumer Electronics Society 主催の国際会議(IEEE GCCE2014)で、「4-by-4 MIMO channel using two leaky coaxial cables (LCXs) for wireless applications over linear-cell」というタイトルで研究発表を行い、最優秀研究賞を頂いました。(特任助教:侯)

また、LCXによるMIMOシステムは高精度な無線端末位置検出ができます。昨年度は1本のLCXを利用してケーブルの長手方向について位置検出を行っていましたが、今年度はそのシステムを拡張させたLCX-MIMOシステムでの位置検出を行っています。このシステムはLCXとMIMO技術を組み合わせたもので、端末から送信された信号がLCXの両端に到達する時間差を利用して、より高精度な端末位置検出が可能になります。また、昨年度はシステムを全てシミュレーションによって構築していましたが、今年度はATRによって行われた実験データを元に位置検出を行い、より実践的に研究を進めています。

このテーマについて、2014年12月に行われたスマートインフォメディア(SIS)研究会で、「LCX-MIMOシステムにおけるMUSIC法を用いた高精度端末位置検出」というタイトルで研究発表を行い、若手研究優秀賞を頂きました。(M2:沖)

いかがでしょうか、2014年度のネットワークシステム学研究室の研究の様子が少しでも伝わっていればと思います。

ネットワークシステム学研究室の最新情報はこちらから

http://agano.naist.jp/hp/index.html

ソフトウェア工学研究室2014

ソフトウェア工学研究室では、ソフトウェア開発に関わる様々な問題を研究しています。幅広い問題に取り組むため、国内外の研究者との連携に力を入れています(ソフトウェア工学研究室2013)。今回は現在取り組んでいる研究課題をいくつか紹介します。

ソフトウェア開発者の作業改善支援
本研究では、Personal Software Process(PSP)というソフトウェア開発者の作業を改善手法の研究に取り組んでいます。PSPでは開発者の作業履歴を記録し、実装(プログラミング)、テスト、ソフトウェア設計、会議といった個々の開発作業にどれだけの時間を費やしているか分析し、効率の改善やプロセス改善に役立てます。

我々はこのPSPに用いられるソフトウェア開発者の作業履歴を自動計測するためのツールTaskPitを開発しています。TaskPitでは、あらかじめPC上で動作するアプリケーション(例えば,Eclipse,Visual Studio,Word,Excel,SQLサーバ,コマンドプロンプトなど)とタスク(例えば,文章編集,表計算,実装,テストなど)を紐付けて、アプリケーションのアクティブ/非アクティブ状態を検知することで各タスクに費やした時間や作業量(クリック数、タスク数)を計測できます。

estimate

また、PSPでは「開発作業」という単位での作業記録が必要であるため、文書編集,表計算といったタスクを,その前後のタスクの実施状況から判断して「実装」「テスト」「設計」等の開発作業に自動的にマッピング(推定)する研究にも取り組んでいます。

人的リソースから見るオープンソースソフトウェアの健全性評価
オープンソースソフトウェア(OSS)は、ソースコードが無償で公開されている、だれでも改良や再配布が可能なソフトウェアです。OSSの普及に伴い、OSSを導入する企業が増加しています。企業がOSSを導入するメリットとして、経費を大幅に削減できるという点があります。しかし一方で、ボランティアが有志で開発を行っているというOSSの性質上、バグがすぐに修正されないという問題や、開発が突然打ち切られるというリスクがあります。そのため、企業は健全性の高いOSSを導入する必要があります。我々は人的リソースの観点からOSSの健全性を測ろうと試みています。

homebrew

次の図は、OSSプロジェクトの貢献者を、コメントやバグ報告などの議論を行う貢献者とコーディングを行う貢献者に分けて、貢献者の分布を人口ピラミッドで表したものです。このように可視化することで、プロジェクトが貢献者の獲得・維持ができているかが分かりやすくなります。

脳血流計測装置を用いたプログラム理解難度の測定
ソフトウェア開発において、プログラムのソースコードや設計書を読み、そのふるまいを理解すること(プログラム理解)は重要な作業のひとつです。たとえば、

  • ソフトウェアから欠陥を取り除く(デバッグ)ため
  • ソフトウェアの改良を行うため
  • 他者の書いたプログラムを再利用するため

などの工程において、開発者はプログラム理解を行う必要があります。

開発者がプログラム理解をうまく行えるかどうかは、対象となるプログラムの複雑さ開発者の能力などにかかっています。
したがって、経験年数が短い場合や新しい分野での開発において、開発者はしばしばプログラム理解が困難な状況に直面します。

このような開発者に対しては、適切なタイミングで手助けや教育を施したり、現在の仕事の割り振りを見直すことで作業の効率を上げることが出来る可能性があります。
また、プログラムが万人にとって理解しづらいようであれば設計を見直す必要があるとも考えられます。
しかしながら、プログラム理解とは開発者の頭の中で行われる処理であり、「困難な状況にある開発者」を見つけることはそう簡単ではありません。時によっては、開発者が困難を抱えているときに管理者が「開発者はうまく仕事に取り組んでいる」と勘違いするようなこともあるでしょう(図1)。

intro1

図1. プログラム理解に取り組む開発者の内心を知ることは難しい

本研究ではこの問題に取り組むため、プログラム理解を行う開発者の脳活動を観察するという率直なアプローチを採用しました。我々は、ウェアラブルNIRS(Near-InfraRed Spectroscopy; 近赤外分光法)装置(図2)と呼ばれる小型軽量な脳活動計測装置を用い、プログラム読解中の脳活動の推移や難度ごとの差を見ることで、プログラム理解の困難さを測定出来るのではないかと考えています。

intro2

図2. NIRS装置と原理

NIRS装置は、頭表面に向かって近赤外光のレーザーを射出し、その反射を捉えることで脳内の血中酸素濃度を測定し、そこから脳活動を推定する装置です。fMRIやPETのような他の脳活動計測機器と比べて精度は落ちますが、計測時の手間や身体動作への制約が少なく、また長時間の計測にも耐えうるという特徴があり、本研究に採用されました。

現在我々は、様々なレベルの難読化(プログラムをわざと理解しにくくするための処理)を施したプログラムをプログラミング経験者に読んでもらい、その理解中の脳活動を測定するという実験を行っています。実験の途中ではありますが、開発者にとって極端な困難が生じている間プログラム理解中の脳活動が強く活発化する傾向が確認できています。

Automated framework for bug report categorization

This Automated framework focuses on reducing the amount of human effort required to obtain information from bug reports.

While bug report categorization can greatly help in understanding software development and improving its process, it is a daunting task because of the required amount of human effort to complete this task.

We propose a framework of automatic bug report categorization. It first applies topic modeling techniques to discover “topics” in the collection of bug reports, and then classifies them with the features of existing topics.

Result from our experiments demonstrated that our framework could automatically categorize bug reports with good results and much less human effort.

国際会議IWESEP2014を主催

10806318_852020818164601_5971084601057743100_n

実証的ソフトウェア工学(ソフトウェア開発における開発者の経験・ノウハウを観測し、将来のソフトウェア開発にフィードバックすることを目的とした学問)に関する研究を対象に、研究分野の発展や若手研究者育成を目指す国際会議International Workshop on Empirical Software Engineering in Practice (IWESEP) 2014を開催しました。若手研究者がオーガナイズする本会議は今年で6回目を迎えます.本研究室からも中川さん(D1)がChairメンバーの一人として活躍しています。また、本研究室から2件の論文発表(Limsetthoさん(D2)、伊原助教)、ポスター発表(湯月さん(M2)、藤原さん(M1)、藤野さん(M1)、若本さん(M1)、Jiarpakdeeさん(研究生)、伊原助教)があり、藤野さんらのポスターはBest Poster Awardを受賞しています!

10268412_852023471497669_667558884949701036_n

サミットMSR Asia Summit 2014を主催

35fb3ec8b65b475989f24f9cfd77c1d9

ソフトウェア工学分野において注目されているマイニングソフトウェアリポジトリ(MSR: ソフトウェア開発中にデータベースに蓄積される開発資産をデータマイニングし、開発者の感や経験に依存しない知識を見出すことを目的とした学問)分野で活躍するスーパースターを多数招聘し、プレゼンテーション、議論を通して日本のMSR研究の発展を目指すサミットです。ソフトウェア工学研究室の伊原助教、NAIST修了生の亀井助教(九州大学)がオーガナイザーとなり開催されています。今年で2回目の開催となるMSR Asia Summit 2014は、世界5カ国から研究者を招聘し、世界最先端の研究を学び、ソフトウェア工学の未来について思いを馳せました。

6230296cfe6a42dd9694d7364703cb0e

ソフトウェア工学研究室の最新情報はこちらから
http://se-naist.jp/
https://www.facebook.com/selabnaist

新たな対話の始まり

NAISTの知能コミュニケーション研究室で、コミュニケーションに関連する様々な技術を研究しています。今回の記事では、人とコンピュータのコミュニケーションを可能とする「対話システム」の研究について紹介します。対話システムはコールセンターの自動受付や雑談などの分野で既に実用化されているが、NAISTでは、今までにできなかった応用に取り組む新しい対話システムの枠組みを目指しています。

コミュニケーションの苦手を克服する「自動ソーシャルスキルトレーナー」

(田中宏季、D3)

私たちの生活において他の人と関わる状況というのは非常に多く存在します。例えば、雑談、プレゼンテーション、友達と遊ぶ、上司への報告など。皆さんはこれらのことが得意でしょうか、それとも不安に感じてしまうでしょうか。これらのコミュニケーションスキルは人との関係作りにおいて重要であり、生活の質(QoL)とも密接に関わっていることが近年わかってきています。一方で、コミュニケーションを苦手としている人々の傾向として、コンピュータなどの社会とは無関係なところにおいて高い能力を発揮することがわかっています。この背景から、対話システムをコミュニケーション支援に応用するような研究プロジェクトを奈良教育大学と共同で本年度からスタートさせました。

コミュニケーションを支援する対話システムを作るために、従来の認知行動療法の枠組みを参考にしました。ユーザが対話システム上の仮想的なエージェントと音声対話していく中で、コミュニケーションのスキルを学習していきます。本研究では、第一段階として「上手に話を伝えるトレーニング」を対話システムに実装しました。まずユーザがエージョントに向かって、「最近あった出来事」を伝えます。その際、エージェントは聞き役として頷きなどの反応をし、同時にユーザの音声と動画も収録します。収録したデータから、ユーザの言語•非言語情報を検出し、それを標準的なモデルと比較して、良かった点と改善点をリアルタイムでユーザに提示します。ユーザはフィードバックを見ることによって、自分の話の伝え方について客観的なアドバイスを受けることが可能になります。大学院生が本システムを使用したトレーニングを受けたところ、従来の本によるトレーニングを行った群と比較して、有意に話を伝えるスキルが向上していたことを確認しました。また自閉スペクトラム症(ASD)の児童1名が本システムを使用したところ、トレーニング前後でのスキルの向上が見られました。これらの結果から、対話システムを使用したコミュニケーション支援技術が有効であることがわかりました。下のビデオで、実際にシステムを使っている様子をご覧いただけます。

今後は、エージェントの振る舞いおよびトレーニングの仕方をより人間らしくするために、実際の人間による認知行動療法をデータ収録し、システムに反映していく研究を進めていく予定です。本研究が、コミュニケーションに困っている人々の助けになれば本当に嬉しく思います。

研究の詳細については、教育工学研究会で報告しています。

人の心を動かす「説得する対話システム」

(平岡拓也、D2)

従来の対話システムは、ユーザの望み通りに、質問に答えたり、チケットを予約したり、雑談をしたりしてきました。しかし、実際に人間と話す時は、様々な意見を出し合ったり、議論したりすることもあります。我々の研究では、ユーザに合わせるだけではなく、ある目標に向かってユーザに働きかける「説得対話システム」を研究しています。実際の会話では説得が行われる状況は実に多様ですが、 本節では、相手を不快にさせずに説得を行う状況を想定した、2つのシステムについて紹介します。

研究室勧誘システム

最初に紹介するシステムの特徴は、別の話題から、システムがユーザに注目してほしい話題へと誘導を行うことです。このような誘導が必要な状況の一例として、NAISTに入学して、研究室を選ぼうとしている学生を特定の研究室へ勧誘する場面が考えられます。このような場合、研究室を探している学生はどのような研究をしたいかの大まかなイメージがあっても、具体的に各研究室でどのような研究が行われているかが分からない。その中で、システムが情報を提供し、学生のイメージとシステムの誘導したい研究室を結びつけることができれば、その学生が研究室に入る可能性が高くなります。我々は、その学生が興味の持つことと関連する別の話題を提示することで、システムが目標とする話題へと対象の興味を移す枠組みを提案しました。この枠組みの中では、会話を通して、ユーザの興味を逐次推定する手法や、話題間の関連についての知識の自動獲得に関する提案等も行われています。実際にシステムが使われている様子は下の映像にご覧いただけます。

カメラ販売システム

そして、二番目に紹介するシステムの特徴は説得のプロフェッショナルの良い点を積極的に反映していることです。 具体的には、説得のプロとして、セールスマンに着目しました。家電売店でのカメラ販売を想定して、実際に店員として働く方々に客がカメラを購入するように説得してもらいました。 そして、どの程度客を満足させつつ、カメラを販売できたかを基準に、店員の説得の上手さをスコアリングしました。この説得の分析を通して、会話中の特徴からこのスコアを予測するモデルを構築しました。この予測モデルのスコアが高くなるように会話を行えば、上手い説得が出来たといえるでしょう。我々は、強化学習と呼ばれる枠組みを使って、システムが高いスコアを出せるような会話の仕方を学習させることに成功しています。

説得対話の仕組みの詳細については、日本音響学会や自然言語処理の国際会議COLINGなどで発表しています。

ユーザの好みに合わせる「個人性を持った対話システム」

(水上雅博、D1)

Siriやしゃべってコンシェルを始めとした携帯端末向けの対話システムの普及、PepperやASIMOといった音声対話が可能なロボットの開発は、人間とコンピュータの関係を従来の「道具としてのコンピュータ」から「パートナーとしてのコンピュータ」へと変化させつつあります。ただ、今までどおりの機械的で無機質な会話をしても、対話システムが真のパートナーにはなれない。そこで我々は各ユーザに合わせるような「個人性」を持った対話システムに着目して、様々な研究を進めています。

まず、対話システムが持つ「個人性」を制御する個人性制御システムについて説明します。従来の対話システムでは、一つのシステムは、ユーザ、場所、時間、周囲の環境に関係なく単一の喋り方を行っていました。しかしながら、実際の人間同士の対話においては、人間は自分自身の固有の喋り方に加えて相手との関係や周囲の環境に合わせて喋り方を変えています。我々は、この行為が対話における関係構築に非常に重要な要素であると考え、対話システムに任意の話し方を行わせる枠組みを統計的機械翻訳の技術を用いて提案、実現しています。具体的には、実現したい喋り方のデータを用意して、このデータから個人性変換のモデルを統計的に構築します。この枠組みでは、単に話し方を制御するのみでなく、特定のキャラクタや有名人の話し方を再現することが可能です。このシステムのデモを下記の動画でご覧いただけます:

また、対話システムの応答戦略を個人に適応する研究も行っています。非タスク指向対話では「何を言われたら何と返すか」をパターン化した用例ベース対話という手法があります。この手法では、ユーザの発話に対して、最もそれらしい応答を対話システムが返します。しかしながら、「最もそれらしい応答」というのは、ユーザの好みや状況に合わせて変化するため、一意に決めることは困難です。そこで我々は、その対話で過去にユーザが行った反応とその履歴から、その時々、対話ごとに最適な応答をユーザごとに選択するという手法を提案しています。この手法は、ユーザが満足度を明示しなくても、反応の傾向からおおよその満足度を推定可能な新しい枠組みを持っています。そして、推定された満足度を用いて、ユーザが好む対話の傾向を予測し、複数の応答の中から各々のユーザに合わせて最良の応答を選ぶことに成功しました。これによって、対話システムはユーザにとって最も快適な対話を実現することができます。

これらの研究の仕組みの詳細は、情報処理学会の研究会、IWSDSを始めとする国際会議で発表しています。

「ビッグデータ」を活用した手術支援 - 生体医用画像研究室

CTやMRIなどの医用画像データは、今やどこの病院でも診断や治療経過の確認のために日常的に取得されていますが、通常手術や治療が終わるとそのまま病院のデータベースに保存され、その後はほとんど使われる機会がありません。また、手術前の血液検査やさまざまな生体計測データ、あるいは手術計画データ、術後のリハビリテーション記録などの多くのデータも同様に、一回限りの使用でお蔵入りとなってしまうのが現状です。

本記事では、私たちの研究室(生体医用画像研究室)で佐藤嘉伸教授の指揮のもと、現在進めている多くの研究プロジェクトの一つの例として、このような再利用される事のない過去の大量の医療関連データ(医療ビッグデータ)を、手術の支援のために活用するシステムの開発について紹介します。このプロジェクトは、平成26年10月に科学技術振興機構(JST)戦略的創造研究推進事業「さきがけ」に採択されました(研究領域:ビッグデータ統合利活用のための次世代基盤技術の創出・体系化、研究課題名:統計学習と生体シミュレーションを融合した循環型手術支援、研究代表者:大竹義人准教授)。

Googleが開発した、膨大な数の検索データからインフルエンザの流行を予測するアルゴリズムや、大量の消費者の航空券の購入価格のデータをもとに、これから買いたいチケットの最安値の時期を予測するシステムなど、ビッグデータは日常生活の中で、広く利用されるようになってきました。これらのシステムでは、個人がインフルエンザに感染するメカニズムや航空券の価格が決定されるメカニズムといった、個々の複雑な現象の全てを解明する事なしに、集積されたデータから直接結果を予測します。このようなシステムを実現している技術は機械学習と呼ばれ、提示されたデータをもとに、機械が法則性を「学習」し、そこで学んだ知識を「予測」に役立てるという仕組みです。結果が分かれば理由は要らない、という新しいパラダイムといえます。このようなデータからの「学習」と「予測」は日常生活で人間が常に行っている作業ですので、このビッグデータの考え方の応用分野は非常に多岐に及びます。

一つの例として、私たちは手術に着目しました。手術中は、術者は五感の全てを使って計測したさまざまなデータ(目で観察して得られる情報、組織を切っているメスからの反力などの触覚、あるいは匂いなど)と、過去に行ってきた手術の経験や患者の病歴、術前に行ったCT検査、血液検査などの「知識」をもとに、現在の患者の状態(出血の度合いや取り残したガンの範囲など)を「予測」し、最善な結果を得るためには次にどのような手術を行うべきかを判断しています(図1)。一方で、このような過去のデータから人体を理解しようという考え方とは逆に、コンピュータシミュレーションの世界では、分子や細胞レベルでの振る舞いをシミュレーションする事で、その集合体である人体全体の振る舞いを理解しようという試みがあります。コンピュータの処理速度の向上により、かなり大きな規模のシミュレーションが可能になってきていますが、人体全体を完全な形でシミュレーションし、手術の結果を予測する事ができるようになるにはもう少し時間がかかりそうです。
Fig1
図1 カテーテルを用いた手術の様子。術者はカテーテルから手元に伝わる感触とX線画像から、カテーテル先端の位置を想像しながら手術を進めます。心臓などの柔らかい臓器はX線画像には写らないため、経験や技術を要する難しい手術です。

そこで、私たちが進めているアプローチは、個々の微細構造の機構全てを解明する代わりに、人体全体を大きな一つのシステムとして捉え、このシステムに関する属性データ(性別、年齢など)と加えられた入力(手術、治療)、およびそれに起因して起こる結果(患者の状態、反応)を数多く集積したデータをもとに、人体というシステムの振る舞いを「学習」する、というアプローチです。これは、先に示したGoogle検索データからのインフルエンザの流行予測などのような、大量のデータに基づいて「理由」を解明することなく結果を予測するビッグデータのアプローチに近いものです。例えば当研究室の横田太研究員は、たくさんの過去のCT画像データからいろいろな臓器の形のばらつきを学習することで、新しい患者の臓器形状を、ノイズの多い画像や少ない計測データから予測する研究を行っています。(図2)。


図2 あらかじめ収集したたくさんの被験者の三次元画像(CT画像)から対象の臓器(左図:骨盤、右図:肺)の形状のばらつきを解析した結果。下側の図は、ばらつきの大きな方向に臓器を変形させて表示した様子。

わたしたちが対象としている手術の一つに、心臓カテーテルを用いた心筋焼灼術(心筋組織を小さく焼き切る手術)があげられます。この手術では、二方向のX線動画像(図3左)を参照しながら、カテーテルという細いチューブを太ももの付け根などから挿入し、血管を通って手術対象である心臓まで到達させます。そして、このチューブに針や電極などの手術器具を挿入して治療を行います。この手術を困難にする一番の要因は、心臓の動きです。拍動している心臓内部の目的の部位に正確に針を刺すためには、心臓の動きを「予測」しなければなりませんが、心臓はX線画像には辺縁がかすかに写るだけで、その内部構造を見る事ができません。そのため、術者は、挿入したチューブを持っている手元の感触と、X線画像に写る針の位置やわずかに写る心臓の辺縁の動きから、心臓の三次元的な動き(図3右)を予測し、その動きに合わせて自身の手を動かしながら目標を定め、動きが一番少なくなった瞬間に針を刺します。また、心臓の壁の柔らかさやその動き方は、患者の年齢や性別、疾患程度や体質など、さまざまな要因によって変わってきますので、熟練した術者は過去の経験からこれらの要素も考慮して、手術を進めます。
Fig3
図3 心臓の三次元形状の自動推定。術者が頭の中で行っている過去の患者データからの学習と形状の推定を、コンピュータを用いて自動的に行います。

そこで、この非常に難易度の高い手術を支援するために私たちが開発しているのは、患者の心臓の三次元的な動きとそれに対する針の位置を可視化する、手術ナビゲーションシステムです。手術ナビゲーションは近年、整形外科や脳外科などのような、手術対象が大きく変形しない(剛体に近い)臨床領域では高精度に実現されていますが、対象の変形を予測する事ができていないため、心臓や肝臓などの柔らかい組織では、精度が低下するという課題があります。博士課程三年生の福田紀夫君は前立腺手術の支援のため、術中にリアルタイムに計測される超音波の二次元画像が患者の前立腺全体のどの部分を撮影している画像なのかを、画像に写っている情報だけから(余分な計測機器を必要とせずに)高精度に推定し、術者に提示することのできる新しいタイプの手術ナビゲーションシステムを開発しています。(図4)


図4 前立腺手術用超音波ナビゲーションシステム。術中にリアルタイムに得られる二次元の超音波画像が患者の前立腺全体のどの部分を撮影している画像なのかを、余分な計測機器無しに、画像に写る情報だけから高精度に推定することの出来るシステム。

このシステムでは現在は、前立腺の術中の変形が十分に小さいことを仮定していますが、より高精度なナビゲーションを実現するためには、前立腺の微小な変形を予測する事が必要となります。そこで、私たちは、上で示したような熟練医が頭の中で行っている「学習」をコンピュータで行うことで心臓や前立腺の変形をリアルタイムに予測し、心臓カテーテル手術や前立腺手術をさらに高精度に支援するシステムの実現を目指します。この「学習」をより高精度に行うためには大量の患者に関するデータ、つまり「医療ビッグデータ」が不可欠であり、このために、現在は病院の倉庫に眠ってしまって、再利用される事の少ない膨大なデータベースを用いようというのが今回のプロジェクトです。

生体医用画像研究室では、本記事で紹介した研究以外にも、統計学習を用いた医用画像の領域分け(セグメンテーション)や、位置合わせ(レジストレーション)、あるいは医用画像処理に基づく人体動作の解析など、医用画像を用いた臨床応用システム全般について幅広く研究しています。
ご興味のある方は、研究室のホームページをご覧ください。

Division for Foundations of Software

Division for Foundations of Software led by Professor Minoru Ito in graduate school of information science at Nara Institute of Science and Technology, JAPAN, focuses on the following most innovative and edge-cutting network technologies:

1. Intelligent Transportation Systems (ITS)

ITS Fig.1 An example of ITS system (image is from this website).

ITS aims to provide vehicle-to-vehicle (V2V) and vehicle-to-roadside communications so as to provide safety applications (like avoidance of car crash, notification of obstacles and safety message dissemination),  traffic information (like, position of surrounding cars, car velocity, moving direction) and infotainment services (like games, video viewing, music sharing). For example, when a car got involved in an accident, it can directly communicate with other cars to inform them the accident so that others get alarmed and make corresponding decisions.

2. Mobile Ad Hoc Networks

Mobile ad hoc networks (MANETs) represent a class of important wireless ad hoc networks with mobile users. Since the flexible and distributed MANETs are robust and rapidly deployable/reconfigurable, they are highly appealing for a lot of critical applications , like deep space communication, disaster relief, battlefield communication, outdoor mining, device-to-device communication for traffic offloading in cellular networks, etc.

MANETFig.2 An example of MANETs.

3. Cloud Computing

Cloud computing refers to the delivery of computing services (like software and information) from invisible providers hidden in cloud as illustrated in Fig.3. Instead of possessing one’s own hardware or software for computing task, one just needs to access these computing services from service providers through internet.

 

cloudFig.3 An example of cloud computing (image from wiki).

Regarding the above research topics, we focus on not only network applications that can be implemented directly in daily life, but also  theoretical modeling that reveals the laws underlining network phenomenon that help us to better design network protocols.

Recent Awarded Works in Applications

1. DICOMO2014シンポジウム 優秀論文賞:“GreenSwirl:車両走行効率向上を目指した信号制御および経路案内方式

XuFig.4 GreenSwirl System

研究概要:近年,大都市で深刻な交通渋滞が社会的問題となっている.特に渋滞を引き起こす原因の一つとして非合理的な交通信号サイクルがある.信号制御の技術としてGreenWaveが中国の複数の都市で実験されてきたが,結果は満足できるものではなかった.GreenWaveは一定速度で走行する車両は連続する交差点を常に青信号で通過できる技術である.GreenWaveの問題点として幹線道路のみに生成されるため,対向車線と横断道路の妨害、入口と出口の渋滞などを引き起こしてしまうことが挙げられる.この問題点を解決するために本稿では信号制御方式GreenSwirlおよび経路案内方式GreenDriveを提案する.提案手法では複数のGreenWave道路を渦巻き状に発生させ,GreenDrive案内方式で道路を走行する時間を見積もり,車両の平均走行時間を最小化する.提案手法の性能を評価するために交通流シミュレータSUMOを用いてシミュレーションを行った.ニューヨーク市マンハッタン島の道路網で車両の走行時間短縮効果を計測した結果,従来の手法と比べて提案手法は平均10〜70%程度,平均走行時間が短縮できたことを確認した.

2. DICOMO2014シンポジウム 最優秀プレゼンテーション賞 & 優秀論文賞: “地下街におけるスマートフォンの光を用いた避難誘導方式の提案

研究概要: 停電した地下街では,壁や床等が見えず,避難者は唯一の目印である避難誘導灯を用いて避難することになる.しかし先行研究によると避難誘導灯を利用する避難者は2割程度であることがわかっており,避難誘導の役割を十分に果たしているとは言えない.本稿では,避難者の携えるスマートフォンの発する光(バックライトとフラッシュライト,総じてスマホライトと呼ぶ)を用いた避難誘導方式を提案する.避難者が床を見た際に,避難すべき方向(避難方向)に光の帯が流れるように見えるよう,各スマホライトを制御する手法を取る.すなわち,避難者は光が流れるように見えた方向に避難すればよい.提案するシステムは避難誘導装置と避難者の携えるスマートフォンからなる.避難誘導装置は避難誘導灯にビルトインし,電源は避難誘導灯の蓄電池を利用する.また,避難誘導が必要な状況をスマートフォンに知らせるために,避難誘導装置は無線LANを具備することとする.停電が発生すると,避難誘導装置は,避難誘導アルゴリズムの開始を知らせるパケット(開始パケット)を近隣のスマートフォンにブロードキャストする.開始パケットを受け取った各スマートフォンは,あらかじめ設定されている自律分散型アルゴリズムにしたがって,避難者から見て避難方向に光が流れるように見えるよう,スマホライトを制御する.提案手法を評価するため,避難者の目線による3D動画を用いたシミュレーションを行い,アンケートにより評価した.アンケートの結果,避難者が床を見ることで,光が避難方向に流れるように見えることを確認した.

Recent Achievements in Theoretical Modeling

1. Source Delay in Mobile Ad Hoc Networks

Source delay, the time a packet experiences in its source node, serves as a fundamental quantity for delay performance analysis in networks. However, the source delay performance in highly dynamic mobile ad hoc networks (MANETs) is still largely unknown by now. This paper studies the source delay in MANETs based on a general packet dispatching scheme with dispatch limit f (PD-f for short), where a same packet will be dispatched out up to f times by its source node such that packet dispatching process can be flexibly controlled through a proper setting of f. We first apply the Quasi-Birth-and-Death (QBD) theory to develop a theoretical framework to capture the complex packet dispatching process in PD-f MANETs. With the help of the theoretical framework, we then derive the cumulative distribution function as well as mean and variance of the source delay in such networks. Finally, extensive simulation and theoretical results are provided to validate our source delay analysis and illustrate how source delay in MANETs is related to network parameters.

2. End-to-End Delay Modeling for Mobile Ad Hoc Networks: A Quasi-Birth-and-Death Approach

Understanding the fundamental end-to-end delay performance in mobile ad hoc networks (MANETs) is of great importance for supporting Quality of Service (QoS) guaranteed applications in such networks. While upper bounds and approximations for end-to-end delay in MANETs have been developed in literature, which usually introduce errors in delay analysis, the modeling of exact end-to-end delay in MANETs remains a technical challenge. This is partially due to the highly dynamical behaviors of MANETs, but also due to the lack of an efficient theoretical framework to capture such dynamics. This paper demonstrates the potential application of the powerful Quasi-Birth-and-Death (QBD) theory in tackling the challenging issue of exact end-to-end delay modeling in MANETs. We first apply the QBD theory to develop an efficient theoretical framework for capturing the complex dynamics in MANETs. We then show that with the help of this framework, closed form models can be derived for the analysis of exact end-to-end delay and also per node throughput capacity in MANETs. Simulation and numerical results are further provided to illustrate the efficiency of these QBD theory based models as well as our theoretical findings.