新たな対話の始まり

NAISTの知能コミュニケーション研究室で、コミュニケーションに関連する様々な技術を研究しています。今回の記事では、人とコンピュータのコミュニケーションを可能とする「対話システム」の研究について紹介します。対話システムはコールセンターの自動受付や雑談などの分野で既に実用化されているが、NAISTでは、今までにできなかった応用に取り組む新しい対話システムの枠組みを目指しています。

コミュニケーションの苦手を克服する「自動ソーシャルスキルトレーナー」

(田中宏季、D3)

私たちの生活において他の人と関わる状況というのは非常に多く存在します。例えば、雑談、プレゼンテーション、友達と遊ぶ、上司への報告など。皆さんはこれらのことが得意でしょうか、それとも不安に感じてしまうでしょうか。これらのコミュニケーションスキルは人との関係作りにおいて重要であり、生活の質(QoL)とも密接に関わっていることが近年わかってきています。一方で、コミュニケーションを苦手としている人々の傾向として、コンピュータなどの社会とは無関係なところにおいて高い能力を発揮することがわかっています。この背景から、対話システムをコミュニケーション支援に応用するような研究プロジェクトを奈良教育大学と共同で本年度からスタートさせました。

コミュニケーションを支援する対話システムを作るために、従来の認知行動療法の枠組みを参考にしました。ユーザが対話システム上の仮想的なエージェントと音声対話していく中で、コミュニケーションのスキルを学習していきます。本研究では、第一段階として「上手に話を伝えるトレーニング」を対話システムに実装しました。まずユーザがエージョントに向かって、「最近あった出来事」を伝えます。その際、エージェントは聞き役として頷きなどの反応をし、同時にユーザの音声と動画も収録します。収録したデータから、ユーザの言語•非言語情報を検出し、それを標準的なモデルと比較して、良かった点と改善点をリアルタイムでユーザに提示します。ユーザはフィードバックを見ることによって、自分の話の伝え方について客観的なアドバイスを受けることが可能になります。大学院生が本システムを使用したトレーニングを受けたところ、従来の本によるトレーニングを行った群と比較して、有意に話を伝えるスキルが向上していたことを確認しました。また自閉スペクトラム症(ASD)の児童1名が本システムを使用したところ、トレーニング前後でのスキルの向上が見られました。これらの結果から、対話システムを使用したコミュニケーション支援技術が有効であることがわかりました。下のビデオで、実際にシステムを使っている様子をご覧いただけます。

今後は、エージェントの振る舞いおよびトレーニングの仕方をより人間らしくするために、実際の人間による認知行動療法をデータ収録し、システムに反映していく研究を進めていく予定です。本研究が、コミュニケーションに困っている人々の助けになれば本当に嬉しく思います。

研究の詳細については、教育工学研究会で報告しています。

人の心を動かす「説得する対話システム」

(平岡拓也、D2)

従来の対話システムは、ユーザの望み通りに、質問に答えたり、チケットを予約したり、雑談をしたりしてきました。しかし、実際に人間と話す時は、様々な意見を出し合ったり、議論したりすることもあります。我々の研究では、ユーザに合わせるだけではなく、ある目標に向かってユーザに働きかける「説得対話システム」を研究しています。実際の会話では説得が行われる状況は実に多様ですが、 本節では、相手を不快にさせずに説得を行う状況を想定した、2つのシステムについて紹介します。

研究室勧誘システム

最初に紹介するシステムの特徴は、別の話題から、システムがユーザに注目してほしい話題へと誘導を行うことです。このような誘導が必要な状況の一例として、NAISTに入学して、研究室を選ぼうとしている学生を特定の研究室へ勧誘する場面が考えられます。このような場合、研究室を探している学生はどのような研究をしたいかの大まかなイメージがあっても、具体的に各研究室でどのような研究が行われているかが分からない。その中で、システムが情報を提供し、学生のイメージとシステムの誘導したい研究室を結びつけることができれば、その学生が研究室に入る可能性が高くなります。我々は、その学生が興味の持つことと関連する別の話題を提示することで、システムが目標とする話題へと対象の興味を移す枠組みを提案しました。この枠組みの中では、会話を通して、ユーザの興味を逐次推定する手法や、話題間の関連についての知識の自動獲得に関する提案等も行われています。実際にシステムが使われている様子は下の映像にご覧いただけます。

カメラ販売システム

そして、二番目に紹介するシステムの特徴は説得のプロフェッショナルの良い点を積極的に反映していることです。 具体的には、説得のプロとして、セールスマンに着目しました。家電売店でのカメラ販売を想定して、実際に店員として働く方々に客がカメラを購入するように説得してもらいました。 そして、どの程度客を満足させつつ、カメラを販売できたかを基準に、店員の説得の上手さをスコアリングしました。この説得の分析を通して、会話中の特徴からこのスコアを予測するモデルを構築しました。この予測モデルのスコアが高くなるように会話を行えば、上手い説得が出来たといえるでしょう。我々は、強化学習と呼ばれる枠組みを使って、システムが高いスコアを出せるような会話の仕方を学習させることに成功しています。

説得対話の仕組みの詳細については、日本音響学会や自然言語処理の国際会議COLINGなどで発表しています。

ユーザの好みに合わせる「個人性を持った対話システム」

(水上雅博、D1)

Siriやしゃべってコンシェルを始めとした携帯端末向けの対話システムの普及、PepperやASIMOといった音声対話が可能なロボットの開発は、人間とコンピュータの関係を従来の「道具としてのコンピュータ」から「パートナーとしてのコンピュータ」へと変化させつつあります。ただ、今までどおりの機械的で無機質な会話をしても、対話システムが真のパートナーにはなれない。そこで我々は各ユーザに合わせるような「個人性」を持った対話システムに着目して、様々な研究を進めています。

まず、対話システムが持つ「個人性」を制御する個人性制御システムについて説明します。従来の対話システムでは、一つのシステムは、ユーザ、場所、時間、周囲の環境に関係なく単一の喋り方を行っていました。しかしながら、実際の人間同士の対話においては、人間は自分自身の固有の喋り方に加えて相手との関係や周囲の環境に合わせて喋り方を変えています。我々は、この行為が対話における関係構築に非常に重要な要素であると考え、対話システムに任意の話し方を行わせる枠組みを統計的機械翻訳の技術を用いて提案、実現しています。具体的には、実現したい喋り方のデータを用意して、このデータから個人性変換のモデルを統計的に構築します。この枠組みでは、単に話し方を制御するのみでなく、特定のキャラクタや有名人の話し方を再現することが可能です。このシステムのデモを下記の動画でご覧いただけます:

また、対話システムの応答戦略を個人に適応する研究も行っています。非タスク指向対話では「何を言われたら何と返すか」をパターン化した用例ベース対話という手法があります。この手法では、ユーザの発話に対して、最もそれらしい応答を対話システムが返します。しかしながら、「最もそれらしい応答」というのは、ユーザの好みや状況に合わせて変化するため、一意に決めることは困難です。そこで我々は、その対話で過去にユーザが行った反応とその履歴から、その時々、対話ごとに最適な応答をユーザごとに選択するという手法を提案しています。この手法は、ユーザが満足度を明示しなくても、反応の傾向からおおよその満足度を推定可能な新しい枠組みを持っています。そして、推定された満足度を用いて、ユーザが好む対話の傾向を予測し、複数の応答の中から各々のユーザに合わせて最良の応答を選ぶことに成功しました。これによって、対話システムはユーザにとって最も快適な対話を実現することができます。

これらの研究の仕組みの詳細は、情報処理学会の研究会、IWSDSを始めとする国際会議で発表しています。

「ビッグデータ」を活用した手術支援 - 生体医用画像研究室

CTやMRIなどの医用画像データは、今やどこの病院でも診断や治療経過の確認のために日常的に取得されていますが、通常手術や治療が終わるとそのまま病院のデータベースに保存され、その後はほとんど使われる機会がありません。また、手術前の血液検査やさまざまな生体計測データ、あるいは手術計画データ、術後のリハビリテーション記録などの多くのデータも同様に、一回限りの使用でお蔵入りとなってしまうのが現状です。

本記事では、私たちの研究室(生体医用画像研究室)で佐藤嘉伸教授の指揮のもと、現在進めている多くの研究プロジェクトの一つの例として、このような再利用される事のない過去の大量の医療関連データ(医療ビッグデータ)を、手術の支援のために活用するシステムの開発について紹介します。このプロジェクトは、平成26年10月に科学技術振興機構(JST)戦略的創造研究推進事業「さきがけ」に採択されました(研究領域:ビッグデータ統合利活用のための次世代基盤技術の創出・体系化、研究課題名:統計学習と生体シミュレーションを融合した循環型手術支援、研究代表者:大竹義人准教授)。

Googleが開発した、膨大な数の検索データからインフルエンザの流行を予測するアルゴリズムや、大量の消費者の航空券の購入価格のデータをもとに、これから買いたいチケットの最安値の時期を予測するシステムなど、ビッグデータは日常生活の中で、広く利用されるようになってきました。これらのシステムでは、個人がインフルエンザに感染するメカニズムや航空券の価格が決定されるメカニズムといった、個々の複雑な現象の全てを解明する事なしに、集積されたデータから直接結果を予測します。このようなシステムを実現している技術は機械学習と呼ばれ、提示されたデータをもとに、機械が法則性を「学習」し、そこで学んだ知識を「予測」に役立てるという仕組みです。結果が分かれば理由は要らない、という新しいパラダイムといえます。このようなデータからの「学習」と「予測」は日常生活で人間が常に行っている作業ですので、このビッグデータの考え方の応用分野は非常に多岐に及びます。

一つの例として、私たちは手術に着目しました。手術中は、術者は五感の全てを使って計測したさまざまなデータ(目で観察して得られる情報、組織を切っているメスからの反力などの触覚、あるいは匂いなど)と、過去に行ってきた手術の経験や患者の病歴、術前に行ったCT検査、血液検査などの「知識」をもとに、現在の患者の状態(出血の度合いや取り残したガンの範囲など)を「予測」し、最善な結果を得るためには次にどのような手術を行うべきかを判断しています(図1)。一方で、このような過去のデータから人体を理解しようという考え方とは逆に、コンピュータシミュレーションの世界では、分子や細胞レベルでの振る舞いをシミュレーションする事で、その集合体である人体全体の振る舞いを理解しようという試みがあります。コンピュータの処理速度の向上により、かなり大きな規模のシミュレーションが可能になってきていますが、人体全体を完全な形でシミュレーションし、手術の結果を予測する事ができるようになるにはもう少し時間がかかりそうです。
Fig1
図1 カテーテルを用いた手術の様子。術者はカテーテルから手元に伝わる感触とX線画像から、カテーテル先端の位置を想像しながら手術を進めます。心臓などの柔らかい臓器はX線画像には写らないため、経験や技術を要する難しい手術です。

そこで、私たちが進めているアプローチは、個々の微細構造の機構全てを解明する代わりに、人体全体を大きな一つのシステムとして捉え、このシステムに関する属性データ(性別、年齢など)と加えられた入力(手術、治療)、およびそれに起因して起こる結果(患者の状態、反応)を数多く集積したデータをもとに、人体というシステムの振る舞いを「学習」する、というアプローチです。これは、先に示したGoogle検索データからのインフルエンザの流行予測などのような、大量のデータに基づいて「理由」を解明することなく結果を予測するビッグデータのアプローチに近いものです。例えば当研究室の横田太研究員は、たくさんの過去のCT画像データからいろいろな臓器の形のばらつきを学習することで、新しい患者の臓器形状を、ノイズの多い画像や少ない計測データから予測する研究を行っています。(図2)。


図2 あらかじめ収集したたくさんの被験者の三次元画像(CT画像)から対象の臓器(左図:骨盤、右図:肺)の形状のばらつきを解析した結果。下側の図は、ばらつきの大きな方向に臓器を変形させて表示した様子。

わたしたちが対象としている手術の一つに、心臓カテーテルを用いた心筋焼灼術(心筋組織を小さく焼き切る手術)があげられます。この手術では、二方向のX線動画像(図3左)を参照しながら、カテーテルという細いチューブを太ももの付け根などから挿入し、血管を通って手術対象である心臓まで到達させます。そして、このチューブに針や電極などの手術器具を挿入して治療を行います。この手術を困難にする一番の要因は、心臓の動きです。拍動している心臓内部の目的の部位に正確に針を刺すためには、心臓の動きを「予測」しなければなりませんが、心臓はX線画像には辺縁がかすかに写るだけで、その内部構造を見る事ができません。そのため、術者は、挿入したチューブを持っている手元の感触と、X線画像に写る針の位置やわずかに写る心臓の辺縁の動きから、心臓の三次元的な動き(図3右)を予測し、その動きに合わせて自身の手を動かしながら目標を定め、動きが一番少なくなった瞬間に針を刺します。また、心臓の壁の柔らかさやその動き方は、患者の年齢や性別、疾患程度や体質など、さまざまな要因によって変わってきますので、熟練した術者は過去の経験からこれらの要素も考慮して、手術を進めます。
Fig3
図3 心臓の三次元形状の自動推定。術者が頭の中で行っている過去の患者データからの学習と形状の推定を、コンピュータを用いて自動的に行います。

そこで、この非常に難易度の高い手術を支援するために私たちが開発しているのは、患者の心臓の三次元的な動きとそれに対する針の位置を可視化する、手術ナビゲーションシステムです。手術ナビゲーションは近年、整形外科や脳外科などのような、手術対象が大きく変形しない(剛体に近い)臨床領域では高精度に実現されていますが、対象の変形を予測する事ができていないため、心臓や肝臓などの柔らかい組織では、精度が低下するという課題があります。博士課程三年生の福田紀夫君は前立腺手術の支援のため、術中にリアルタイムに計測される超音波の二次元画像が患者の前立腺全体のどの部分を撮影している画像なのかを、画像に写っている情報だけから(余分な計測機器を必要とせずに)高精度に推定し、術者に提示することのできる新しいタイプの手術ナビゲーションシステムを開発しています。(図4)


図4 前立腺手術用超音波ナビゲーションシステム。術中にリアルタイムに得られる二次元の超音波画像が患者の前立腺全体のどの部分を撮影している画像なのかを、余分な計測機器無しに、画像に写る情報だけから高精度に推定することの出来るシステム。

このシステムでは現在は、前立腺の術中の変形が十分に小さいことを仮定していますが、より高精度なナビゲーションを実現するためには、前立腺の微小な変形を予測する事が必要となります。そこで、私たちは、上で示したような熟練医が頭の中で行っている「学習」をコンピュータで行うことで心臓や前立腺の変形をリアルタイムに予測し、心臓カテーテル手術や前立腺手術をさらに高精度に支援するシステムの実現を目指します。この「学習」をより高精度に行うためには大量の患者に関するデータ、つまり「医療ビッグデータ」が不可欠であり、このために、現在は病院の倉庫に眠ってしまって、再利用される事の少ない膨大なデータベースを用いようというのが今回のプロジェクトです。

生体医用画像研究室では、本記事で紹介した研究以外にも、統計学習を用いた医用画像の領域分け(セグメンテーション)や、位置合わせ(レジストレーション)、あるいは医用画像処理に基づく人体動作の解析など、医用画像を用いた臨床応用システム全般について幅広く研究しています。
ご興味のある方は、研究室のホームページをご覧ください。

Division for Foundations of Software

Division for Foundations of Software led by Professor Minoru Ito in graduate school of information science at Nara Institute of Science and Technology, JAPAN, focuses on the following most innovative and edge-cutting network technologies:

1. Intelligent Transportation Systems (ITS)

ITS Fig.1 An example of ITS system (image is from this website).

ITS aims to provide vehicle-to-vehicle (V2V) and vehicle-to-roadside communications so as to provide safety applications (like avoidance of car crash, notification of obstacles and safety message dissemination),  traffic information (like, position of surrounding cars, car velocity, moving direction) and infotainment services (like games, video viewing, music sharing). For example, when a car got involved in an accident, it can directly communicate with other cars to inform them the accident so that others get alarmed and make corresponding decisions.

2. Mobile Ad Hoc Networks

Mobile ad hoc networks (MANETs) represent a class of important wireless ad hoc networks with mobile users. Since the flexible and distributed MANETs are robust and rapidly deployable/reconfigurable, they are highly appealing for a lot of critical applications , like deep space communication, disaster relief, battlefield communication, outdoor mining, device-to-device communication for traffic offloading in cellular networks, etc.

MANETFig.2 An example of MANETs.

3. Cloud Computing

Cloud computing refers to the delivery of computing services (like software and information) from invisible providers hidden in cloud as illustrated in Fig.3. Instead of possessing one’s own hardware or software for computing task, one just needs to access these computing services from service providers through internet.

 

cloudFig.3 An example of cloud computing (image from wiki).

Regarding the above research topics, we focus on not only network applications that can be implemented directly in daily life, but also  theoretical modeling that reveals the laws underlining network phenomenon that help us to better design network protocols.

Recent Awarded Works in Applications

1. DICOMO2014シンポジウム 優秀論文賞:“GreenSwirl:車両走行効率向上を目指した信号制御および経路案内方式

XuFig.4 GreenSwirl System

研究概要:近年,大都市で深刻な交通渋滞が社会的問題となっている.特に渋滞を引き起こす原因の一つとして非合理的な交通信号サイクルがある.信号制御の技術としてGreenWaveが中国の複数の都市で実験されてきたが,結果は満足できるものではなかった.GreenWaveは一定速度で走行する車両は連続する交差点を常に青信号で通過できる技術である.GreenWaveの問題点として幹線道路のみに生成されるため,対向車線と横断道路の妨害、入口と出口の渋滞などを引き起こしてしまうことが挙げられる.この問題点を解決するために本稿では信号制御方式GreenSwirlおよび経路案内方式GreenDriveを提案する.提案手法では複数のGreenWave道路を渦巻き状に発生させ,GreenDrive案内方式で道路を走行する時間を見積もり,車両の平均走行時間を最小化する.提案手法の性能を評価するために交通流シミュレータSUMOを用いてシミュレーションを行った.ニューヨーク市マンハッタン島の道路網で車両の走行時間短縮効果を計測した結果,従来の手法と比べて提案手法は平均10〜70%程度,平均走行時間が短縮できたことを確認した.

2. DICOMO2014シンポジウム 最優秀プレゼンテーション賞 & 優秀論文賞: “地下街におけるスマートフォンの光を用いた避難誘導方式の提案

研究概要: 停電した地下街では,壁や床等が見えず,避難者は唯一の目印である避難誘導灯を用いて避難することになる.しかし先行研究によると避難誘導灯を利用する避難者は2割程度であることがわかっており,避難誘導の役割を十分に果たしているとは言えない.本稿では,避難者の携えるスマートフォンの発する光(バックライトとフラッシュライト,総じてスマホライトと呼ぶ)を用いた避難誘導方式を提案する.避難者が床を見た際に,避難すべき方向(避難方向)に光の帯が流れるように見えるよう,各スマホライトを制御する手法を取る.すなわち,避難者は光が流れるように見えた方向に避難すればよい.提案するシステムは避難誘導装置と避難者の携えるスマートフォンからなる.避難誘導装置は避難誘導灯にビルトインし,電源は避難誘導灯の蓄電池を利用する.また,避難誘導が必要な状況をスマートフォンに知らせるために,避難誘導装置は無線LANを具備することとする.停電が発生すると,避難誘導装置は,避難誘導アルゴリズムの開始を知らせるパケット(開始パケット)を近隣のスマートフォンにブロードキャストする.開始パケットを受け取った各スマートフォンは,あらかじめ設定されている自律分散型アルゴリズムにしたがって,避難者から見て避難方向に光が流れるように見えるよう,スマホライトを制御する.提案手法を評価するため,避難者の目線による3D動画を用いたシミュレーションを行い,アンケートにより評価した.アンケートの結果,避難者が床を見ることで,光が避難方向に流れるように見えることを確認した.

Recent Achievements in Theoretical Modeling

1. Source Delay in Mobile Ad Hoc Networks

Source delay, the time a packet experiences in its source node, serves as a fundamental quantity for delay performance analysis in networks. However, the source delay performance in highly dynamic mobile ad hoc networks (MANETs) is still largely unknown by now. This paper studies the source delay in MANETs based on a general packet dispatching scheme with dispatch limit f (PD-f for short), where a same packet will be dispatched out up to f times by its source node such that packet dispatching process can be flexibly controlled through a proper setting of f. We first apply the Quasi-Birth-and-Death (QBD) theory to develop a theoretical framework to capture the complex packet dispatching process in PD-f MANETs. With the help of the theoretical framework, we then derive the cumulative distribution function as well as mean and variance of the source delay in such networks. Finally, extensive simulation and theoretical results are provided to validate our source delay analysis and illustrate how source delay in MANETs is related to network parameters.

2. End-to-End Delay Modeling for Mobile Ad Hoc Networks: A Quasi-Birth-and-Death Approach

Understanding the fundamental end-to-end delay performance in mobile ad hoc networks (MANETs) is of great importance for supporting Quality of Service (QoS) guaranteed applications in such networks. While upper bounds and approximations for end-to-end delay in MANETs have been developed in literature, which usually introduce errors in delay analysis, the modeling of exact end-to-end delay in MANETs remains a technical challenge. This is partially due to the highly dynamical behaviors of MANETs, but also due to the lack of an efficient theoretical framework to capture such dynamics. This paper demonstrates the potential application of the powerful Quasi-Birth-and-Death (QBD) theory in tackling the challenging issue of exact end-to-end delay modeling in MANETs. We first apply the QBD theory to develop an efficient theoretical framework for capturing the complex dynamics in MANETs. We then show that with the help of this framework, closed form models can be derived for the analysis of exact end-to-end delay and also per node throughput capacity in MANETs. Simulation and numerical results are further provided to illustrate the efficiency of these QBD theory based models as well as our theoretical findings.

 

 

 

 

 

「隠れ身の術」の実現 – 視覚情報メディア研究室

拡張現実感・複合現実感に関する国際会議International Conference on Mixed and Augmented Reality(ISMAR),および国内の画像の認識・理解シンポジウム(MIRU)で受賞した「隠れ身の術」を実現する研究を紹介します.言葉で説明するよりも,映像を見ていただくのが一番わかりやすいと思いますので,まず以下の映像をご覧ください.

このように,映像中から現実の空間に存在する物体をリアルタイムで取り除きます.このような技術は「隠消現実感(いんしょうげんじつかん)」,英語では「Diminished Reality」と呼ばれており,映像中に仮想物体のCGを合成する「拡張現実感(Augumented Reality)」とは反対に位置付けられる技術です.1つ目の映像で,CGを合成するために用いられる拡張現実感のマーカ(映像中の黒い四角形)を映像中から取り除きつつ,仮想物体のCGを映像に合成することで,現実環境と仮想物体の真の融合を実現しているように,「拡張現実感」と「隠消現実感」を同時に行うこともできます.

実際の利用例としては,1つ目の映像のように,カメラ付きのポータブルゲーム機において,マーカを消しつつキャラクターのCGを合成することで,本当に家の中でキャラクターが動き回っているかのような感覚を味わうことが出来ます.また,1つ目の映像と2つ目の映像の内容を合わせることで,家具の買い替えを考えているときに,古い家具を取り除きつつ,新しい家具のCGを合成することで,実際に家具を買う前に部屋の雰囲気をシミュレーションすることもできます.

では,このような技術はどのようにして実現しているでしょうか?

まさに「隠れ身の術」のようなことをしています.
忍者が隠れる時に,自分のいる場所の背景の模様が描かれた布を自分の前にかぶせることで,後から追ってきた人に,そこには誰もいないかのように認識させるようなシーンを思い浮かべてください.以下のホームページのような感じです.
写真を使って忍者の隠れ身の術のように風景に溶け込むアート

「隠消現実感」でも,映像中で現実物体の上に,背景の画像を上書きしてやることで,まるでその物体がその場にないかのように見せています.

しかし,ここで1つ問題が生じます.あらかじめ取り除きたい物体の背景の画像を撮っておける場合はよいのですが,ある場所に行ってすぐに使いたい場合,そもそも消したい物体が壁に固定されていて,背景の画像を撮ることができない場合があります.
このような場合にはどうすればよいでしょう?

ここで用いられるのが「画像修復」,英語では「Image Inpainting」と呼ばれる技術です.

このように,1枚の写真から不要な物体を取り除き,その周辺に写っている背景と融合するよう,その領域内に画像を作り出す技術です.具体的には,同じ画像中から修復したい領域周辺のテクスチャと類似するテクスチャを探索し,それを修復領域内に合成することで自然な背景を生成しています.これを用いることで,映像中から取り除きたい物体の背景をあらかじめ撮影できない場合でも,自然な背景画像を生成し,利用することができます.

ただし,生成した背景画像をそのまま貼りつけるだけでは不十分です.カメラは動き回りますので,映像中での取り除きたい物体の位置や,背景の模様の見え方が変化します.このとき,少しでも背景の画像の位置ずれが起こってしまうと,明らかにそこに何かがあるのがわかってしまいます.また同様に,時間が経つにつれて環境の照明条件が変化することがあります.このため,生成した背景画像の色合いと現在の周辺の背景の色合いが異なると,違和感が生じます.

ここで,生成した背景画像とその周辺の背景との位置ずれや,色合いの差異が目立たないようにするため,コンピュータビジョンの技術を用います.具体的には,カメラを動かしながら撮影した映像中で特徴点と呼ばれる色や明るさが急激に変化するような箇所を追跡することで,現在カメラがどの場所にあり,どちらの方向を向いているかを計算することができます.また同時に,背景のおおまかな形状も計算することができます.これらの情報を用いることで,できるだけ位置ずれが目立たないよう背景画像を変形します.またこれに加えて,画像修復により背景画像を生成した時の画像と現在の画像との間で明るさや色合いの変化を計算し,生成した背景画像の色合いを調整します.このように背景画像の変形・色調整を行った上で,取り除きたい物体の上に上書きすることで,まるでその物体がその場にないかのような映像を作り出すことができます.

本記事で紹介しました隠消現実感技術以外にも,画像・映像を用いた様々なコンピュータビジョン・映像生成技術を研究しています.
ご興味のある方はぜひ視覚情報メディア研究室のホームページもご覧ください.
http://yokoya.naist.jp/

情報基盤システム学研究室 -Happyなネットワークを作ろう-

セキュリティ?   (猪俣敦夫)

私たちの生活においてお金やものが盗まれることとは異なり、いわゆる「情報」は盗難されたり漏えいしたりすると二度と盗まれる前の状態に戻すことはできません。形をもたなくとも「情報」は、個人にとってはプライバシーなどに関わる大切なもの、企業・組織にとっては資産、すなわち価値そのものであり、これらの「情報」を適切に管理、保護していくことは現代社会の常識になっています。しかし、この常識を実現するのは機械ではありません。人間です。計算機はあくまで人間のサポートにすぎません。

私たちの研究室では、形は様々な「情報」を適切に維持・管理できるための仕組みについて研究を進めています。また、それに付随して情報セキュリティに関する実践的な人材育成教育にも数年間取り組んで参りました。平成19年度には文部科学省による先導的ITスペシャリスト人材育成プログラム「産学官が連携する実践的セキュリティエンジニア育成プロジェクト:IT Keys」 http://it-keys.naist.jp/

そして平成23年度からは文部科学省による「分野・地域を越えた実践的情報教育協働ネットワークenPiTセキュリティ分野:SecCap」 http://www.seccap.jp/

現在、7期生を受け入れるまでになり120名を越える修了生を輩出するに至りました。いずれも1つの大学の枠にとらわれず幅広い人的ネットワークのコミュニティを形成させることが大きな狙いです。

しかしながら、大学教育などにおいて情報セキュリティに関わるスキルや知識を適切に評価する手段が存在しないのが現状です。国内では、独立行政法人情報処理推進機構IPAが、いくつか専門的資格を提供しています。一方、世界的な情報セキュリティ資格団体である(ISC)2®では、情報セキュリティのプロフェッショナルとは何か、その要件とは、評価をどうすべきかなど”プロフェッショナル”をキーワードに議論を重ね、今や情報セキュリティの専門家資格としてはスタンダードとなっているCISSP®を始めとしたキャリアパスや専門領域に合わせた資格をグローバルで開発、提供してきました。また、(ISC)2 Japanでは アジア・パシフィック情報セキュリティ・リーダーシップ・アチーブメント(ISLA)と呼ばれる表彰制度を設け、2014年度のISLA表彰において当研究室准教授の猪俣が長年取り組んできた取り組みに対して評価がなされ、この度受賞いただくことになりました。

ISLA-2014-inomata-1

日本からは、独立行政法人情報通信研究機構サイバー攻撃対策総合研究センター室長の井上大介氏、ソニーデジタルネットワークアプリケーションズ株式会社CSTOの松並勝氏と猪俣の3名が受賞しました。

ISLA-2014-inomata-2

私たちは研究活動だけにとどまらず、社会に貢献できるような人材育成にも力を入れた教育にも注力してまいります。特に、情報セキュリティの分野は若手が活躍しやすい場です。少しでも興味をもった方がいらっしゃいましたら是非お気軽にお声がけください。
Continue reading “情報基盤システム学研究室 -Happyなネットワークを作ろう-“