ディペンダブルシステム学研究室2014

ディペンダブルシステム学研究室では、ディペンダブルなシステム、すなわち、ユーザが信頼して使うことのできるシステムを提供するための様々な研究を行っています。その中でも力をいれているのは、分散アルゴリズム、LSI高信頼化設計、LSIテストです。ディペンダブルシステム学研究室では、今年度、それぞれの分野で新たな取り組みをしました。

もののインターネットであるIoT時代が到来し、インターネットをはじめとする分散システム、ICTの基盤であるLSIのディペンダビリティは益々重要となっています。ディペンダブルシステム学研究室では、高度な故障耐性を持つ分散アルゴリズム(分散システムのためのアルゴリズム)である自己安定アルゴリズムの研究に取り組みました。また、LSIのディペンダビリティ向上のためにも2つのテーマに新たに取り組みました。LSI高信頼化設計では、これまで取り組んでいたロジックの高信頼化設計に続き、メモリの高信頼化設計にも取り組みました。さらに、プロセステクノロジーの微細化により、益々複雑化するLSIテストの品質向上のために、テスト時の電源ノイズを考慮した高品質なテスト技術の開発にも取り組んでいます。

今年度、新たに取り組んだ3つのテーマを紹介します。

自己安定アルゴリズム

分散システム、コンピュータネットワークの大規模化は益々すすみ、システムの内に故障が発生するということを前提としたディペンダビリティの考え方が重要になっています。システム内に故障が発生した場合、システムの稼働を一旦中断してメンテナンスする手段と、稼働させたままシステムを安定化させる手段が考えられます。

自己安定アルゴリズムは、コンピュータネットワークで代表される分散システムのための故障耐性を持つアルゴリズムで、システムがどんな状態になってもシステムを稼働させたまま正当な状態までシステムを遷移させ安定させることが可能です。そのため、故障によりシステム内のいくつかのコンピュータが管理する変数の値が改ざんされ、システムがつじつまの合わない状態に陥っても、自己安定アルゴリズムはシステムを自力で正当な状態に戻すことが可能です。また、システムを構成するコンピュータや通信リンクの追加や離脱などによるトポロジー変化にも柔軟に対応する、システムの初期化が不要など様々なメリットを持つアルゴリズムです。

ディペンダブルシステム研究室では、今年度、この自己安定アルゴリズムの研究に新たに取り組みました。特に、コンピュータネットワークをグラフと捉え、グラフ理論の諸問題を解く自己安定アルゴリズムに取り組んでいます。グラフ理論とは、複数の「ノード」と「ノード」と「ノード」との関係をグラフというデータ構造で表して考える様々な応用を持つ理論です。例えば、鉄道の路線図、電気回路・電子回路の回路図、SNSでの友達関係などもグラフで表現できます。

自己安定アルゴリズムに関する今年度一番の成果は、「匿名ネットワークで1−極大マッチングアルゴリズムを解くサイレントな自己安定アルゴリズム」です。

タイトルを説明するにはたくさんの概念を説明する必要があるので、思い切って省略しますが、マッチングとはノードのペアを作ることで、ペア数をなるべく多く作ることを目標とするアルゴリズムです。例えば、男女のカップルをたくさん作るという問題などを連想するとよいかもしれません。

この問題に関して、「匿名」、「1−極大」、「サイレント」、書いていませんが「集中型デーモン」、「木・リング」などの問題設定の下で、既存のアルゴリズムはO(n4)ムーブという性能だったのを、私たちが提案したアルゴリズムではO(n)ムーブに改善しました。ムーブというのは、1ノードが周りのノードの状態を見て、自分の状態を遷移させる動作です。提案するアルゴリズムは、このムーブをノード数nに比例する回数行えば、どんなシステム状態からでも1−極大マッチングというマッチング数が多い状態に遷移することを保証します。アルゴリズムの実行例を図1に示します。各ノードは、自身とリンクでつながっている隣接ノードの状態だけから、どのノードを誘うか、どのノードとペアになるかを決定し、これを繰り返すと、システム全体がいずれ「1−極大マッチング」状態に到達します。自己安定アルゴリズムの面白いところは、各ノードがローカル情報だけで状態遷移を行うにもかかわらず、システム全体がグローバルに安定するところです。

自己安定アルゴリズムの研究は、各ノードの振る舞いを記述するアルゴリズムを考案し、それがどんな場合でも期待通りに動くことを証明し、その性能を数学的に解析する計算理論と呼ばれる分野の研究です。数学的なモデル上でエレガントなアルゴリズムを理論的に解析して楽しんでいます。

研究成果は、International Workshop on Algorithms and Computation (WALCOM2015) で発表しました。

SSmatching

組み込みメモリの高信頼化

メモリとロジックを混載するシステムオンチップ(SoC)内の組み込みメモリのサイズや集積度が大きくなっており、メモリの故障、エラーがSoCの歩留まり、信頼性に大きく影響します。ここで、故障とはメモリ内部に起きたハードウェア的な欠陥を意味し、エラーとはメモリが誤った値を出力することを意味します。エラーには、故障が原因となるハードエラーと、アルファ線などがメモリセルに衝突しセルの値が反転するといったメモリ外部の要因によるソフトエラーとがあります。ソフトエラーを訂正するために、ECC(誤り訂正符号、Error Correcting Code)やScrubbingという手法が用いられています。Scrubbingとは、メモリに格納された値を読み出し、ECCを用いてエラーを訂正した値を再度書き込みメモリからエラーを消去する手法です。

ECC

ここで、ECCと1ワード中のエラー数との関係を考えてみましょう。図2では、ECCは1ワード中の1エラーのみ訂正可能とします。このとき、1ワード中にエラーが1個であれば、ソフトエラーでもハードエラーでも訂正可能です。ソフトエラーの場合は、新しい値を上書きする(overwrite)、またはscrubbingによりメモリの値は正しい値になります。一方、ハードエラーの場合、上書きやscrubbingでもエラーが残ることがあるため、同じワードに新たにエラーが起これば、誤り訂正ができなくなってしまいます。

そのため、故障対策としては別の手段として、冗長回路を用いたメモリの修復が考えられています。オンラインメモリ修復として、リマップCAM (Content Addressable Memory, 連想メモリ)を用いた手法が提案されています。この手法は、故障セルを含むワードを正常なスペアワードに置き換えるためにアドレスをメモリ内部で置き換える手法です。

ディペンダブルシステム学研究室では、今年度、ECC, Scrubbingによる誤り訂正とリマップCAMを用いたオンライン修復を組み合わせ、メモリの寿命を延ばす手法の提案に取り組みました。提案手法では、稼働中のシステムに組み込まれたメモリに対し、セルフテスト(BIST, Built-In Self-Test)を定期的に行い、リマップCAMの再構成を行います(図3)。このとき、ワード中のエラー数に応じて優先度を設けて、修復対象となるワードを決定します。図3中のDiagnosis CAM は、BISTの結果を集約し同一ワード内のエラー数を特定するために用いられます。

図4は、提案法と既存法とでメモリの信頼性を評価した結果です。ここで、既存法とは誤り訂正不可能となったワードのみを修復する手法です。信頼性とは時間の関数で、その時間までシステムが正常に稼働する確率を表す指標であう。信頼性の評価は、ソフトエラー、ハードエラーがポワソン分布に従って発生すると仮定して行いました。評価の結果、提案法では信頼性の高い期間が長く、従来法と比較してメモリの寿命が延びていることが確認できました。

研究成果は、IEEE Workshop on RTL and High Level Testing (WRTLT2014)で発表し、IEEE European Test Symposium(ETS2015)でも発表します。

OLRepair

 

Reliability2

LSIテスト時の電源ノイズの低減

LSIテスト時の過度の電源ノイズによる誤判定が問題になっています。LSIの良・不良を選別するテストによって正しい判定ができないと、不良品の市場流出や、良品の破棄に繋がってしまうため、テストには高い品質が求められています。本研究ではテスト時の電源ノイズを低減するため、テスト時の最適クロック周波数選択手法を提案しました。

LSIのテストでは、テスタ上のLSIにテストパタンと呼ばれる入力信号を印加し、その応答がシミュレーションで求めた正常応答と一致するかどうかで良否の判定をします。全てのテストパタンで応答が一致したものだけが良品として出荷され、不一致が起こったものは破棄されるか、原因の解析がなされます。ここで、テストの結果が必ず正しいとは限らないことに注意しなければなりません。印加するテストパタンや、テスト時の温度・電圧によっては、誤った判定を下してしまうおそれがあります。欠陥のあるLSIを良品と判定してしまうと(アンダーテスト)、不良品をユーザに販売することになり、使用中の誤動作による事故や、メーカとしての信頼の損失に繋がります。反対に、機能的に問題のない回路を不良品と判定してしまうと(オーバーテスト)、歩留り(良品率)を低下させてしまい、コスト高に繋がります。このように、テストの誤判定は様々な問題を引き起こすため、正しく良否を判定することが求められます。

その一方で近年、LSIテスト時の過度の電源ノイズによる誤判定の問題が深刻になっています。テストでは短時間に回路の隅々まで検査をしたいという要求から、通常起こり得ないような状態遷移を発生させます。これにより回路の動作率が高くなり、消費電流は通常動作時の数倍にもなります。消費電流が大きくなると回路の電源電圧が過剰に低下し、トランジスタが動作しなかったり、信号の伝搬遅延が増加したりします。その結果、回路は誤動作を引き起こし、オーバーテストをもたらします。

電源ノイズは大きく、IRノイズ、Ldi/dtノイズ、共振ノイズに分類されます。IRノイズは、回路中の抵抗成分(R)とそこに流れる電流(I)によって起こる電圧降下を指します。また、Ldi/dtノイズは回路中のインダクタンス成分(L)と電流の変化(di/dt) によって起こる電圧降下を指します。そして本研究で対象とする共振ノイズは、回路中のインダクタンス成分(L) とキャパシタンス成分(C) が構成するLC 回路の共振現象によって起こる、電源電圧の変動を指します。この変動は共振周波数1/(2π√LC)の電流によって励起され、回路の抵抗が小さい場合、減衰しながら数クロックサイクルにわたって振動を続けます。

wave

さらに、共振ノイズは電流が変化するたびに発生し、最終的な電圧変動量は発生した共振ノイズ波形の重ね合わせとなる特徴があります。したがって、印加するテストパタンとその時のクロック周波数により、共振ノイズの影響は変動します。我々はこの点に着目し、与えられたテストパタンに応じて最適なクロック周波数を決めてやれば、共振の影響を低減できると考えました。提案手法はSPICEなどの回路シミュレータを用いることなく電圧変動を計算でき、共振ノイズの少ないクロック周波数を高速に求めることができます。ベンチマーク回路を用いた実験では、提案手法によって選択された周波数によって、最悪時のノイズを50%以上低減しました。また、計算時間は商用回路シミュレータの約1800倍を実現しました。今後は電源回路モデルの詳細化によって、提案手法の精度を向上していく予定です。

ディペンダブルシステム学研究室が今年度新たに取り組んだ、自己安定アルゴリズム、組み込みメモリの高信頼化、LSIテスト時の電源ノイズの低減を紹介しました。研究室の詳しい情報は、研究室HPもご覧ください。

光メディアインタフェース研究室 本格始動!

研究室概要

2014年2月に向川教授が着任し,新たに「光メディアインタフェース研究室」をスタートさせました.この研究室では,カメラで撮影された情報をもとにシーンを理解するコンピュータビジョンの中でも,特に光学解析を中心に取り扱っています.光源から出た光は,シーン中で反射・屈折・散乱等の光学現象を繰り返し, カメラや我々の眼に届きます. 我々人間は眼で見ただけで, 物体表面の状態がツルツルしているのかザラザラしているのかといった表面の荒さだけではなく, 重いのか軽いのかといった質量や, 金属なのかプラスチックなのかといった材質に関する物理情報, さらには安っぽいのか高級感があるのかといった感性に関わる情報も感じ取っています. つまり,光線はシーンに関する貴重な情報を運ぶ媒体と考えることができます. 光線の伝播を解析する基礎研究を土台に,人間と機械が光を媒体としてシーンに関する情報を共有できる新しいインタフェースの実現を目指しています.

OMI-Concept_j

2014年4月には博士前期課程の学生5名がメンバに加わり,また6月には久保助教が着任し,和気あいあい一丸となって研究室を立ちあげてきました.まだまだ小さい研究室ですが,大阪大学,九州大学,早稲田大学,広島大学などとも一緒に共同で研究を進めています.また,いくつかの企業とも共同研究が始まりました.

立ち上げ直後の研究室のため,アドバイスをくれる先輩たちが居ない中でも,第1期の学生たちが協同でCICP2014 (Creative and International Competitiveness Project) のプロジェクト「写ラナインです(余計なモノが)」を進めました.その成果を電気関係学会関西連合大会で発表し,映像情報メディア学会関西支部優秀論文発表賞をいただきました.また,先日のCICP成果報告会でも最優秀賞をいただきました.今回はそのプロジェクトの内容についてご紹介します.

プロジェクト紹介:「写ラナインです(余計なモノが)」

ほとんどの方が観光やスポーツ観戦に出かけると,その思い出を写真として記録するのではないでしょうか.最近では,スマートフォンやPCで,写真の加工やSNSへの共有を行うなど,楽しみ方が新たに広がっています.写真を撮るという行為は,もはや文化として根付いていると言ってよいでしょう.さて,この写真撮影ですが,せっかくの良いシーンだったのに,ピンぼけや映り込みなどによって失敗してしまい,写真が台無しになってしまった,なんてことはないでしょうか.今回私たちは,そんな失敗を解決するようなシステム,その名も「写ラナインです(余計なモノが)」を開発しました.

ディジタルカメラで撮影された画像というのは,いわゆる2次元のデータとして記録されますが,撮影対象となるシーンは,もちろん2次元ではありません.次元が落ちているということはすなわち,画像データになった時点で,多くの情報が欠落したデータになってしまいます.そこで,我々のシステムでは,カメラを平面上で移動させることによって,シーンを2次元の画像データとしてではなく,4次元光線空間と呼ばれるデータとして,シーン中の「光線の」情報を記録します.画像よりもリッチな光線空間を取得することによって,通常のカメラでは不可能な,新たなイメージングが可能となります.以下で私たちのシステムが可能とした,新たなイメージングについてご紹介します.

画素ごとにフォーカス合わせ

実は通常のカメラを用いた場合でも,条件によっては,ただ撮影するだけでシーン中の不要物体を除去することができます.その条件というのは,例えば,開口の大きなレンズを用いて,消したい不要物体が手前にある場合などです.レンズの開口が大きいほどフォーカスが合う位置が狭くなるのですが,そのことをうまく利用すると,不要物体(ブラインド)を大きく「ピンぼけ」させることができ,あたかもブラインドが無くなってしまったかのようなシーンを撮影することが可能となります(図1).

OMI-fig1_leftOMI-fig1_centerOMI-fig1_right図1:「ピンぼけ」によるブラインド除去.中:レンズ開口を小さくした場合と,下:レンズ開口を大きくした場合の撮影画像

しかしながら,先ほど述べたような制約が必要になるため,一般的な不要物体の除去を行うことはできません.

そこで,このような現象に着想を得て,光線空間の情報から,1画素ごとにフォーカス位置を決めるようにできるアルゴリズムを開発しました.1画素ごとにフォーカス位置を決めることができるため,図2に示すように,注目する物体にはフォーカスを合わせてくっきりと,柵などの不要な物体は,大きくピンぼけさせて消してしまうことが可能となります.

OMI-fig2_leftOMI-fig2_right図2 通常撮影(上)と,柵だけを「ピンぼけ」させた画像(下)

なおこの成果は,電気関係学会関西連合大会で発表を行い,映像情報メディア学会関西支部優秀論文発表賞を受賞しました.

光線の取捨選択・リフォーカス

図3のように,動物から来た光線だけを選択し,写したくない柵から来た光線だけを選択し,捨ててしまうことで,不要な柵を除去した画像を生成することができます.

OMI-fig3図3 (a):観測したすべての光線を用いて画像化, (b):柵からの光線(左図赤色の光線)を除去して画像化

さらに,光線空間を用いることでLytro(https://www.lytro.com)のように,ユーザが好きな位置にフォーカスを合わせ直すことが可能となります.

デモンストレーションのために作成したソフトウエアを図4に示します.ソフトウエアの左側に表示されている画像が通常のリフォーカス,右側に表示されている画像が,柵からの光線を除去したリフォーカス画像です.下のスライダを移動させることによって,任意の位置にフォーカスを合わせることができるようになります.

OMI-fig4_leftOMI-fig4_right図4 スライダ調整で後ろの物体にフォーカスを合わせた場合(上)と,同様に前の物体にフォーカスを合わせた場合(下)

オープンキャンパスでのデモンストレーション

2015年3月7日に行われたオープンキャンパスにて,これらの成果をデモ実演いたしました.図5は,「写ラナインです」のデモセットの写真です.

OMI-fig5図5:デモセット

手前が光線空間を取得するための装置で,その奥に見えるのが,撮影シーンに見立てたジオラマです.デモ時には,ジオラマ上の緑の網の除去を行いました.

デモ時には,たくさんの方に足を運んでいただき,光線空間の取得によるイメージングについて知っていただくことができました.また,様々な方から驚きの声を頂戴できたのが印象的でした.さらに,本プロジェクトは,オープンキャンパス参加者からの最多得票により本年度CICPの最優秀プロジェクトに選ばれました.

OMI-fig6図6:最優秀賞!

今後も「光」をテーマとして,驚きと楽しさを感じていただけるような研究を進めていきたいと思います.
(M1 三原)

おわりに

2015年3月に舩冨准教授が着任し,2015年度の新入生受け入れに向けて,着々と準備を進めています.4月には新たなメンバを受け入れ,ようやく2学年が揃った研究室になります.これから,光メディアインタフェース研究室が本格始動します.今後の活動に,どうぞご期待ください!

Internship Experience in Queen’s University, Canada

IMG_5474

My name is Patanamon Thongtanunam. I’m a first-year Ph.D student of Software Design and Analysis Laboratory (SDLAB) in NAIST.  Recently, I have a great opportunity to visit Queen’s University in Canada for 9 months (from September 2014 to April 2015). This internship is supported by NAIST Global Initiatives Program 2014. Today, I am pleased to share my experience of my internship on NAIST Edge.

Queen’s university is a public research university located in the peaceful city of Kingston, Ontario, Canada. Similar to Nara, Kingston is a city that close to many famous cities such as Toronto, Montreal, and Ottawa. The university is also located near the lake Ontario, which is one of the five great lakes of North America. Therefore, it would be no doubt that the view and the weather in summer time is really nice but I still have to say that the winter season here is extremely cold :)

IMG_5475

During my internship, I am doing research under supervision of Professor Ahmed E. Hassan of Software Analysis and Intelligence Laboratory (SAIL) at Queen’s University. The main research topic of SAIL is to investigate approaches and create techniques to support practitioners who are producing, maintaining and evolving in large scale software systems. Since the research area of SAIL is similar to my current research studies in SDLAB, it is not so difficult for me to extend my research under the same topic. In my opinion, SAIL is a highly-active research laboratory in software engineering. Every SAIL’s student enthusiastically does high-impact research and publish their research in the top venues. This environment encourages me to be more energetic as well. Moreover, SAIL is a multi-cultural working environment. There are many visitors from Japan, Brazil, and Singapore working in SAIL. It’s a good chance  to connect people not only from Canada but also from other countries around the world. Interestingly, SAIL is located in a house instead of a building!! This is quite surprised me as you know that NAIST’s laboratories are often in buildings. Working in a house is a kind of new experience for me. I think that it makes me feel like I am working at my home rather than working in an office.

IMG_5480

Although NAIST gives us valuable knowledge and research skills, we can open our vision in other aspects as well as globalize our thinking system by collaborating with other people and doing internship abroad. During my internship at SAIL, I have learned how do they work and think, which is a good example that I should follow and improve myself. I wish that I can share my experience more when I come back to NAIST.

Last but not least, I would like to thanks to my supervisors, Iida-sensei and Ichikawa-sensei who always kindly support and give me this great opportunity. I would like to thanks to NAIST Global Initiatives Program 2014 for their financial support as well. Without them, I would not be able to gain this precious experience.

Thank you very much.

3Dプリンタを活用した研究(ロボティクス研究室)

3Dプリンタを活用した電動義手-「Finch」と「リアル電動義手(仮)」

何らかの理由により手を失った方は,手の機能を代替する義手を使用します.当研究室では,3Dプリンタを活用した2種の電動義手を開発しています.一つは「Finch」と呼ばれる電動義手で,対向に配置された3指によって高い作業性を実現するものです.もう一つは,「リアル電動義手(仮)」と呼ばれる電動義手で,市販の装飾義手(把持機能はないが外観がリアルな義手)の外観のまま,簡易な把持機能を付加した義手です.いずれも3Dプリンタをフルに活用して,人体とのインタフェースであるソケットも含めて開発しています.

3Dプリンタで義手を開発するメリットは,1)ユーザが少ない義手でも少量から製作できる,2)3DCADを用いて自由度の高い設計ができる,3)短時間で試行錯誤できる,4)少量ならば金型を作るよりも安い,5)サイズ変更が容易,6)一か所で製作可能,8)部品が壊れてもすぐに再製作が可能,9)設計データを共有しやすいなど,多数あります.

反面,強度面や安全性での懸念はあります.ただし,3Dプリンタの性能向上は日進月歩であり,強度が高く人体との接触を考慮した安全な材料を使用できる機種も現れてきていますので,これらの課題は徐々にクリアされるでしょう.また,既存の補装具としての扱いが制度上難しいなどの課題もありますが,これも3Dプリンタ有用性が認知されるにつれて状況は変わってくると思っています.3Dプリンタを活用した支援機器がユーザに届く日まで,根気よく開発を行っていきます.

義手の写真

3Dプリンタと市販デバイスを利用した安価な見守りデバイス

日本は世界的に見ても高齢化が最も進んでいる国の1つであり,加齢や疾患による要介護者数の増加が大きな問題となっている.特に運動機能の低下による転倒や転落はより大きな身体的ダメージを引き起こす要因となるため,転倒転落の観測や解析が研究されている.医療機関や福祉施設などにおける転倒転落防止においては,転倒転落が発生する可能性の高い単独行動,すなわちベッドからの離床を検出することが重要であると考えられている.

現状では,患者の衣服とベッドをクリップ型のセンサで繋ぎ離床を検出するシステムや,ベッド上に圧力センサを多数敷き詰めて離床や危険状態を検知するシステムなどが利用されている.しかし,クリップ型センサでは患者がセンサを外してしまい離床検出が出来なかったり,接触型センサでは寝返りなどの別の動作で反応してしまったりと誤作動が多いという問題が残っている.また,患者やベッドに物理的に取り付けるセンサでは衛生面や耐久性,設置にコツが必要であるなどの問題などが残されている.

一方,患者に非侵襲なシステムとして非接触型のセンサを用いた患者見守りシステムへの期待が高まっており,いくつかの製品が提案されている.これらのシステムでは離床だけでなく患者の姿勢なども計測可能であるため,より多くの情報が取得可能であるが,次のような問題を抱えている.

  1. 初期設定やベッド移動に伴う機器調整など導入・運用に手間がかかる.
  2. 従来のシステムに比べて高価である.
  3. 患者の映像を取り扱う(何をしているかわかってしまう)ためプライバシーの問題がある.

本研究では,医療機関や福祉施設などにおける実用化を目指した高信頼な見守りシステムの開発を目的としている.我々はこれまでに,ベッドからの離床を高い信頼度で検出することを目的とした低価格でメンテナンス性の高い見守りデバイスの開発を行っている.これまで,市販のハードウェアを組み合わせることによって誰でも低価格にデバイスの構築が可能であることを示し,ソフトウェアをコンポーネント思考で開発することによってメンテナンス性が高く,ベッド位置の変化などに頑健なアルゴリズムを提案している.

今後も動作検出アルゴリズムの改良やデバイスの改善を続けていく予定である.

MIMAMORIsystem

PhD Studies in Intelligent System Control Lab

Hello, I’m Takamitsu Matsubara, an assistant professor in the Intelligent System Control Laboratory. We study on system control, machine learning, reinforcement learning, intelligent robotics, signal processing, and sensing intensively. This article introduces some of our research topics by two PhD students.

If you are further interested in details, please visit our lab’s website: http://genesis.naist.jp/?lang=en

Lorlynn Asuncion Mateo (D1): 
Originally from the Philippines, I moved to Japan to join the Intelligent System Control laboratory of NAIST as a research student about 3 years ago. From there, I entered and finished the Master course, then proceeded to enter the doctoral course immediately after graduation. Currently, I am a first year doctoral course student in the said laboratory, undertaking theoretical research on two-degree-of-freedom (2DOF) control.
Initially, my chosen research theme gained much attention in control engineering because of its interesting conception in the biological field. Several years back, Kawato et al. established that biological motor control is achieved by the brain and central nervous system by using a 2DOF structure with a learning law. In this structure, a feedforward (FF) mechanism makes use of feedback (FB) error to achieve accurate motion. This scheme is popularly known as feedback error learning (FEL). To illustrate, a simple figure below shows how the human body functions using this 2DOF structure. In the figure, the controlled object is the pair of limbs used to achieve the motor task, e.g. grabbing an item. Feedback control can be achieved with the help of human vision, while the inverse model and learning law are considered in the human brain. What’s interesting is, deviating from the biological perspective, this idea for adaptive control is very promising and can be applied to any other type of control problem, as done in a lot of existing literature on the subject.

2DOF_intuitive

In my PhD study, we design 2DOF control schemes for single-input, single-output (SISO) and multi-input, multi-output (MIMO) plants (model of controlled object). It is known in control theory that the 2DOF configuration enables us to design independently FB and FF control laws for stabilization and response shaping, respectively. FEL is promising in the sense that FF control is tuned on-line and hence can give good response without modeling. For instance, in an experimental work by a former student of our laboratory, an FEL scheme was applied for motion control of a two-link manipulator to write different one-stroke characters. Below, the figure on the left shows the numerical simulation result for writing “8”, while the photo on the right shows the experimental result using the two-link manipulator.
simulation_before-afterLearningexp_before-afterLearning

Some FEL schemes turned out to be effective under certain assumptions on the plant; however, if the plant model is plagued by finite zeros, then the conventional scheme cannot overcome the difficulties involved, i.e., risk of over-parameterization and consideration of non-commutative matrix multiplication. This is where my research topic comes in. We propose 2DOF control schemes to deal with the presence of finite zeros in the plant.

Under the guidance of Prof. Kenji Sugimoto, we have published several articles addressing the said topic. One proposed approach is the use of Polynomial Matrix Fractional Representation from the modeling of the MIMO plant to the derivation of the control law to address the presence of finite zeros. Evaluation of the proposed approach is then done via numerical simulation. Based on the evaluation, results prove that the proposed approach is effective and successfully treats the difficulties mentioned above. Aside from this example, other studies, such as the treatment of SISO plants with zeros, are also currently being studied. After evaluating the performance of these feedforward learning schemes, evaluation via experimentation will be explored. One possible application is for vibration control of a flexible link manipulator (shown below) for accurate position control.

writeup_naistEdge_v3


Yunduan Cui (D1):
My PhD life in Intelligent System Control Laboratory (ISC lab), NAIST started from October 2014. After finishing Master course, I chose NAIST as my next step because it is a top research university in Japan,that provides me a wonderful research environment. Now I am enjoying challenging research and interesting laboratory life in the peaceful campus every day. My research focuses on develop a new Reinforcement Learning algorithms applicable for high-dimensional and complex robotic systems.

What is Reinforcement Learning? Imaging that we hope one robot to throw a baseball to the target without knowing how to control it. In Reinforcement Learning, we let the robot throw the ball according to its current knowledge (motor skill) firstly (it is obvious that the ball cannot hit the target at the beginning), then we tell the robot how good its performance is (the closer to the target, the better performance) and let it updates its knowledge. In the next iteration, the robot tries to throw the ball again and determine its actions according to the new knowledge. Following this way, after several iterations, the robot will be able to get a quite good knowledge to throw the baseball to the target. This is an overview of RL for robotic systems: making a robot to discover an optimal behavior through trial and error interactions with its environment autonomously.

RLv2

Unlike conventional control methodologies, we do not tell the robot how to do but teach it how to learn by itself. The robot tries to explore an unknown world and learn how to take the action that avoid punishment and get more reward. This process looks like some real animals’ behaviors very much and therefore help us to discover artificial intelligence in a nature way. Thanks to the new advanced machine learning theories and the improved computation ability, RL technologies are progressively popular and practical. They have been applied in more and more complex robotics systems in recent years and had very impressive performance.

In our lab, RL is applied in several challenging tasks with complex robot systems. Different high dimensional robots are trained by RL to solve problems that may be very difficult for other control methods. For examples, helping people put on their cloth, learning something’s shape though touching and even playing table tennis with real people and improving its performance by learning opponents’ behaves.

Robotv2RL also provides us a possible way to let the robot to “understand” the real world and therefore becomes more intelligent. Such an amazing feature attracts me so much and encourage me to be a PhD student in NAIST. What we are doing is to make the robot acts like a real animal but not only a cold machine. During my doctor course here, I hope to learn how to be a real researcher with a deep understanding of this field and then make some contributions to it.

cuiv2