DARPA_LAGR_Program
2004年から2008年にかけて実施された地上車両に適用される学習(LAGR)プログラムは、ロボット無人地上車両(UGV)の自律的な知覚ベースのオフロードナビゲーションの進歩を加速することを目的としていました。LAGRは、米国国防総省の研究機関であるDARPAによって資金提供されました。
コンテンツ
1 歴史と背景
2 LAGRの目標
3 LAGRプログラムの構造と理論的根拠
4 LAGRチーム
5 LAGR車両
6 科学的結果
7 プログラム管理
8 参考文献
歴史と背景
移動ロボット( Shakeyなど)は1960年代から存在していましたが、屋外、オフロード、不規則で障害物の多い地形を自力でナビゲートできるロボットの作成は遅れていました。実際、進捗状況を測定するための明確な指標はありませんでした。オフロード機能のベースラインの理解は、DARPA PerceptORプログラムで明らかになりました。このプログラムでは、独立した研究チームが、一定のコースでの平均速度と必要なオペレーター介入の数を広く測定した、リハーサルされていない政府のテストでロボット車両をフィールドしました。間隔を空けたウェイポイント。これらのテストは、オフロードナビゲーションの極端な課題を明らかにしました。PerceptOR車両には、21世紀初頭の最先端のセンサーとアルゴリズムが搭載されていましたが、知覚技術の範囲が限られていたため、自然の袋小路に閉じ込められていました。さらに、事前に記述された行動に依存しているため、予期しない状況に適応することはできませんでした。全体的な結果として、障害物が最小限の本質的に開いた地形、または未舗装の道路に沿った地形を除いて、PerceptOR車両は、オペレーターの介入を何度も繰り返すことなくナビゲートできませんでした。
LAGRプログラムは、PerceptORテストによって明らかになった技術的課題を克服しようとしながら、PerceptORで開始された方法論に基づいて構築されるように設計されました。
LAGRの目標
LAGRの主な目標は、UGVのオフナビゲーションの進歩を加速することでした。追加の相乗的な目標には、(1)非構造化環境で動作する自律型ロボットの進捗状況を測定するためのベンチマーク手法の確立、(2)マシンビジョンの進歩による長距離知覚の実現、(3)最前線のUGV研究に貢献する。
LAGRプログラムの構造と理論的根拠
LAGRプログラムは、新しいハードウェアではなく、ロボットの知覚と制御のための新しい科学の開発に焦点を当てるように設計されました。したがって、競争力のあるチームのメンバーであるLAGR研究者に供給され、アルゴリズム開発に集中できるようにする、同一の比較的単純なロボットのフリートを作成することが決定されました。チームにはそれぞれ、標準設計の2台のロボットが与えられました。彼らはこれらのロボットで新しいソフトウェアを開発し、コードを政府のテストチームに送信し、政府のテストチームがさまざまなテストコースで政府のロボットでそのコードをテストしました。これらのコースは全米にあり、以前はチームに知られていませんでした。このようにして、すべてのチームのコードを本質的に同じ状況でテストできます。最初の起動期間の後、コード開発/テストサイクルは毎月約1回繰り返されました。
標準ロボットは、カーネギーメロン大学国立ロボティクスエンジニアリングセンター(CMU NREC)の公式ウェブサイトによって設計および製造されました。車両のコンピューターには、CMU NRECがPerceptORプログラム用に作成したものと本質的に同じシステムであり、LAGRの開始時に最先端のものと見なされていた、モジュール式の「ベースライン」認識およびナビゲーションシステムがプリロードされていました。ベースラインシステムのモジュール性により、研究者はベースラインコードの一部を独自のモジュールに置き換え、ナビゲーションシステム全体を最初から作成しなくても完全に機能するシステムを維持できます。したがって、たとえば、他のすべてを固定したまま、独自の障害物検出モジュールのパフォーマンスをベースラインコードのパフォーマンスと比較することができました。ベースラインコードは固定参照としても機能しました。どのような環境でも、プログラムのどの時点でも、チームのコードをベースラインコードと比較できます。この急速なサイクルにより、政府チームとパフォーマーチームは迅速なフィードバックを得ることができ、政府チームは特定の知覚タスクでパフォーマーに挑戦し、パフォーマーの現在の能力に挑戦する可能性が高いが、圧倒することのないテストコースを設計することができました。チームは、テストごとに新しいコードを提出する必要はありませんでしたが、通常は提出しました。この余裕にもかかわらず、一部のチームは、迅速なテストサイクルが長期的な進歩に気を散らすことに気づき、テスト間の間隔を長くすることを望んでいました。
フェーズIIに進むには、各チームがベースラインコードを変更して、政府テストのフェーズIの最後の3つのテストで、チームのコードを実行するロボットが元のベースラインコードを実行する車両よりも平均して少なくとも10%高速になるようにする必要がありました。このやや控えめな「Go / No Go」メトリックは、チームがリスクを伴うが、プログラムの最初の18か月では完全には開発されない可能性のある有望なアプローチを選択できるようにするために選択されました。8つのチームすべてがこの指標を達成し、フェーズIIの目標であった後のテストでベースラインの2倍以上の速度を記録したチームもありました。フェーズIGo / No Goメトリックは、フェーズIIの限られた数のスロットでチームが互いに完了していなかったことに注意して8から0までの任意の数のチームが成績を上げることができます。DARPAによるこの戦略は、チーム間の協力とコード共有を促進するように設計されました。
LAGRチーム
LAGRの最初の18か月であるフェーズIでは、8つのチームがパフォーマーとして選ばれました。チームは、Applied Perception(主任研究員 Mark Ollis)、Georgia Tech(PI Tucker Balch)、ジェット推進研究所(PI Larry Matthies)、Net-Scale Technologies(PI Urs Muller)、NIST(PI James Albus)、スタンフォード大学(PI Sebastian Thrun)、SRI International(PI Robert Bolles)、およびペンシルベニア大学(PI Daniel Lee)。
スタンフォードチームはフェーズIの終わりに辞任し、 DARPAグランドチャレンジに注力しました。コロラド大学ボルダー校(PI Greg Grudic)のチームに置き換えられました。また、フェーズIIでは、NISTチームは競争への参加を一時停止し、代わりに各チームの最高のソフトウェア要素を1つのシステムに組み立てることに集中しました。ロジャー・ボステルマンはその努力のPIになりました。
LAGR車両
LAGR車両。約30本生産されました。高さは約1メートル、重さは約100kgでした。
スーパーマーケットのショッピングカートと同じくらいの大きさのLAGR車両は、制御が簡単になるように設計されています。(コンパニオンDARPAプログラムであるLearning Locomotion は、複雑なモーター制御に対応していました。)バッテリー駆動で、前部に2つの独立駆動車椅子モーター、後部に2つのキャスターホイールがありました。前輪が同じ方向に回転すると、ロボットは前進または後進しました。これらの車輪が反対方向に駆動されると、ロボットは回転しました。
LAGR車両の約30,000ドルのコストは、フリートを構築して、DARPAロボティクスプログラムに伝統的に参加していた研究者の分野を拡大する多くのチームに配布できることを意味しました。車両の最高速度は約3マイル/時間で、重量は約100 kgと比較的控えめであるため、無人地上車両の以前のプログラムで使用されていた車両と比較して、安全上の問題が大幅に減少し、各チームが管理するために必要な予算がさらに削減されました。そのロボット。
それにもかかわらず、LAGR車両は洗練された機械でした。彼らのセンサースイートには、2組のステレオカメラ、加速度計、バンパーセンサー、ホイールエンコーダー、およびGPSが含まれていました。車両には、ユーザーがプログラム可能な3台のコンピューターもありました。
科学的結果
プログラムの要は、ロボットに学習した行動を組み込むことでした。さらに、このプログラムでは、パッシブ光学システムを使用して長距離シーン分析を実行しました。
構造化されていないオフロード環境でUGVナビゲーションをテストすることは困難であったため、進行状況を正確かつ客観的に測定することは困難な作業でした。LAGRではパフォーマンスの絶対的な尺度は定義されていませんでしたが、チームのコードと特定のコースのベースラインコードの相対的な比較により、その環境で進歩が見られたかどうかがわかりました。プログラムの終わりまでに、テストは、パフォーマーの多くがパフォーマンスの飛躍を達成したことを示しました。特に、平均自律速度が3倍に増加し、有用な視覚が100メートルまで拡張されました。
LAGRは視覚の有用な範囲を拡張することに成功しましたが、これは主にピクセルまたはパッチベースの色またはテクスチャ分析のいずれかによって行われました。オブジェクト認識は直接対処されませんでした。
LAGR車両にはWAASGPSが搭載されていましたが、その位置が車両の幅まで決定されることはなかったため、 GPSが継続的にドリフトしていたため、ロボットが以前に通過したエリアの障害物マップをシステムが再利用することは困難でした。林冠があった場合、ドリフトは特に深刻でした。いくつかのチームは、このドリフトを本質的に排除する視覚オドメトリアルゴリズムを開発しました。
LAGRはまた、パフォーマーの数を増やし、大規模なシステム統合の必要性を排除して、小さなチームによって作成された貴重なテクノロジーナゲットを認識し、より大きなコミュニティで採用できるようにすることも目標としていました。
一部のチームは、人間の教師と一緒に学習するための迅速な方法を開発しました。人間はラジコン(RC)でロボットを操作し、「安全」と「非安全」の領域を指定する信号を発し、ロボットは同じポリシーですばやく適応してナビゲートできます。これは、ロボットが茂みを避けながら死んだ雑草を積極的に運転するように教えられたとき、あるいは臆病で刈り取られた道だけを運転するように教えられたときに実証されました。
LAGRは、DARPA無人地上戦闘車両– PerceptOR統合プログラム(UPI)CMU NREC UPIWebサイトと連携して管理されていました。UPIは、高度な知覚と非常に機動性の高い車両を組み合わせました。LAGRの最高のステレオアルゴリズムと視覚オドメトリクスがUPIに移植されました。さらに、LAGR PIとUPIチーム間の相互作用により、適応技術がUPIコードベースに組み込まれ、UPI「クラッシャー」ロボットのパフォーマンスが向上しました。
プログラム管理
LAGRは、DARPA情報処理技術部の下で管理されていました。Larry Jackelがプログラムを考案し、2004年から2007年までプログラムマネージャーを務めました。EricKrotkov、Michael Perschbacher、JamesPippineがLAGRの構想と管理に貢献しました。Charles Sullivanは、LAGRテストで主要な役割を果たしました。Tom Wagnerは、2007年半ばから2008年初頭のプログラム終了まで、プログラムマネージャーを務めていました。
参考文献
^ 特に付録C、全米アカデミーの全米研究評議会、「陸軍無人地上車両の技術開発」、全米アカデミーズプレス、ワシントンDC、2002年を参照して
^ E. Krotkov、S。Fish、L。Jackel、M。Perschbacher、およびJ. Pippine、「DARPA PerceptOR評価実験」、自律型ロボット、22(1):19〜35ページ、2007年。
^ LD Jackel、Douglass Hackett、Eric Krotkov、Michael Perschbacher、James Pippine、およびCharlesSullivan。「DARPAが移動とナビゲーションを改善するためにロボット工学プログラムをどのように構築するか。」ACMのコミュニケーション、50(11):ページ55-59、2007。
^ James Pippine、Douglas Hackett、Adam Watson、「国防高等研究計画局の学習移動プログラムの概要」、International Journal of Robotic Research、第30巻、第2巻、141〜144ページ、2011年
^ LAGRの結果の詳細については、Journal of Field Roboticsの特集号、第23巻2006年11月12日、第26巻2009年1月2日を参照して”