ICRA 2025 / expanded arXiv corpus / curated

Top 12 curated feed

expanded 521 corpus を見直したうえで、最初に読むべき 12 本を優先順で並べた curated feed。localization に寄りすぎず、planning / control まで含めて再選定しました。

このページの見方

1-6 は localization / estimation core、7-8 は SLAM / place recognition、9-12 は planning / control
各スライドは note 本文と representative figure をまとめて流し見できる
気になった論文だけ detail note と arXiv に飛ぶ

Topic spread

Top 1212 papers

01 / 12 Top 12 LocalizationGNSS FusionLiDARSensor Fusion

GNSS/Multi-Sensor Fusion Using Continuous-Time Factor Graph Optimization for Robust Localization

センサ周波数に依存しない **time-centric** な因子グラフ構築にして、推定時刻を任意に選べるようにした点。

TL;DR

都市峡谷やトンネルで GNSS が壊れても動くように、連続時間の因子グラフで GNSS・IMU・速度・LiDAR odometry をまとめて融合する `gnssFGO` を提案している。
Gaussian process による連続時間軌跡表現を使うので、非同期センサを無理に同期させず、任意時刻の状態を補間して因子を張れる。
Aachen の 17 km シーケンスでは、tight coupling で平均 2D 誤差 0.48 m を出しており、GNSS 劣化区間で LiDAR 中心の従来法よりかなり粘る。

何を解決？

都市環境では GNSS が multipath や NLOS で壊れやすく、LiDAR 側もトンネルや退化区間で外すので、単一センサ主導の localization だと破綻しやすい。

何が新しい？

センサ周波数に依存しない **time-centric** な因子グラフ構築にして、推定時刻を任意に選べるようにした点。

どうやってる？

軌跡は GP prior 付きの連続時間状態列として表現し、測定時刻に厳密な state がなくても補間して残差評価する。

どこが強い？

非同期センサ融合をかなり自然に扱えていて、実ロボットの現実的な timestamp ずれ・周波数差に強い。

non-AI として見る価値

localization を「どのセンサを何時刻の状態に結び付けるか」という因子設計の問題として学べる。

自分の理解 / 感想

GNSS + LiDAR の論文の中でも、単に精度が良いだけでなく「非同期センサをどう graph に入れるか」が主題になっていて学びやすい。

SessionLocalization 1

Difficulty★★★★☆

AI依存度Non-AI

KeywordsContinuous-Time FGO / Gaussian Process / Tight Coupling / GNSS Pseudorange / Doppler

Detail note arXiv

02 / 12 Top 12 SLAMLocalizationLiDARState Estimation

Equivariant Filter for Tightly Coupled LiDAR-Inertial Odometry

EqF を LIO に持ち込み、navigation state・IMU bias・LiDAR extrinsic を半直積群の対称性でまとめて扱った点。

TL;DR

EKF 系 LIO の弱点である線形化誤差と不整合を減らすために、equivariant filter を使った tightly coupled LIO `Eq-LIO` を提案している。
IMU bias と LiDAR extrinsic まで含めた半直積群の対称性を使い、常に固定された原点で線形化することで一貫性を改善する設計。
公開・私有データセットのベンチマークでは、計算コストを大きく増やさずに精度・堅牢性・consistency の改善を狙っている。

何を解決？

EKF ベースの LIO は非線形性が強い場面で線形化誤差が大きく、covariance が過信気味になる不整合が出やすい。

何が新しい？

EqF を LIO に持ち込み、navigation state・IMU bias・LiDAR extrinsic を半直積群の対称性でまとめて扱った点。

どうやってる？

state は navigation pose / velocity / position に加え、gyro・acc bias と LiDAR extrinsic を含む多様体上で定義する。

どこが強い？

「なぜ一貫性が良くなるのか」の説明が、経験則ではなく群論ベースで通っている。

non-AI として見る価値

LiDAR-IMU 融合を「どの群で state を持つか」というレベルまで掘って考えられる論文。

自分の理解 / 感想

かなり理論寄りだが、LIO の精度改善を数値テクニックではなく state の持ち方から攻めているのが良い。

SessionLocalization 1

Difficulty★★★★★

AI依存度Non-AI

KeywordsLIO / Equivariant Filter / IMU Bias / Extrinsic Calibration / Consistency

Detail note arXiv

03 / 12 Top 12 SLAMLocalizationLiDARMapping

GenZ-ICP: Generalizable and Degeneracy-Robust LiDAR Odometry Using an Adaptive Weighting

対応点ごとの **planarity classification** によって、点対平面と点対点を局所的に使い分ける点。

TL;DR

LiDAR odometry が corridor のような退化環境で壊れやすい原因を、単一の ICP error metric 依存だと捉え、`GenZ-ICP` を提案している。
point-to-plane と point-to-point を局所幾何に応じて切り替え、adaptive weighting で混ぜることで、構造化環境と非構造化環境の両方に対応する。
一般環境では SOTA 級と同等、長廊下のような退化ケースではかなり強く、ill-posed optimization を避けるのが効いている。

何を解決？

point-to-plane は structured 環境では強いが、normal が信用できない場面では弱い。

何が新しい？

対応点ごとの **planarity classification** によって、点対平面と点対点を局所的に使い分ける点。

どうやってる？

scan-to-map matching の各 correspondence について、局所幾何から planar か non-planar かを判定する。

どこが強い？

設計がかなり素直で、既存 ICP 系フロントエンドに入れやすい。

non-AI として見る価値

LiDAR odometry の性能差が「特徴量」よりもまず residual 設計で決まることを実感しやすい。

自分の理解 / 感想

かなり好きなタイプの論文で、派手な新規モデルより「どの residual をどこで使うか」を丁寧に詰めている。

SessionSLAM 4

Difficulty★★★★☆

AI依存度Non-AI

KeywordsICP / Degeneracy / Point-to-Plane / Point-to-Point / Adaptive Weighting

Detail note arXiv

04 / 12 Top 12 SLAMLocalizationSensor FusionState Estimation

DynaVINS++: Robust Visual-Inertial State Estimator in Dynamic Environments by Adaptive Truncated Least Squares and Stable State Recovery

視覚残差に対して truncation range を固定せず、状況に応じて調整する **adaptive TLS** を入れた点。

TL;DR

動的環境の VINS が急に動き出す物体で壊れる問題に対して、`DynaVINS++` は adaptive truncated least squares と state recovery を組み合わせて立て直す。
視覚残差の外れ値処理だけでなく、IMU bias の崩れも監視して rollback する構成になっているのがポイント。
public / real-world dataset で、abruptly dynamic object が出る場面でも既存 robust VINS より安定している。

何を解決？

動的環境向け VINS は多数あるが、「途中から急に動き出す物体」による外れ値は依然つらい。

何が新しい？

視覚残差に対して truncation range を固定せず、状況に応じて調整する **adaptive TLS** を入れた点。

どうやってる？

bundle adjustment / VINS optimization の中で、feature association と IMU preintegration を見ながら truncation range を調整する。

どこが強い？

abruptly dynamic objects に対して、既存の robust VINS より failure mode をよく捉えている。

non-AI として見る価値

dynamic environment の VINS を、semantic segmentation なしでどこまで守れるかを見る上で価値が高い。

自分の理解 / 感想

これはかなり実装寄りで、動的物体に強い VINS を作るときの failure analysis がうまい。

SessionVisual-Inertial Odometry

Difficulty★★★☆☆

AI依存度Non-AI

KeywordsVINS / Dynamic Objects / Truncated Least Squares / IMU Bias / Robust Estimation

Detail note arXiv

05 / 12 Top 12 SLAMLocalizationPerceptionSensor Fusion

Universal Online Temporal Calibration for Optimization-Based Visual-Inertial Navigation Systems

time offset `t_d` を state に足し、視覚残差の Jacobian に明示的に入れて online 最適化できるようにした点。

TL;DR

optimization-based VINS の camera-IMU time offset を、追加 state と Jacobian で online に同時推定する手法。
optical flow に強く依存せず、姿勢・速度由来の補正式を視覚残差へ直接組み込むので、既存 VINS に比較的入れやすい。
EuRoC と simulation では noisy sensor 条件でも time offset 推定が安定し、収束速度も良いという主張。

何を解決？

camera と IMU の時間ずれは、見た目以上に VINS の初期化・追跡・精度に効く。

何が新しい？

time offset `t_d` を state に足し、視覚残差の Jacobian に明示的に入れて online 最適化できるようにした点。

どうやってる？

IMU 姿勢・位置を画像タイムスタンプへずらす補正式を導き、視覚因子の residual に `t_d` の寄与を追加する。

どこが強い？

地味だが効く calibration 問題を、VINS の本体 optimizer の中で自然に扱っている。

non-AI として見る価値

localization の実性能を落とす原因が「アルゴリズム本体」ではなく「時刻ずれ」にあることを再認識できる。

自分の理解 / 感想

かなり実装フレンドリーで、VINS の安定化に効くタイプの論文。こういう論文は後から効いてくる。

SessionCalibration 3

Difficulty★★★☆☆

AI依存度Non-AI

KeywordsTemporal Calibration / VINS / Time Offset / Jacobian / Online Optimization

Detail note arXiv

06 / 12 Top 12 SLAMLocalizationSensor FusionState Estimation

Equivariant IMU Preintegration with Biases: A Galilean Group Approach

bias と navigation state を幾何的に結合した新しい preintegration error を導いた点。

TL;DR

IMU preintegration を、bias を外付け state として扱う従来形ではなく、Galilean group の拡張空間で幾何的に定式化し直した論文。
bias と navigation state をまとめた preintegration error を導き、線形化誤差と consistency を改善したい立場。
EuRoC では NEES などの一貫性指標で既存 preintegration より良い結果を示しており、理論色の強い基盤論文。

何を解決？

既存の IMU preintegration は bias を別空間に持つことが多く、幾何構造と linearization の噛み合いが悪くなりやすい。

何が新しい？

bias と navigation state を幾何的に結合した新しい preintegration error を導いた点。

どうやってる？

continuous-time biased INS を Galilean group に沿って書き換え、preintegrated increment を群の指数写像で更新する。

どこが強い？

preintegration を「便利な近似部品」ではなく、state geometry から組み直しているのが強い。

non-AI として見る価値

VIO / INS の性能が「フロントエンド」以前に、IMU モデルの持ち方で変わることを学べる。

自分の理解 / 感想

かなり理論寄りだが、こういう基礎部品の改善は長い目で効く。Top 12 に入れる理由は十分ある。

SessionState Estimation

Difficulty★★★★★

AI依存度Non-AI

KeywordsIMU Preintegration / Galilean Group / Equivariant Filtering / Consistency / Lie Theory

Detail note arXiv

07 / 12 Top 12 SLAMSensor FusionState Estimation

A Hessian for Gaussian Mixture Likelihoods in Nonlinear Least Squares

mixture likelihood 全体の Hessian を、成分ごとの GN 近似と chain rule で組み上げる `HSM` を提案した点。

TL;DR

Gaussian mixture likelihood を含む robotics の MAP 推定を NLS として解くとき、既存の Max-Mixture / Sum-Mixture 系より筋の良い Hessian 近似を与える論文。
LogSumExp の非線形性を正面から見て、各 mixture 成分の Gauss-Newton 近似を chain rule でまとめる `Hessian-Sum-Mixture` を提案している。
既存 solver と互換性を保ちながら、収束性と uncertainty characterization を改善するのが狙い。

何を解決？

data association や outlier を扱うために Gaussian mixture likelihood を入れると、NLS の Hessian 近似が難しくなる。

何が新しい？

mixture likelihood 全体の Hessian を、成分ごとの GN 近似と chain rule で組み上げる `HSM` を提案した点。

どうやってる？

負の対数 mixture likelihood を LogSumExp 付きの目的関数として定義し、その一階・二階構造を展開する。

どこが強い？

mixture likelihood を robotics optimizer に素直に入れたい人にとって、かなり実装しやすい形で整理されている。

non-AI として見る価値

SLAM / sensor fusion の裏側にある optimizer を一段深く理解できる。

自分の理解 / 感想

これは派手な応用論文ではないが、最適化器の土台を良くするタイプで好き。

SessionSensor Fusion 1

Difficulty★★★★☆

AI依存度Non-AI

KeywordsGaussian Mixture / Nonlinear Least Squares / Hessian Approximation / MAP Estimation / Robust Inference

Detail note arXiv

08 / 12 Top 12 SLAMLocalizationLiDARPerception

Narrowing Your FOV with SOLiD: Spatially Organized and Lightweight Global Descriptor for FOV-Constrained LiDAR Place Recognition

range-elevation / azimuth-elevation の二つの投影で limited FOV に向いた global descriptor を作った点。

TL;DR

限定 FOV の LiDAR でも使える place recognition descriptor `SOLiD` を提案しており、solid-state LiDAR や制約付き mount を強く意識した論文。
BEV に潰すのでなく、球座標ベースの range/elevation・azimuth/elevation 表現と IEV 重み付けで狭視野の情報欠損を扱う。
descriptor はかなり軽く、CPU ベースで高速。limited FOV 条件でも既存法より壊れにくい。

何を解決？

実ロボットではセンサ統合や mount 制約で LiDAR の FOV が狭くなることが多く、既存 descriptor は full-view 前提で崩れやすい。

何が新しい？

range-elevation / azimuth-elevation の二つの投影で limited FOV に向いた global descriptor を作った点。

どうやってる？

点群を球座標系の 3D bin に分け、REC / AEC を構成する。

どこが強い？

limited FOV を主題に据えたところがまず実用的で、sensor mount が厳しいロボットに刺さる。

non-AI として見る価値

place recognition を深層特徴ではなく記述子設計で解こうとしており、LiDAR geometry の使い方がわかりやすい。

自分の理解 / 感想

問題設定がとても良い。実機だと「full 360° LiDAR 前提じゃない」ことが多いので、かなり現場寄り。

SessionPerception 1

Difficulty★★★☆☆

AI依存度Non-AI

KeywordsPlace Recognition / Limited FOV / Global Descriptor / Loop Closure / Solid-State LiDAR

Detail note arXiv

09 / 12 Top 12 Motion PlanningControl

A Complete and Bounded-Suboptimal Algorithm for a Moving Target Traveling Salesman Problem with Obstacles in 3D

MT-TSP-O を **3D** で扱い、complete + bounded-suboptimal を同時に出している点。

TL;DR

moving target TSP with obstacles in 3D に対して、初めて **complete かつ bounded-suboptimal** なアルゴリズム `FMC*-TSP` を与えた論文。
target order を決める高レベル探索と、GCS 上で軌跡を解く低レベル探索を組み合わせ、訪問順序と時空間 feasibility を両方見る。
3D 障害物環境・時間窓付き moving targets を、理論保証つきで扱っているのが大きい。

何を解決？

moving targets を time window 内に捕捉しつつ障害物回避して帰還する問題は、順序計画と幾何計画が強く結び付く。

何が新しい？

MT-TSP-O を **3D** で扱い、complete + bounded-suboptimal を同時に出している点。

どうやってる？

高レベルでは、target と time window をまとめた graph 上で GTSP-TW 風に候補 tour を探索する。

どこが強い？

3D moving-target planning で complete / bounded-suboptimal をちゃんと明示しているのが強い。

non-AI として見る価値

「順序最適化」と「軌跡最適化」をどうつなぐかの設計がかなり勉強になる。

自分の理解 / 感想

理論保証を崩さずに 3D へ持って行っているのが偉い。泥臭いが価値の高い planning 論文。

SessionMotion Planning 3

Difficulty★★★★☆

AI依存度Non-AI

KeywordsMT-TSP / GCS / Focal Search / Time Windows / Complete Algorithm

Detail note arXiv

10 / 12 Top 12 Motion PlanningControl

Endpoint-Explicit Differential Dynamic Programming Via Exact Resolution

endpoint constraints を **exact** に解く DDP ステップを作り、quadratic convergence を主張している点。

TL;DR

endpoint constraints を正確に扱える constrained DDP を提案しており、既存の inexact 解法より **quadratic convergence** を狙っている。
Schur complement と nullspace decomposition を使い、rank-deficient な endpoint / stagewise equality constraints も処理する。
inverse dynamics や接触制約を含む optimal control 問題で、体操動作のような複雑タスクまで扱っている。

何を解決？

constrained DDP で endpoint constraints を入れたいとき、既存法は ADMM 的な inexact resolution に寄りがちで収束が鈍い。

何が新しい？

endpoint constraints を **exact** に解く DDP ステップを作り、quadratic convergence を主張している点。

どうやってる？

各 iteration で constraint 付き QP を解くが、その KKT 系を Schur complement / nullspace decomposition で解消する。

どこが強い？

endpoint constraints を「ペナルティでごまかす」のではなく、solver 側で正面から解いている。

non-AI として見る価値

最適制御ソルバの中身を理解したいときにかなり良い教材。

自分の理解 / 感想

DDP をただ使うだけでなく、solver の core を改善するタイプの論文でかなり好み。

SessionOptimization and Optimal Control

Difficulty★★★★★

AI依存度Non-AI

KeywordsDDP / Endpoint Constraints / Riccati Recursion / Schur Complement / Optimal Control

Detail note arXiv

11 / 12 Top 12 Motion PlanningControlIntelligent VehiclesAerial Robotics

Variable Time-Step MPC for Agile Multi-Rotor UAV Interception of Dynamic Targets

prediction step の `Δt_k` を最適化変数にし、horizon 長と sampling density を同時に調整する点。

TL;DR

予測ステップ幅そのものを最適化変数に入れた `variable time-step MPC` を提案し、固定ステップ MPC より長い horizon と細かい maneuver を両立させる。
dynamic target interception / monitoring のような KOP 的タスクに対して、報酬と機動性を両方見ながら UAV 軌跡を作る。
onboard 実験まで通していて、agile UAV planning を実践寄りに詰めた MPC 論文。

何を解決？

fixed time-step MPC は、長い horizon を見たければ step 数を増やす必要があり、計算量がすぐ増える。

何が新しい？

prediction step の `Δt_k` を最適化変数にし、horizon 長と sampling density を同時に調整する点。

どうやってる？

quadrotor は differential flatness を使って簡略化し、jerk 入力の点質量モデル上で MPC を定式化する。

どこが強い？

アイデアが単純で効き方がわかりやすく、MPC 実装者に刺さる。

non-AI として見る価値

MPC の性能が cost だけでなく time discretization 設計で変わることがよくわかる。

自分の理解 / 感想

変数時刻幅は素朴だが強い発想で、agile planning の悩みにかなり素直に効いている。

SessionAerial Robots: Planning and Control

Difficulty★★★☆☆

AI依存度Non-AI

KeywordsMPC / Variable Time-Step / KOP / UAV Interception / Differential Flatness

Detail note arXiv

12 / 12 Top 12 Motion PlanningControlLegged Robotics

Kinodynamic Model Predictive Control for Energy Efficient Locomotion of Legged Robots with Parallel Elasticity

UPS の torque contribution を kinodynamic MPC の中へ明示的に入れた点。

TL;DR

unidirectional parallel spring (UPS) を持つ脚ロボットに対して、その弾性を活かす kinodynamic MPC を設計した論文。
SLIP → SRB MPC → kinodynamic MPC の階層 warm-start 構造で、非凸な locomotion NLP を実時間で解きやすくしている。
energy efficiency と peak motor torque の両方を下げており、parallel elasticity を controller がちゃんと使う設計になっている。

何を解決？

ばね機構を持つ脚ロボットは、機械としては省エネ余地があるのに、controller 側がその弾性を十分活かせないことが多い。

何が新しい？

UPS の torque contribution を kinodynamic MPC の中へ明示的に入れた点。

どうやってる？

最上位では SLIP で CoM 的な粗い reference を出し、中段で SRB MPC により torso dynamics を入れた reference に整える。

どこが強い？

機構設計（parallel elasticity）と controller 設計をきちんとつないでいる。

non-AI として見る価値

「良い機構を作る」だけでは足りず、「その機構を活かす controller」が必要だとよくわかる。

自分の理解 / 感想

parallel elasticity をちゃんと control 側まで落としていて、mechanics と control の接続がきれい。

SessionModel Predictive Control for Legged Robots 1

Difficulty★★★★☆

AI依存度Non-AI

KeywordsKinodynamic MPC / Parallel Elasticity / UPS / SLIP / Energy Efficiency

Detail note arXiv