========= 石田 岳志 ========= 職歴 ==== `CyberAgent AI Lab `__ ------------------------------------------------------- 2024年7月 - `Tier IV, Inc. `__ -------------------------------------- 車両の自己位置推定の研究開発 * Visual SLAM 技術の調査と実装 * 難しい環境を対象とした位置推定アルゴリズムの開発 2020年7月 - 2024年6月 `未踏プロジェクト `__ ------------------------------------------------------------------------------ | Visual SLAMフレームワークの開発 | 2019年4月 - 2020年3月 `株式会社ディー・エヌ・エー `__ -------------------------------------------------- | コンピュータビジョンに関連する手法の調査と実装 | 2018年4月 - 2020年3月 | アルバイト `クックパッド株式会社 `__ --------------------------------------------------- | 料理画像から具材を推定する手法の開発 | 2016年12月 - 2017年7月 | アルバイト `株式会社ウサギィ `__ ------------------------------------------- | コンピュータビジョンや自然言語処理におけるさまざまな手法の調査と実装 | 2014年5月 - 2017年1月 | アルバイト 学歴 ==== | 東京高専 専攻科 機械情報システム工学専攻 | 2017年4月 - 2019年3月 | フィンランド メトロポリア応用科学大学 (交換留学) | 2017年8月 - 2017年12月 | 東京高専 情報工学科 | 2012年4月 - 2017年3月 特許 ==== `特許6306770 `__ 料理に用いられている具材を料理画像から推定する手法 成果物 ====== `Visual Relocalization `__ -------------------------------------------------------------------------------------------- COLMAP 地図と単眼カメラを活用した自己位置推定 .. image:: images/demo-relocalization.gif :width: 800 `icp_rust `__ ------------------------------------------------ | ICP (Iterative Closest Point) の Rust による実装。 | TIER IV で開発中の OS の上で動かすことを目的としているが、Linux でも動作する。 .. image:: images/icp.gif :width: 800 `YDLiDAR Driver `__ ---------------------------------------------------------------------- 手のひらサイズの小型な LiDAR である `YDLiDAR T-mini Pro `__ の Rust 製ドライバ。 .. image:: https://raw.githubusercontent.com/tier4/ydlidar_driver/main/images/plot_scan.gif | `LOAM (Refactored version) `__ --------------------------------------------------------------------------------- | LiDAR ベースの SLAM アルゴリズムである LOAM [#Shan_et_al_2018]_ [#Shan_et_al_2020]_ をリファクタリングしたもの。 | 自動運転用 OSS である `Autoware `__ と統合して動かすことを目的としている。 | LiDAR スキャンから構造特徴を抽出する処理をオリジナルの実装よりも高速化している。 | `Tadataka `__ -------------------------------------------------------- |  Visual Odometry のアルゴリズムを複数実装したパッケージ。RGB-D カメラ向けのオドメトリ推定アルゴリズムと、特徴点ベースの単眼カメラ向けオドメトリ推定システムを使うことができる。 **DVO (Dense Visual Odometry)** [#Steinbrucker_et_al_2011]_ [#Kerl_et_al_2013]_ .. raw:: html  深度情報および画像の輝度情報からカメラの移動経路を推定できる。 **特徴点ベースのVisual Odometry** .. raw:: html  単眼RGB画像列のみから3次元地図とカメラの軌跡を推定できる。 | `RoadDamageDetector `__ ------------------------------------------------------------------------------- .. image:: images/road-damage-1.png :width: 800 | SSD (Single Shot Multibox Detector) [#Liu_et_al_2016]_ によって道路のひび割れや損傷を検出できる。 | Maeda らの研究 [#Maeda_et_al_2018]_ を追証している。詳細な解説は `Qiita `__ に掲載されている。 | `SBA `__ ----------------------------------------------- | 高効率な3次元復元アルゴリズム Sparse Bundle Adjustment (SBA) [#Lourakis_et_al_2009]_ を Python で実装した。 | `Tomasi-Kanade `__ ------------------------------------------------------------------ .. image:: images/tomasi-kanade-output-2.png :width: 800 | Tomasi-Kanade法 [#Tomasi_et_al_1992]_ による3次元復元の実装。 | 正投影カメラモデルを用いるので、実世界のアプリケーションとしては利用範囲が限定されるものの、SVDによって高速に3次元復元を実行できる。 | `Bilinear-Interpolation-SIMD `__ ---------------------------------------------------------------------------------------------- | 画像の画素補間に用いられるアルゴリズム Bilinear Interpolation を SIMD を用いて実装した。 | `PCANet `__ ------------------------------------------------------- .. image:: images/pcanet.png :width: 800 |  PCANet [#Chan_et_al_2015]_ はネットワークの重みを PCA で計算することで高速にバッチ学習できるニューラルネットワークである。このネットワークは Pooling 層でヒストグラム計算を行っており、これが実行速度のボトルネックとなっていた。 |  この問題を解消するため、私はヒストグラム計算を CuPy で GPU 向けに実装した。計算を並列化したことで実行速度も大幅に向上した。CuPy開発者の方々の協力もあり、これは後に CuPy 本体にマージされている。 `#298 `__ | `Ensemble PCANet `__ --------------------------------------------------------------------------- | PCANet をアンサンブル学習することで分類器の性能向上を図った。また、これを研究成果として `JSAI 2017 `__ で発表した。 | `DTrie `__ -------------------------------------------------- | 簡潔データ構造 Trie のD言語による実装。 | かな漢字変換で使う辞書を少ないメモリで保持するために実装した。 | `SCW `__ ------------------------------------------------- | オンライン教師あり線形分類器 SCW (Soft Confidence-Weighted Learning) の実装 [#Wang_et_al_2012]_。 | Qiita ===== - `プログラマが持つべき心構え (The Zen of Python) `__ - `カルマンフィルタってなに? `__ - `Tomasi-Kanade法による3次元復元 `__ 執筆 ==== - `日経ソフトウエア 2017年8月号 「Pythonで機械学習」 `__ - `日経ソフトウエア 2020年5月号 「撮影した物体を3次元データで復元」 `__ - `TIER IV Tech Blog 「Visual SLAMの可能性と技術的チャレンジ」 `__ - `TIER IV Tech Blog 「Visual-Inertial Odometryが自動運転に与えるインパクトと応用への課題」 `__ - 日本写真測量学会 写真測量とリモートセンシング 2023年11月号 「市街地における自動運転へのSLAMの活用」 発表資料 ============= - `自己位置推定の取り組み `__ - `Graph SLAM の Marginalization `__ - `Sparse Bundle Adjustment `__ - `3次元回転表現とその実装 `__ - `CUDAでヒストグラム計算を書いてcupyにmergeしてもらった `__ - `Juliaでオンライン線形分類器つくった `__ - `マルウェア分類に用いられる特徴量 Kaggle - Malware Classification Challenge勉強会 `__ リンク ====== - `GitHub `__ - `Blog `__ - `Qiita `__ - `SpeakerDeck `__ References ========== .. [#Chan_et_al_2015] Chan, Tsung-Han, et al. "PCANet: A simple deep learning baseline for image classification?." IEEE transactions on image processing 24.12 (2015): 5017-5032. .. [#Kerl_et_al_2013] Kerl, Christian, Jürgen Sturm, and Daniel Cremers. "Robust odometry estimation for RGB-D cameras." Robotics and Automation (ICRA), 2013 IEEE International Conference on. IEEE, 2013. .. [#Liu_et_al_2016] Liu, Wei, et al. "Ssd: Single shot multibox detector." Computer Vision–ECCV 2016: 14th European Conference, Amsterdam, The Netherlands, October 11–14, 2016, Proceedings, Part I 14. Springer International Publishing, 2016. .. [#Lourakis_et_al_2009] Lourakis, Manolis IA, and Antonis A. Argyros. "SBA: A software package for generic sparse bundle adjustment." ACM Transactions on Mathematical Software (TOMS) 36.1 (2009): 1-30. .. [#Steinbrucker_et_al_2011] Steinbrücker Frank, Jürgen Sturm, and Daniel Cremers. "Real-time visual odometry from dense RGB-D images." Computer Vision Workshops (ICCV Workshops), 2011 IEEE International Conference on. IEEE, 2011. .. [#Tomasi_et_al_1992] Tomasi, Carlo, and Takeo Kanade. "Shape and motion from image streams under orthography: a factorization method." International journal of computer vision 9 (1992): 137-154. .. [#Maeda_et_al_2018] Maeda, Hiroya, et al. "Road damage detection using deep neural networks with images captured through a smartphone." arXiv preprint arXiv:1801.09454 (2018). .. [#Shan_et_al_2018] Shan, Tixiao, and Brendan Englot. "Lego-loam: Lightweight and ground-optimized lidar odometry and mapping on variable terrain." 2018 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE, 2018. .. [#Shan_et_al_2020] Shan, Tixiao, et al. "Lio-sam: Tightly-coupled lidar inertial odometry via smoothing and mapping." 2020 IEEE/RSJ international conference on intelligent robots and systems (IROS). IEEE, 2020. .. [#Wang_et_al_2012] Wang, Jialei, Peilin Zhao, and Steven CH Hoi. "Exact soft confidence-weighted learning." arXiv preprint arXiv:1206.4612 (2012).