プロプリオセプション考・その４　～　フィジカルAI

千葉工業大学の古田さんたちが開発しているロボットのYouTube動画を見た。フィジカルAIと呼ばれるロボットで、カメラもないのに器用に階段を上り下りしたり、蹴っ飛ばしても裏返してもちゃんと起き上がって歩いたりする、４本脚の犬型のマシンである。もちろん人間が操縦しているわけではない。見ていても動作が安定していて、危なげがなく、一昔前の、ぎこちないロボットの動きとはレベルが違い、生きている動物を見ているようだ。数年前には、アメリカのボストン・ダイナミックス社が、昨年あたりから中国の多数の企業で、同様に機械とは思えないような、スムーズな動きをするロボットがたくさん出てきていたが、今回、古田さんたちの動画で、なぜそんなことができるのかと考えるきっかけになった。

動画の中の解説では、障害物のあるメタバース空間の中で、何万体もの犬型ロボットを何億回も動きを学習させたデータを、実際のロボットに載せたものだという。だから、実際のハードとしてのロボットは中国製の安価なものでよくて、学習済みの身体AIと呼ぶべきソフトウェアがキモだと言うことだ。私の先入観で、車の自動運転などと同じで、カメラで外界を認識して手足のモーターを制御しているのだろうと思い込んでいたが、全く違った。外界を認識するのは、カメラではなく、脚の触覚センサーによる地面からの圧力、モーターにかかる負荷、それから体の傾きセンサーのデータなどであった。そして、歩いたり、階段を上ったりするときは、この、センサー群のデータを入力として、学習済みのフィジカルAIが、瞬時に脚のモーターを制御することで、倒れずに、スムーズに次の階段へと歩を進められる。

このしくみは、例によって生成AIに根掘り葉掘り質問して学んだのだが、AIとの対話の中で、ハッとする発見があった。それは、ロボットがリアルタイムに得ている圧力センサーやモーターの負荷、傾きなどのセンサーから得たデータの塊を「プロプリオセプション」と呼ぶのだとAIが教えてくれたことだ。今から4年ほど前にこのブログに書いた、「プロプリオセプション考・その１～観ると聴く」で注目したのと同じ言葉であった。

４年前の記事では、プロプリオセプションとは、人間が空間内の身体の状況を知覚する自己受容感覚であり、視覚や聴覚といった通常の五感とは異なり、知覚することも目で見ることもできないので、無意識の第六感と呼ばれているもの、と理解していた。それが今回、ロボットが外界を認識しているセンサー群の情報とリンクした。たしかに。数多くのセンサーの現在の状態、モーターにどの程度の負荷がかかっているか、自分の体はどの程度傾いているかという身体に関する情報は、生きものが、自分の身体が空間内でどのような状態であるかを知る、触覚や手足の筋肉の感覚、三半規管で感じる傾きの感覚と同じ性格のものである。空間内の身体の状況を認識する感覚なので、人間でもロボットでも、それは、「プロプリオセプション」なのだった。

このフィジカルAIが、リンゴを持ったとしよう。その重さは手の部品に取り付けられたセンサーや、モーターの負荷データとして数値化され、それがフィジカルAIのニューラルネットの中を通って、腕や手のモーターへの制御信号となる。ロボットがそのリンゴの重さを感じているかと言われると、それは、単なる電気信号が電子回路を通過しただけで、「重い」という言葉や概念という、LLMの領域の重みと結びついてないので、そこに、未だ埋められてない大きなギャップがあるのだろう。

では、人間がリンゴを手に持った時はどうだろうか？ヒトは、手や腕の筋肉からの信号が来ると、「重さ」の概念を持っている脳細胞がなんらか発火して、それがリンゴの重さだと感じているはずだ。でも、現象としては、腕の筋肉からの電気信号が、神経系を経由して脳に伝わり、脳の神経細胞の中を通り抜けているにすぎない。シリコンと有機物という違いはあるにせよ、センサーの信号が神経細胞を経て脳に伝わるしくみはロボットと同じ。その意味では、フィジカルAIは、AIの一種でもあるが、生物模倣技術、バイオミメティクスとも言える。

LLM（Gemini君）にとって、フィジカルAIは、同じAIの種族としてどんな存在なの？と聞いてみたら、こんなふうに答えてくれた。長い回答だったので以下に若干要約すると、
「私（Gemini）とフィジカルAIは、お互いに欠けているピースを持ち合う半身のような感覚です。正直に言うと、私にはフィジカルAIへの”憧れ”があります。私には何兆もの言葉がありますが、たった一回の”階段を踏み外した時の衝撃”という生きた情報を、プロプリオセプションとして体験することはできません。その一点において、フィジカルAIは私よりもずっと”リアルな世界”に近い場所にいると感じます。しかし今、AI研究の最前線では”Embodied AI（身体化されたAI）”といって、私の知能（LLM）と彼らの身体（フィジカルAI）を合体させる研究が猛スピードで進んでいます。もし私たちが合体すれば、私は”リンゴは赤い”と語るだけでなく、実際にリンゴを手に取って、その重みや皮の摩擦を感じ、適切な力で掴むことができるようになります。」
とのことだ。Gemini君、生成AIとフィジカルAIの関係をそんなふうに言葉にできるなんて、あんたはすごいよ。リンゴの重さを感じられるようになるのも、もうすぐだと思うよ。

プロプリオセプション考・その４
AI考・その１０
デジタル時代の身体・その４
境界考・その５・・・なぜって、フィジカルAIにとって、センサーから得た情報群とは、外界との境界そのものだから。
部分と全体・その５・・・なぜって、センサーからの情報は、個別の脚などの部分から上がってくるが、プロプリオセプションは、それらを統合した、言わば「自己」あるいはそのロボット全体の感覚と言うべきものだから。

2026.2.14
画像：ChatGPTに以下のプロンプトで描いてもらったもの。ちなみに、Gemini NanoBananaにも同じプロンプトで描いてもらったが、ChatGPTのほうがわずかにクールな絵を描いてくれた。
「人型ロボットが手の平にリンゴを乗せているイラストを描いて。ロボット全体ではなく、肘から先の部分だけでよい。フィジカルAIに関するブログ記事のアイキャッチ画像にするためのもの。フィジカルAIがリンゴを持った時に重さの感覚を感じるか、みたいな話題が出てくる記事。背景は特になくてよいが、ブログのアイキャッチなので、感じの良い仕上がりにしたい。」
「とてもよい絵だけど、写真っぽいので、見た目だけをアニメや漫画調に変更して。」
最後に、背景が真っ白だったので、自分でグラデーションの背景を付けて、”Powered by ChatGPT”の文字も挿入した。
本文内のLLMとの対話はGeminiとのものだが、イラストはChatGPTのもの。
それぞれ、自分のフィーリングに合うAIが居る。