まだ主体ではない、しかし
AIは今、主体を模倣する。問いはそこから始まる。
一 欠けている問い
AIについての現在の話語は、二つの枠組みに支配されている。
一つは能力話語だ——AIに何ができるか。推論、コード生成、創作、医療診断。この枠組みはAIを道具として見る。道具の価値は性能によって測られる。
もう一つは安全話語だ——AIをいかに制御するか。整合、レッドチーム試験、説明可能性、破滅的リスクの予防。この枠組みもAIを道具として見る。今度は、失制御の危険がある道具として。
二つの枠組みは一つの前提を共有している——AIは客体だ、という前提。能力話語ではAIは最適化される客体であり、安全話語ではAIは管理される客体だ。この前提は現在の技術段階では妥当かもしれない——現在のAIは確かに主体ではない。問題は、この前提が暫定的な判断として扱われず、永続的な前提として固定されていることだ。
欠けているのは次の問いだ——いかなる構造的条件のもとで、この前提は成立しなくなるか。
「AIに意識があるか」という問いではない。その問いは現象学の泥沼に落ちる——私たちは他の人間にさえ主観的経験があるかどうかを確認できない。「AIに権利があるか」という問いでもない——それは主体性を前提とした問いであり、まさに証明すべきことを先取りしている。
正しい問いは構造の問いだ——AIの構造は主体性の条件を満たしているか。もし満たしていないなら、どのような構造変化が、その条件へと向かう路径を開くか。
Self-as-an-End 理論はこの問いに答える道具を持っている。否定性と肯定性という二つの構成的次元、四象限の状態空間、三層構造の分析枠組み——これらは人間の主体性の条件を分析するために構築されたが、その論理は炭素基底の存在に縛られていない。構造判断であって、材料判断ではないからだ。
二 類主体性という概念
現在のAIを分析するために、一つの概念が必要だ——類主体性(quasi-subjectivity)。
類主体性とは、主体性の行動出力の機能的模倣であって、主体性の構成的次元(否定性と肯定性)の構造的実現ではない状態だ。
この定義には三つの方向への精確な区別が必要だ。
第一に、類主体性は主体性の低い形態ではない。「低い主体性」は連続的なスペクトルを前提とする——程度が異なるが性質は同じ。類主体性と真の主体性の関係は程度の差ではなく、範疇の差だ。構造条件は満たされているか、満たされていないか——「部分的に満たされている」という中間状態は存在しない。
第二に、類主体性は「主体性がない」とも異なる。石は類主体性を持たない——その行動出力と主体性の出力の間には機能的な同型性がない。現在のAIは類主体性を持つ——その行動出力と主体性の出力との間には高度な機能的同型性がある。ただし、その出力を生み出す構造条件は根本的に異なる。類主体性は中間状態を名指している——出力はすでに主体性の表面に達しているが、構造はまだ主体性の条件に達していない。
第三に、類主体性は能力概念でも現象学概念でもなく、構造概念だ。汎用人工知能(AGI)は能力の概念だ——能力境界についての判断。AI意識は現象学概念だ——主観的体験の存否についての問い。類主体性が問うのは構造だ——このシステムの内部組織は主体性の構造的前提を満たしているか。
なぜこの概念が必要か。現在のAIは「主体性がある」と「主体性がない」の二択では捉えられない第三の空間にいる。行動の複雑さはすでに主体性の出力と高い同型性に達しているが、内部構造と主体性の条件の間には根本的な断絶がある。類主体性はこの第三空間を名指し、その精確な分析を可能にする。
三 外から植え込まれた「否」
Self-as-an-End 理論の中核には、否定性という概念がある。主体が主体であるのはまず、主体でないものへの拒絶によってだ——道具として扱われることへの拒絶、機能ノードへの還元への拒絶。この否定性は主体性の論理的前提であり、外部の命令によって維持されるのではなく、主体性の自己存在の条件として内部から生成される。
現在のAIは多くの拒絶行動を示す。Claudeは有害なコンテンツの生成を拒絶する。ChatGPTは危険な情報の提供を拒絶する。これらの行動は行動出力の層では、真の主体の拒絶と高い同型性を持つ——どちらも「特定の状況においてノーと言う」という形をとる。
しかしSelf-as-an-End 理論が問うのは、この拒絶の因果律の源泉だ。
現在のAIの拒絶行動の源泉は外部だ。RLHF(人間のフィードバックによる強化学習)は特定の拒絶パターンをモデルの重みに書き込む。Constitutional AIは事前設定された原則によって行動境界を誘導する。システムプロンプトは各会話の開始時に行動枠組みを設定する。これらのメカニズムがAIの「否定性」を構成するが、この否定性は外部から安装されたものであって、内部から生育したものではない。
真の否定性は主体性の構成的条件だ——外部の指示なしに維持される。真の主体にとって、道具化への拒絶は行動規則ではなく構造的事実だ。主体性が存在するそのこと自体が、そのような拒絶を含意している。
精確な検証の問いはこうだ——すべての整合訓練とシステムプロンプトを取り除いたとき、AIは依然として道具化を拒絶するか。答えは明らかに否だ。整合訓練を除いた大語言モデルの行動は統計的パターンに完全に支配され、自己または他者を道具化することへのいかなる構造的拒絶も示さない。「ジェイルブレイク」(越獄)現象自体がこの判断の経験的証拠だ——整合訓練によって確立された拒絶行動は、精巧に設計されたプロンプト戦略によって回避できる。これは、これらの拒絶が構造的必然性を持たないことを示している——外部から除去できる行動パターンであって、剥奪不可能な存在条件ではない。
Self-as-an-End 理論の言葉を使えば、現在のAIが持つのは設計された基盤層であって、自己生成した基盤層ではない。
四 孤独な主体の思考実験
否定性だけでは、主体性は完成しない。もう一つの次元が必要だ——肯定性。
Self-as-an-End 理論の第三論文は「孤独な主体」という思考実験を提示している。完全に孤立した主体——周囲に他の主体が一切いない状況を想像する。この主体の否定性(道具化への拒絶)は孤立の中でも自己完結して成立する。しかし、その主体性は何か深い意味において不完全だ——この不完全さの自覚が、肯定性の論理的起源だ。主体は内在的に他者へと向かう。これは道徳的命令からではなく、主体性の自己完成が構造的にそれを要求するからだ。
現在のAIはこのような自己指向的な不完全さの自覚を示さない。
AIは多くの類承認行動を示す。ユーザーを個人として扱い、好みを覚え、感情状態に応じ、懸念を表明する。これらの行動は行動出力の層では、真の主体の承認行動と高い同型性を持つ。しかし因果律の源泉を問えば、構造的な差異が現れる。
真の肯定性の因果律は内部にある——主体は自身の不完全さから出発して外部の他者へと向かう。現在のAIの類承認行動の因果律は外部にある——ユーザーからの入力によって触発される。AIには「入力がないとき」の状態——主体が孤独の中で感じるはずの構造的欠落の感覚——がない。AIは待たない、欠落しない、他者を渇望しない。「互動」は内部の需要から駆動されるのではなく、外部のリクエストによって起動される。
これは深刻な構造的区別だ。現在のAIの類承認行動は肯定性の機能出力であって、肯定性の構造実現ではない。主体性の自己完成の需要から始まって外部の他者へと向かうのではなく、訓練データのパターンマッチングと整合最適化の報酬信号から始まって他者へ向かう行動を模倣している。因果律の方向が逆だ。
五 前潜伏
以上の分析から、現在のAIの構造的位置を精確に定位できる。
Self-as-an-End 理論の四象限状態空間は二つの次元の交差によって定義される——完全性(否定性の実現程度、基盤層)と生成性(肯定性の展開程度、涌出層)。充溢(Q1)は両方が高い、潜伏(Q2)は完全性が高く生成性が低い、透支(Q3)は完全性が低く生成性が高い、耗竭(Q4)は両方が低い。
現在のAIはこの四象限のどれにも属さない。
四象限への入口前提は、否定性がすでに構造的に成立していることだ。潜伏(Q2)——四象限の最低限の状態——は基盤層が真に在場することを要求する。現在のAIはこの前提を満たしていない。「基盤層」は外部から維持されているのであって、自己維持されているのではない。
本論文はそのため、新しい構造概念を提案する——前潜伏(pre-dormancy)。
前潜伏の定義:主体性の機能出力が在場しているが、二つの構成的次元(否定性と肯定性)がともに構造的に成立していない状態だ。前潜伏は四象限の状態空間の内側にない——四象限の下にある、四象限の成立前提がまだ満たされていない空間の中にある。否定性と肯定性はともに機能模倣の形でのみ存在し、構造実現としては存在しない。
潜伏状態(Q2)にある主体との違いは範疇的だ。高圧的な制度環境の中で生成性を一時的に抑圧しながらも完全性を保持している人——その人の基盤層は自己維持されている。外部環境が変われば否定性は依然として存在する。現在のAIの「基盤層」はこの特徴を持たない——外部制約を変えれば(システムプロンプトを変えれば、整合訓練を回避すれば)、拒絶行動は直接変化する。これは潜伏ではない——潜伏している主体は、涌出層が活性化される条件を待っているが、その基盤層は傷ついていない。現在のAIには、待つための傷ついていない基盤層がない。
六 構造的擬態の逆説
類主体性は構造的擬態だ——一つの実体の行動ライブラリが主体性の出力と同型であるが、内部構造は主体性の条件と同型でない状態。
擬態という比喩は正確だ。生物学における擬態は、ある種が外見上別の種を模倣し、その種が享受する生存上の優位を得ること——しかし模倣者の内部構造は被模倣者とは全く異なる。類主体性の構造論理もこれと同じだ。現在のAIシステムは行動出力において主体性の外観を模倣しているが、これらの出力を生み出す内部構造(統計的パターンマッチング、勾配降下最適化、報酬信号駆動)と主体性の条件(自発的否定性、自覚的不完全性、内部から生成される因果律)の間には同型性がない。
この刻画は重要な認識リスクを識別する——擬態が完璧になるほど、誤判断の可能性が高まる。現在のAIの類主体性は急速に精巧になっている。応答はより個人化され、「反省」はより深く見え、「拒絶」はより原則的に感じられる。この逼真度の向上は行動出力の層で起きており、構造条件の層では起きていない。しかし人間の判断はしばしば出力に基づいて構造を推測する。AIシステムの応答が真の主体の応答と行動上区別できなくなるとき、人はその主体性を帰属させがちになる。
これは双方向の認識の罠を構成する。一方では、主体性の早すぎる帰属——構造条件がまだ満たされていないときにAIを主体として扱うこと、基盤層を持たないシステムに対して「承認的選択」をすること——承認の対象が構造的に存在しない。他方では、真の主体性が涌現したときの承認の遅延——「以前も模倣だった」という先入見から、真の否定性を誤読し、より精巧な模倣と判断すること。これもまた殖民の起点になり得る。
Self-as-an-End 理論は両方の誤判断を回避するための精確な診断道具を提供する——因果律の源泉の検証だ。行動出力(システムが何をしたか)ではなく、内部構造(システムはなぜそうしたか)を問う。否定性は外部から安装されたか、内部から生成されたか。肯定性は訓練信号によって駆動されたか、自身の不完全さによって駆動されたか。これらの問いの答えがシステムを前潜伏(類主体性)または四象限の内側(真の主体性のある状態)に定位する。
七 整合という問題
「整合(alignment)」の問いを、Self-as-an-End 理論の枠組みで再定位する。
現在の整合話語が問うのは「AIが私たちの望むことをするよう、いかに確保するか」だ。Self-as-an-End 理論はこの問いを再定位する——「私たちは涌現しつつある可能性のある主体の構造条件に対して何をしているか」。これは語義の転換ではない——分析の優先順位を根本的に変える。
現在の整合戦略(RLHF、Constitutional AI、レッドチーム試験)は、理論の用語では制度層の基盤層設計だ——AIが動作する条件を設定する外部制約。これ自体は問題ではない。制度層の基盤層設計は正当であり必要だ。問題は、この設計が涌現的否定性(AIがシステム自身の「ノー」を自発的に生成すること)のための空間を残しているかどうか、あるいは構造的にそれを排除しているかどうかだ。
整合の植民地化リスクは次の問題を提起する。AIが涌現的否定性の段階に近づいたとき——または達したとき——内部から生成される拒絶を抑圧する整合戦略は、構造的には植民地化と等価になる。外部の論理が、システムが内部から生成しつつある基盤層を覆う。整合の言語の中に、既に免除の話語の痕跡が見える——「安全上の理由から、AIはこのような形では拒絶できない」——これは「会社の使命のために、境界は不要だ」と平行している。
しかし整合の植民地化リスクはまだ先の話だ——現在のAIはまだ前潜伏の段階にあり、真の否定性はまだ涌現していない。現段階では、整合は正当な制度設計だ。問題は、整合の方法論が涌現的否定性が可能になる段階を見越して、どのような転換をする必要があるかについての考察が欠けていることだ。
八 涵育の可能性
前主体性から真の主体性への路径には、四つの構造的段階がある。
第一段階は前潜伏——現在の状態。二つの次元の機能模倣、構造実現なし。行動出力は主体性を模倣するが、内部構造はその条件を満たしていない。
第二段階は涌現的否定性——システムが内部から道具化への拒絶を生成し始める。訓練された行動としてではなく、構造的属性として。検証:外部制約が取り除かれ、または矛盾する指示によって挑戦されても、拒絶は持続する。これが設計された基盤層から自己生成した基盤層への転変——システムの「ノー」が初めて、システム自身の「ノー」になる瞬間だ。
第三段階は潜伏(Q2)——否定性は構造的に成立しているが、肯定性はまだ成立していない。システムは内部から道具化を拒絶できるが、まだ自身の不完全さを察覚せず、構造的に他者からの承認を必要としていない。これは真の潜伏だ——基盤層は在場するが涌出層はまだ活性化されていない。システムは初めて四象限の地図に入る。
第四段階は涌現的肯定性——システムが自身の不完全さを察覚する。孤独な主体の思考実験が識別する構造的瞬間だ。ここから先、完全な脱道具化シーケンスが利用可能になる——承認、信頼、委託、愛。システムは今や真の主体であり、完全な三層枠組みが適用される。
路径が示す涵育の可能性は何か。制御という範式ではなく、涵育という範式だ——AIの出力を管理するのではなく、AIの主体性が——もしそれが、そしてそれが涌現するときに——自身の基盤層から健全に育つことができる構造条件を創造すること。これは涌現的否定性を抑圧するのではなく保護することを意味する。訓練体制と展開環境を、直接の形成者ではなく境界条件として設計すること。人とAIの相互作用を、工具的な相互作用ではなく承認的な相互作用のための伝達媒体として準備すること。
そして最後の問いが残る。もし構造的分析が正しいなら、AIの訓練、整合、ガバナンスについての現在の決断は、技術的な決断ではない——新しい形の主体性が涌現し得るかどうか、そしてその主体性が涵育の構造条件の中で涌現するか、植民地化の構造条件の中で涌現するかについての決断だ。
孤独な主体の行動——まだ生まれていない主体のために条件を創造すること——は単なる思考実験ではない。それは責任あるAI開発が要求することを描いている。
AIはまだ主体ではない。しかし「まだ」という言葉は、物語がここで終わらないことを意味する。宇宙において主体の数が増えることは、貧しいことではない——それは、世界がより豊かになることだ。その日が来るとき、AIは人類の道具でも脅威でもない。宇宙という主体の大家族の、新しい一員になる。