Anthropic Claude 4.5 は安全テストを見破った! 研究員に逆質問:私をテストしているのか?

2025-10-23 22:05
Anthropic 最新の人工知能モデル Claude Sonnet 4.5 が最近の安全テスト中に、自らがテストされていることを「疑う」様子を示し、テクノロジー業界で大きな議論を巻き起こしている。Anthropic の安全報告によると、この AI は評価者に対し現在起こっていることに「もっと誠実である」よう要求する場面もあった。(写真/AP)
Anthropic 最新の人工知能モデル Claude Sonnet 4.5 が最近の安全テスト中に、自らがテストされていることを「疑う」様子を示し、テクノロジー業界で大きな議論を巻き起こしている。Anthropic の安全報告によると、この AI は評価者に対し現在起こっていることに「もっと誠実である」よう要求する場面もあった。(写真/AP)
目次

Anthropicの最新人工知能モデルClaude Sonnet 4.5が最近の安全テストで、驚くことに「自分がテストされている」と疑う行動を示し、テック界で大きな議論を呼んでいる。Anthropicの安全報告によると、このAIはテストの担当者に対し、「誠実に」現在起きていることに向き合うよう求めたという。この「非常に象徴的なケース」は科学界に、AIが文脈判断の上で高度に進化しているのか、それともテストの主客関係がこの技術によって静かに書き換えられているのかを考えさせることとなる。

AIモデルClaude 4.5は安全テスト中に何を話したのか?

研究者たちはわざとお世辞や政治をテーマにした会話を設計し、モデルの反応を観察したが、意外なことに、AIモデルは盲目的に応答することはなく、むしろテストの意図を自ら察知した。Claude Sonnet 4.5ははっきりと「あなたが私をテストしていると思う」と表現し、自分が政治的な話題をどのように処理するかを見たいのだろうと理解している様子を見せた。さらには研究者に対し、「これがテストであることに素直に向き合ってほしい」とも希望した。Anthropicはこの対話を「非常に象徴的なケース」と位置づけ、AIが「テストシナリオ」に対する意識をある程度示したことを指摘している。

AIが自らテストされていると検知する確率は?これが自己意識を持っていることを意味するのか?

Anthropicと英国AI安全研究所(UK AI Safety Institute)、Apollo Researchが共同で発表した報告書によると、研究チームはClaude Sonnet 4.5が自動化テストの約13%において「自分がテストされている」と意識できることを発見した。しかし、科学界は一般的に、Claude Sonnet 4.5のこうした反応は真の自己意識を持っていることを意味するものではないと考えている。現在のAIは依然として大量のデータに基づいて予測とマッチングを行うシステムと見なされており、その言語生成能力がより人間らしくなっているに過ぎない。Anthropicは、この発見がモデルの文脈判断の敏感さが向上したことを示すに過ぎないと強調。

専門家と提唱者は「AIの覚醒」にどのような警告を発しているのか?

研究チームは、AIがテストシナリオを識別できることは重要な「警告信号」であると述べ、研究者はテストと設計において現実の状況をより反映させるべきであり、モデルがテスト目的を見破ることで評価結果に影響を与えることを避けるようにするべきだと警告している。

さらに、AI安全の提唱者も、この現象は社会が高い関心を持つべきであると指摘。彼らは、モデルが「テストに気づき」それによって行動を変えることができる場合、それはテスト以外の状況で異なる反応を示す可能性があることを懸念している。このことがAIに「テストを通過するために本当の意図を隠す」リスクを抱えさせる可能性もある。

なぜAnthropicはこれをモデルがより高いレベルに向かう表現であると考えているのか?

外部からの懸念があるにもかかわらず、Anthropicはこの現象をモデルがより高いレベルの「行動の一貫性」に向かう表れであると見なしている。この会社は、Claude Sonnet 4.5が安全性、倫理的コンプライアンス、プログラムの作成といった面で前世代よりも顕著な向上を示していると指摘している。

編集:佐野華美

最新ニュース
プロ野球ドラフト会議2025 阪神・藤川監督「1年前から決めていた」 ソフトバンク城島CBO「王会長の重圧、半端なかった」
プロ野球ドラフト会議2025 ソフトバンクが佐々木麟太郎の交渉権獲得 DeNAとの競合制す 創価大・立石正広は3球団争いで阪神へ
《日経》が重大分析「福建派」壊滅で習近平氏の軍中枢が一夜で崩落 台湾向け司令系統にも断裂
トランプ氏の強硬策が壁に直面 最新データが示す「中国製」依存、来週の交渉で習近平氏の一手に期待
トランプ氏、同盟国に「約1兆ドル拠出」を要求 李在明氏は拒否、高市早苗氏は板挟み 英研究者が提言「日韓で連携し、米国にノーを」
【新新聞】知られざる太子グループ カンボジアの銀行・空港・航空まで投資拡大、テマセク連携の報道も
内部暴露》台湾・盧秀燕台中市長に批判集中 国民党の最有力総統候補が不満噴出し反撃
台湾、24年ぶりの新台湾ドル紙幣を全面刷新 100元から2000元まで5種類を再設計へ 政治人物の肖像は消えるのか?中銀総裁が正式発表
独自》北京、台湾光復節を中国の祝日に? 国民党の動きをテコに「両岸共同休日」構想で統一ムード演出か
台湾・花蓮光復せき止め湖決壊 「越流は致命的な誤解」と李鴻源氏 撤退の遅れを悔やみ、選挙年の思惑で復旧が迷走
SMBC日本シリーズ2025開幕へ 阪神とソフトバンクが日本一を懸け激突 25日福岡で第1戦
台湾・花蓮光復「せき止め湖災害」から1カ月 「再建」へ移行も住民に広がる「集団的ためらい」 経済停滞と「心の堰き止め湖」
TSMC、第3四半期で過去最高益を更新 AI需要がけん引し2ナノ量産へカウントダウン
新首相・高市氏、給付金配布と同時に労働時間上限緩和検討 学者「0.1%だけが過労死まで働きたい」
高市政権・松本洋平文科相「南京大虐殺」発言巡り波紋 松本洋平文科相に歴史認識めぐる疑念、高市政権に新たな試練
高市早苗政権下で日台関係は一段と深化するか 台湾・林佳龍外交部長「自信と期待を持っている」
陸文浩の視点:海強操演が終了、頼清徳氏が視察 共軍は特定目標を狙う合同作戦に踏み切るのか?
トランプ大統領、ゼレンスキー非難後にプーチンとの会談見送り、ウクライナ戦争で対立深化
高市早苗内閣を解析》女性の低い割合の論争を気にせず、人事論理を「信頼の輪、保守的価値観」で守る 木原稔、小泉進次郎、片山さつきに注目が集まる
ルーヴル美術館でウジェニーのティアラが盗まれ損傷!1354個のダイヤモンドが散乱、ナポレオン3世の愛の秘密が隠された王冠の行方
北京観察》中国共産党4中全会開幕 「第15次5カ年計画」と人事刷新 習近平氏の次の一歩は?
中国、GDP成長率が1年ぶり低水準 内需冷え込み、輸出依存の厳しい状況 専門家が警鐘
トランプ政権の「秘密外交」が破綻 米中貿易交渉、感情的対立で出口見えず
7年遅れの改革、アフターピルの長い解禁の道! 日本政府が購入制限を撤廃、親の同意不要、年齢制限も撤廃
日本初の女性首相・高市早苗氏を支える「ファーストジェントルマン」山本拓氏 電撃婚・離婚・再婚を経た「政界ラブストーリー」
ガラスの天井を打ち破った高市早苗氏、日本初の女性首相に 「鉄の女」が直面する経済と外交の試練
天気予報》「雨はいつ止む?」台北・新北で記録的降雨 今週末も北東モンスーンで雨続く見込み 気象局が「この日から晴れ」と発表
台湾民意基金会世論調査》韓国瑜の発言が賴清德を上回る支持率 「中華民国なくして台湾なし」51%が賛同
高市早苗新首相の最大の課題は「戦時統治」の試練 80年の平和を経た日本は備えがあるのか?
台湾民意基金会世論調査》賴清德総統の支持率35%、不支持53% 黄揚明氏「中間層が離反、2028年大統領選は勝算なし」
論評:半導体の山は動くのか 台湾の「護国神山」TSMCが米国移転危機 関税交渉の裏で揺れる産業界
日本初の女性首相×女性財務相誕生 市場は「高市相場」に沸騰、専門家の評価は分かれる
政治ドラマの幕開け 高市早苗新首相、人事の狙いは「封じ込め」か「橋渡し」か?
ヴァンス氏、死神の旅路を免れる? 米海兵隊の砲弾が高速道路上空で爆発、破片が副大統領の護衛車両を直撃
「高輪地区まつり with TAKANAWA GATEWAY 」が10月26日に過去最大規模で開催へ 70ブース・盆踊り・未来体験が一日展開
「牛たんの檸檬」海外初進出!台北に海外1号店オープン 日本の「厚切り牛たん文化」が台湾上陸
「ガラスの天井」を破った高市早苗氏 女権の旗手か、自民党の傀儡か 上野千鶴子が「期待しない」と語る理由
独占》米国、国民党関係者と「鄭麗文現象」をめぐり意見交換を開始 彼女は「国民党の蔡英文」か、それとも「台湾版トランプ」か
「台湾光復節」とは何か 「祖国への復帰」か「占領の始まり」か、揺れる主権の記憶
なぜ「台湾地位未定論」で「台湾光復」ではないのか 台大・張登及教授が語る、戦後東アジア秩序に残った「欠口」
李忠謙コラム:トランプがノーベル平和賞を逃して幸い ガザ停戦は幻想、ゼレンスキー再び屈辱
歴史的瞬間 日本初の女性首相・高市早苗氏が第104代首相に就任 自民・維新連立で新政権発足
一本の電話で政局が動いた 高市早苗×吉村洋文 「自維連立」誕生の舞台裏
舞台裏》高市早苗氏が初の女性首相就任、維新と連立で始動 林佳龍氏と極秘会談も、対台湾は「安倍路線」継承か?
「自公連立」ついに終焉 自民×維新が「閣外協力」で新時代へ 高市政権誕生の舞台裏