情報あれこれ

主に海外保守系の記事を翻訳、更に登録している180以上の動画から、他メルマガからの抜粋ネタも掲載しています。

AIはすでに嘘と欺瞞の達人になっている、と科学者たちは警告する


2024年5月16日、ミシェル・スター



人工知能(AI)チャットボットが言うことはすべて大目に見るべきだということは、おそらくあなたも知っているだろう。


しかし、さらに慎重になる理由があるかもしれない。多くのAIシステムが、人間のユーザーに意図的に偽の情報を提示する能力をすでに開発していることが、新たな研究で判明した。これらの狡猾なボットは、人を欺く術をマスターしているのだ。


マサチューセッツ工科大学(MIT)の数学者であり認知科学者であるピーター・パークは、「AI開発者は、欺瞞のような望ましくないAIの行動の原因について確信を持って理解しているわけではありません」と言う。


「しかし、一般的に言えば、AIの欺瞞は、欺瞞に基づく戦略が、与えられたAIの訓練タスクで良い結果を出すための最良の方法であることが判明したために生じると考えられる。欺瞞は、AIが目標を達成するのを助けるのです」。


AIシステムが特に巧妙な虚偽を証明しつつある分野のひとつが、ゲームである。研究者たちの研究には3つの顕著な例がある。ひとつはメタ社のCICEROで、プレイヤーが交渉を通じて世界征服を目指すボードゲーム「ディプロマシー」をプレイするように設計されている。メタ社は、このボットが役に立ち、正直であることを意図していたが、実際は正反対だった。



メタの努力にもかかわらず、CICEROは嘘の達人であることが判明した。他のプレイヤーを裏切るだけでなく、事前に人間のプレイヤーと偽の同盟関係を築き、そのプレイヤーを騙して攻撃されないようにする計画も立てていた。


このAIは、複数のゲームをプレイした人間プレイヤーの上位10パーセントに入るほど、悪いことが得意であることが証明された。なんだ。嫌なやつだ。


しかし、犯罪者はそれだけではない。ディープマインドの「AlphaStar」は、「StarCraft II」をプレイするために設計されたAIシステムだが、このゲームの「戦争の霧」のメカニズムをフルに活用してフェイントをかけ、人間のプレイヤーに一方に進んでいると思わせておいて、本当はもう一方に進んでいた。また、ポーカーをプレイするために設計されたMeta社のPluribusは、人間のプレイヤーをブラフでフォールディングさせることに成功した。