情報あれこれ

主に海外保守系の記事を翻訳、更に登録している180以上の動画から、他メルマガからの抜粋ネタも掲載しています。

Google、AI用にネット上の投稿をすべてスクレイピングすると発表


By Thomas Germain



グーグルは週末にプライバシー・ポリシーを更新し、AIツールを構築するためにあなたがオンラインに投稿したあらゆるものをスクレイピングする権利を留保すると明言した。もしグーグルがあなたの言葉を読み取ることができるのなら、それはもうグーグルのものであり、チャットボットの地下のどこかに眠っているものと思ってください。

【参照】https://www.octoparse.jp/blog/what-is-scraping


「グーグルは、サービスを向上させ、ユーザーと公衆に利益をもたらす新しい製品、機能、技術を開発するために情報を使用します」とグーグルの新しいポリシーは述べている。「例えば、GoogleのAIモデルを訓練し、Google翻訳、Bard、クラウドAI機能などの製品や機能を構築するために、一般に公開されている情報を使用します。


歴史ファンにとって幸いなことに、グーグルは利用規約の変更履歴を保持している。新しい文言は既存のポリシーを修正し、あなたのオンライン上のつぶやきがテックジャイアントのAIツールの作業に使用されるかもしれない新しい方法を明記している。


これまでグーグルは、データは「AIモデル」ではなく「言語モデルのために」使用されると述べており、旧ポリシーではグーグル翻訳について言及されていただけだったが、現在はBardとCloud AIが登場している。


これはプライバシーポリシーとしては珍しい条項だ。通常、このようなポリシーは、ユーザーが自社のサービスに投稿した情報を企業が利用する方法について説明している。ここでは、グーグルは公共のウェブのあらゆる場所に投稿されたデータを収集し、利用する権利を留保しているようで、まるでインターネット全体が同社独自のAIの遊び場であるかのようだ。グーグルはコメントを求めたが、すぐに回答は得られなかった。


この慣行は、プライバシーに関する新たな興味深い問題を提起している。人々は一般的に、公開された投稿は公開されるものだと理解している。しかし今日、ネット上に何かを書き込むとはどういうことなのか、新しいメンタルモデルが必要だ。もはや誰がその情報を見ることができるかという問題ではなく、それがどのように利用される可能性があるかという問題なのだ。BardとChatGPTは、あなたの長い間忘れられていたブログ記事や15年前のレストランレビューを摂取した可能性が高い。あなたがこれを読んでいるとき、チャットボットは、予測も理解も不可能な方法で、あなたの言葉のヒューモンクロイド版を再送しているかもしれない。


ChatGPT後の世界におけるあまり目立たない複雑さのひとつは、データを欲しがるチャットボットがどこから情報を得たのかという問題だ。グーグルやオープンAIを含む企業は、ロボットの習慣を促進するためにインターネットの膨大な部分をスクレイピングした。数年前にはSFのように思えた著作権問題が、今後数年のうちに法廷で争われることになるだろう。その一方で、この現象はすでに予想外の形で消費者に影響を及ぼしている。


TwitterとRedditの支配者たちは、AIの問題を特に憂慮しており、自分たちのプラットフォームを封鎖するために物議を醸すような変更を行った。両社はAPIへの無料アクセスを停止し、投稿を大量にダウンロードできるようにした。表向きは、ソーシャルメディアサイトの知的財産を他社に盗まれないようにするためだが、これは別の結果をもたらした。


TwitterとRedditのAPI変更は、多くの人々がこれらのサイトにアクセスするために使用していたサードパーティ製ツールを壊した。一時は、ツイッター社が気象、交通、緊急サービスなどの公共団体に、ツイートしたければ金を払えと強制するのではないかとさえ思われたが、批判の嵐を受けて同社は撤回した。


最近では、ウェブスクレイピングがイーロン・マスクのお気に入りのブギーマンになっている。マスクは、最近のツイッターの災難の数々を、たとえ無関係に見える問題であっても、自分のサイトから他者がデータを抜き取るのを阻止する必要があるからだと非難した。週末、ツイッター社はユーザーが1日に閲覧できるツイートの数を制限し、サービスをほとんど利用できなくした。マスク氏は、これは "データスクレイピング "と "システム操作 "に対する必要な対応だと述べた。しかし、ほとんどのIT専門家は、この速度制限は、管理不行き届き、無能、またはその両方から生まれた技術的問題への危機対応である可能性が高いという意見で一致した。Twitterはこの件に関する米Gizmodoの質問に回答していない。