ChatGPTのデータが吟遊詩人のトレーニングに使用されたことについて、Googleはそれを否定しています

ChatGPTのデータが吟遊詩人のトレーニングに使用されたことについて、Googleはそれを否定しています

Googleの研究者たちは、競合他社の製品であるBardのトレーニングにChatGPTのデータが使用されていることに批判的であり、その後OpenAIへと移籍しました。Googleはこれらの指摘に対して否定の立場を取っています。

報道によると、Googleは自社の競合製品であるBardをトレーニングする際にChatGPTからの出力データを利用しているとされています。2022年の終わりに、AIエンジニアのジェイコブ・デブリンは、Google内のチャットボットを担当する研究チームがChatGPTの会話履歴を広範囲にわたって使用していることに気づいたと報じられています。デブリンは、当時の雇用主であるGoogleの経営陣にこの発見を報告し、ShareGPTの使用に対して批判的な見解を示しました。その後、AlphabetのCEOであるSundar Pichai、Google Brainの責任者であるJeff Dean、さらにはBardプロジェクトの主要メンバーともこの問題について話し合った結果、デブリンはGoogleを去り、OpenAIへと移籍しました。

ShareGPTは、Googleが使用したとされるチャットデータをホスティングしています

ShareGPTウェブサイトは、ChatGPTの会話のリポジトリとして機能し、記事執筆時点で100,000件を超えるチャットログを保存しています。報告によれば、Googleはデブリン氏の助言を受けて、ChatGPTデータの使用を中止しました。その結果、Googleの従業員たちは、この使用がChatGPTの利用に関するOpenAIのガイドラインに反しているのではないかと懸念していました。デブリン氏は1月に立場を変更し、それ以降はOpenAIでAI研究に携わっていると伝えられています。過去数ヶ月にわたり、OpenAIはGoogleからAI研究者を何人か引き抜いたとされています。当初、GoogleもOpenAIもこの件について公にコメントすることを望んでいませんでしたが、Googleは後に否定声明を発表しました。The Vergeによると、同社はBardを訓練するためにShareGPTやChatGPTのデータを使用したことを否定しています。

Microsoftからの大規模な資金提供を受けたOpenAIがChatGPTをリリースした後、Googleは社内で非常事態を宣言し、さまざまな分野の研究チームを結集させて、自社のAI製品を競争に対抗させ、ChatGPTの市場導入を加速させました。それ以来、The Informationによれば、AIの姉妹部門であるGoogle BrainとDeepMindは、以前は別々に運営されていたものの、共同で取り組む義務が生じました。プロジェクト・ジェミニは「強制的な結婚」と見なされています:Googleの親会社Alphabetは2014年に新興企業DeepMindを買収しましたが、DeepMindは創設者デミス・ハサビス氏の下で、これまでほぼ独立して研究と運営を行ってきました。

Project Gemini: GoogleのAI子会社が協力義務を担う

Project Gemini: GoogleのAI子会社が協力義務を担う

Project Geminiは、最大1兆個のパラメーターを持つ大規模言語モデルの開発に取り組むことを目指しています。一方で、OpenAIはその技術レポートで、使用されているアーキテクチャ、サイズ、トレーニングデータに関する情報を公開していません。このため、研究コミュニティ、競合他社、そして関心を持つ一般の人々は、GPT-4、それに伴いChatGPTについてほぼ何も知らない状態です。

Googleの他のチームも、それぞれ大規模言語モデルの開発を進めています。同社は、Microsoftが自社の製品群全体にOpenAIのAIを導入しているのと同様に、AIアプリケーションを自社製品に統合するプロセスにあります。また、Googleはクラウドサービスを提供しており、ワークスペースにAI機能を実装し始めています。

市場支配力と独占形成: 時間との競争

AI基盤技術における最大の市場シェアを巡る大手ハイテク企業とプラットフォームプロバイダー間の現在の競争は、多くの人々が懸念を抱いて注目しています。EU AI法などの規制対応は遅れており、規制設計によっては実施時に欧州がさらに遅れる可能性があります。全世界的に見ると、小規模プロバイダーは既に市場に進出しており、巨大企業との競争に対抗する手段がほとんどありません。ドイツでは、連邦カルテル庁が3月末に市場支配力の乱用を理由にMicrosoftに対する訴訟を起こしましたが、これはAI分野に直接影響するものではありませんが、製品ポートフォリオ全体にわたるAIアプリケーションの実装が競争の歪みの問題に間違いなく寄与しています。

イーロン・マスク、スティーブ・ウォズニアック、マーク・テグマークなどの著名な技術者や、ゲイリー・マーカスなどの科学者は現在、公開書簡の中で、人類へのリスクが適切に評価されるまで、大規模言語モデルの開発を一時的に停止するよう求めています。DeepMindのマネージングディレクターであるデミス・ハサビスを含むGoogleの高位の研究者も、この要求に同調しています。この書簡は、イーロン・マスクが資金提供する「生命の未来」研究所から出されたもので、現在、AI競争に関する批判者の意見が分かれています。

Googleが競合製品のAI生成トレーニングデータを使用してトレーニング期間を短縮する可能性など、大手プロバイダーでさえも開発の急速なペースに圧倒されているこ

とを示す事例です。インフォメーションの調査記者たちは、報告書の抜粋をツイッターで共有しました。

BLOG

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています
ブログ

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています

サイバーセキュリティの現状は脅威であり、「いつでもエスカレートする可能性がある」とフェーザー内務大臣が警告しています。BSIは、国内のさらに多くのシステムをスキャンしたいと考えています。

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです
ブログ

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです

ChatGPT 検索エンジンにはボーナスなし + ISS ミッションは非公開で開始 + アイオワ対 TikTok + インディゲームのトレーラー + フランス対 Yahoo + 現金支払い限定

AIテキストジェネレーターのChatGPTが魅力的である理由
ブログ

AIテキストジェネレーターのChatGPTが魅力的である理由

変圧器ネットワークについて ChatGPTは、OpenAIが2020年に開発したGPT-3という言語モデルを基にしています。GPT-3は、ほぼ完璧な英語でさまざまなスタイルのテキストを生成する能力を持っています。このニューラルネットワークは、いわゆる事前学習を通じてインターネットからのテラバイト単位のテキストデータを学習しました。これが名前に「P」が含まれる理由です。また、生成するテキストがトレーニングデータ(名前の「G」)とできるだけ近くなるように学習しています。