AIチャットボットのテキストを透かし表示する方法

ChatGPTチャットボットのテキストを透かし表示する方法

ChatGPTのようなAIツールは日々進化しており、教員が盗作を見つけることがより難しくなっています。この問題に対処するために、透かし技術が有効であるとされています。

人間には認識不可能ながら、AIによって生成されたテキストに意図的に施される隠れたパターンは、将来的に自作のコンテンツとコンピュータによるコンテンツを区別するのに役立つかもしれません。コンピュータ科学者たちは、この技術によって、アルゴリズム生成テキストと人間によるテキストを再び区別できるようになることを期待しています。

これらの透かしは人間の目には見えませんが、他のコンピューターはテキストがAIシステムから発信された可能性が高いことを認識できます。将来的にこれらが大規模な言語モデルに組み込まれれば、既に発生している深刻な問題を避けるのに役立つでしょう。

ChatGPTが市場を広げる中での動向

OpenAIによるChatGPTチャットボットが市場に導入されたのは11月のことで、そのテキストの質の高さが注目されて以来、学生たちはエッセイや期末レポートの作成に積極的にこのシステムを利用しています。その一方で、CNETなどのITニュースウェブサイトでは、このテキストジェネレーターを使用して記事を作成しており、時にその情報が不正確であったり、誤記が含まれていたりすることが指摘されています。

このような問題を解決する一つの方法として、AIシステムにウォーターマークを出力する機能を統合することが考えられます。これにより、誰もがテキストの出所を確認できるようになります。この技術は、AIによって生成されたコンテンツを確実に識別するために、既に大学の研究で使用されています。例えば、メリーランド大学の研究者は、Metaが公開したOPT-6.7B言語モデルの改良版で生成されたテキストを識別できる認識アルゴリズムを開発しました。このグループは2月中旬にこの技術に関するコードを公開する予定で、現在はピアレビューのプロセスを経ています。

AI言語モデルは、一つ一つの単語を予測しながらテキストを生成します。その過程で、メリーランドの研究者が開発した透かしアルゴリズムは、言語モデルの語彙を「グリーンリスト」と「レッドリスト」にランダムに分類し、モデルがグリーンリストの単語を選択するように指示しています。

ChatGPTが市場を広げる中での動向

赤と緑のリストについて

透かしアルゴリズムによって認識されているグリーンリストに含まれる単語がテキスト内に多く存在するほど、そのテキストが機械によって生成された可能性が高まります。一方、人間によって書かれたテキストには通常、かなりランダムな単語が含まれています。例えば、「美しい」という単語範囲において、透かしアルゴリズムは「花」を緑リストに、「蘭」を赤リストに分類することがあります。この場合、透かしアルゴリズムを搭載したAIモデルは「蘭」ではなく「花」を使用することになります。このことについて、メリーランド大学の助教授であるトム・ゴールドスタイン氏は解説しています。

このようなシステムは、ChatGPTのような新しいタイプの大規模言語モデルが人間のように流れるようなテキストを生成できるため、切実に必要です。また、これらのAIモデルは非常に確信を持って情報を提供しますが、その情報が必ずしも正確であるとは限らず、内容が歪められる可能性があります。一般の人々にとっては、ChatGPTやその他の高度なモデルによって生成されたテキストと人間によるテキストを区別することはほぼ不可能です。

そして、AIの開発速度が非常に速いため、新しいモデルが既存のテキスト認識ツールを迅速に陳腐化させることがあります。このため、AI開発者とセキュリティ専門家は、最新世代のAIモデルに対応するために絶えず競争しています。

AIの荒野で

「今はまさに西部開拓時代のようだ」と透かし技術に関わるメリーランド大学の研究者、ジョン・キルヒェンバウアー氏は述べています。彼は、このようなツールがAI検出の取り組みを有利に進めるスタートとなることを期待しています。彼のチームが開発したシステムは、トランスフォーマーモデル、すなわち次の単語を予測するAI言語モデルで動作するように設計されています。

これまでの結果は有望で、Hugging Faceの政策ディレクターであるアイリーン・ソライマン氏も「適切なタイミングで成果が得られた」と話しています。彼女は以前OpenAIでAI研究者として働いており、このようなシステムの研究に携わっていました。「モデルが広く使用されるようになるにつれて、AIコミュニティ外のコンピューターサイエンス未経験者も、このような認識システムにアクセスする必要が出てくるでしょう」と述べています。

ただし、このアプローチには限界があります。透かし入りシステムは、開発初期段階で大規模な言語モデルに組み込まれた場合にのみ機能するのです。OpenAIは既にAIが生成したテキストを識別する方法を開発し、一部を公開していますが、多くはまだ秘匿されています。同社は、ChatGPTの動作やトレーニング方法について外部に多くを明かすことはありません。外部の関係者がシステムを操作することは許されていないのが現状です。OpenAIはこの記事に関する問い合わせには即座には応じていません。

ウォーターマークが提供するセキュリティの程度は?

また、新しい透かし技術をMeta以外のモデル、例えばChatGPTにどのように適用可能かについては不明であるとソライマン氏は指摘します。これまでにテストされたAIモデルは、ChatGPTの基になるGPT-3よりも小規模です。

透かし技術を無効にすることが可能かどうかを判断するためには、さらに実験が必要です。研究者たちは現時点で、攻撃者には限られた選択肢があると想定しています。「透かしを削除するためには、テキストの一部の単語の約半分を変更する必要がある」とゴールドスタイン氏は述べています。

『Hugging Face』の専門家は彼の意見に完全には同意していません。「高校生を過小評価するのは危険だと思うので、そのようなことはしません」とソライマン氏は言います。「しかし、一般的に、普通の人がこの種の透かしを操作することは難しいでしょう。

このページを評価する

BLOG

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています
ブログ

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています

サイバーセキュリティの現状は脅威であり、「いつでもエスカレートする可能性がある」とフェーザー内務大臣が警告しています。BSIは、国内のさらに多くのシステムをスキャンしたいと考えています。

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです
ブログ

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです

ChatGPT 検索エンジンにはボーナスなし + ISS ミッションは非公開で開始 + アイオワ対 TikTok + インディゲームのトレーラー + フランス対 Yahoo + 現金支払い限定

AIテキストジェネレーターのChatGPTが魅力的である理由
ブログ

AIテキストジェネレーターのChatGPTが魅力的である理由

変圧器ネットワークについて ChatGPTは、OpenAIが2020年に開発したGPT-3という言語モデルを基にしています。GPT-3は、ほぼ完璧な英語でさまざまなスタイルのテキストを生成する能力を持っています。このニューラルネットワークは、いわゆる事前学習を通じてインターネットからのテラバイト単位のテキストデータを学習しました。これが名前に「P」が含まれる理由です。また、生成するテキストがトレーニングデータ(名前の「G」)とできるだけ近くなるように学習しています。