OpenAIがChatGPTに口と目を与えました

OpenAIがChatGPTに口と目を与えました

ChatGPTが会話できるようになりました。OpenAIは月曜日に、音声を使った会話や画像を用いた対話が可能なAIチャットボットのアップデートをリリースしました。AmazonのAlexa、AppleのSiri、その他のデジタル音声アシスタントと同じように、ユーザーがChatGPTに話しかけると、ボットが返答します。

OpenAIは月曜日のブログ投稿で新機能を紹介し、「音声機能はクリエイティブでアクセシビリティを重視した多くのアプリケーションへの扉を開く」と述べました。

ChatGPTのベッドタイムストーリー

ChatGPTの新しい音声機能を使うと、外出先での会話が可能になり、「家族の就寝前の話をリクエストしたり、夕食時のディスカッションを仲介する」ことができるとOpenAIはいくつかの使用例を挙げています。

OpenAIによると、ChatGPTの合成音声は、一般的なデジタル音声アシスタントが使用する他の合成音声よりも自然です。5つの異なるオプションから男女の声を選ぶことができます。新しい音声機能は、テキストと数秒の音声サンプルから人間のような音声を生成する新しいテキスト読み上げモデルに基づいています。OpenAIは、プロの声優と協力して声を制作しました。

OpenAIによると、この技術はSpotifyでも音声翻訳機能のテストに使われており、プラットフォームのポッドキャスターが自分の声を使ってコンテンツを様々な言語に翻訳できるようになっています。

冷蔵庫の中の写真を使って料理する

米国の日刊紙ニューヨーク・タイムズによると、他のデジタルアシスタントと同様に、ChatGPTも同音異義語に問題があります。同紙が新しいChatGPTに「gym」のスペルを尋ねたところ、答えは「Y-I-M」でした。しかし、ChatGPTは自己修正が可能で、「いいえ、違う種類のジムです」と質問すると、「ああ、分かりました。トレーニングをする場所はG-Y-Mと綴ります」と正確に返答しました。

将来的には、ChatGPTユーザーはチャットボットとの会話だけでなく、たとえば周囲の物の写真を撮ったり、グリルのトラブルシューティングを依頼することもできます。写真、表、またはチャートを指定すれば、ChatGPTは画像の詳細な説明を提供し、その内容に関する質問に答えます。例えば、ユーザーが冷蔵庫内の写真をアップロードすると、チャットボットが手持ちの食材で作れる料理のリストを提案することがあります。

ChatGPTはチャットボットと音声アシスタントの機能を組み合わせています

ChatGPTはチャットボットと音声アシスタントの機能を組み合わせています

Microsoftの子会社であるOpenAIのChatGPTの成功により、AIに関する大きな話題が生まれました。急速に進化

するAI技術により、膨大なデータの処理と合成が可能になり、文書の要約、コンピューターコードの記述、理解可能な音声や写真、ビデオの生成が可能になりました。ますます多くの企業がAIの使用に依存し、独自の生成AIベースのアプリケーションを市場に投入しています。

ChatGPTの新バージョンにより、OpenAIはGoogle Bardなどの競合するチャットボットだけでなく、AlexaやSiriなどのテクノロジーとも競合します。AmazonとAppleの音声アシスタントは、音声を介してスマートフォン、ラップトップ、その他のデバイスとの対話を長年提供してきました。しかし、ChatGPTやGoogle Bardなどのチャットボットは、より強力な音声機能を備えており、即座に電子メール、詩、レポートを作成し、提起されたほぼすべてのトピックについて意見を表明できます。ChatGPTのアップデートにより、OpenAIはこれら2つの通信手段を一つに組み合わせました。

OpenAIによると、ChatGPTの新しい音声および画像機能は、今後2週間以内にPlusおよびEnterprise料金プランの加入者に対して有効化される予定です。他のユーザーグループも後に続く予定です。ただし、音声機能は当初iOS、つまりiPhoneとiPad、および音声機能を備えたAndroidデバイスでのみ利用可能です。一方、画像機能は全てのプラットフォームで利用可能です。

このページを評価する

BLOG

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています
ブログ

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています

サイバーセキュリティの現状は脅威であり、「いつでもエスカレートする可能性がある」とフェーザー内務大臣が警告しています。BSIは、国内のさらに多くのシステムをスキャンしたいと考えています。

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです
ブログ

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです

ChatGPT 検索エンジンにはボーナスなし + ISS ミッションは非公開で開始 + アイオワ対 TikTok + インディゲームのトレーラー + フランス対 Yahoo + 現金支払い限定

AIテキストジェネレーターのChatGPTが魅力的である理由
ブログ

AIテキストジェネレーターのChatGPTが魅力的である理由

変圧器ネットワークについて ChatGPTは、OpenAIが2020年に開発したGPT-3という言語モデルを基にしています。GPT-3は、ほぼ完璧な英語でさまざまなスタイルのテキストを生成する能力を持っています。このニューラルネットワークは、いわゆる事前学習を通じてインターネットからのテラバイト単位のテキストデータを学習しました。これが名前に「P」が含まれる理由です。また、生成するテキストがトレーニングデータ(名前の「G」)とできるだけ近くなるように学習しています。