OpenAIがChatGPTに口と目を付与した

OpenAIがChatGPTに口と目を付与した

OpenAIのChatGPTチャットボットの新バージョンには、音声と画像の機能が加わりました。写真を用いて会話を楽しんだり、問題を解決することが可能になります。

ChatGPTが会話するようになりました。OpenAIはこの月曜日に、音声を通じた会話や画像を用いた対話ができるAIチャットボットの更新版をリリースしました。AmazonのAlexaやAppleのSiri、その他のデジタル音声アシスタントと同様に、ユーザーがChatGPTに話しかけると、ボットが返答します。

OpenAIは月曜日のブログ投稿で、新機能を紹介し、「音声機能はクリエイティブな用途やアクセシビリティを向上させる多くのアプリケーションへの扉を開く」と記載しました。

ChatGPTのベッドタイムストーリー

ChatGPTの新しい音声機能を使用すれば、外出先でも会話が可能となり、「家族の就寝前の物語をリクエストしたり、夕食時の議論をファシリテートする」ことができるとOpenAIは述べています。

OpenAIによると、ChatGPTの合成音声は、一般的なデジタル音声アシスタントで使用されている他の合成音声よりも自然です。男性および女性の声を含む5つの異なるオプションから選択できます。この新しい音声機能は、テキストと数秒の音声サンプルから人間のような音声を生成できる新しいテキスト読み上げモデルに基づいています。OpenAIは、プロの声優と協力して声を作成したと述べています。

OpenAIによれば、その背後にある技術はSpotifyでも音声翻訳機能の試験運用に使用されており、プラットフォーム上のポッドキャスターが自分の声を使ってコンテンツをさまざまな言語に翻訳できるようになっています。

冷蔵庫の中の写真を利用して料理をする

冷蔵庫の中の写真を利用して料理をする

米国の日刊紙ニューヨーク・タイムズによると、他のデジタルアシスタント同様、ChatGPTも同音異義語に関する問題を抱えているという。この新聞は新しいChatGPTに「gym」という単語の綴りを尋ねたところ、「Y-I-M」と回答された。しかし、ChatGPTのようなチャットボットの利点のひとつは、自身で修正が可能であることだと指摘されている。「違うタイプのジムです」と質問すると、ボットは「ああ、分かりました。人々がトレーニングをする場所はG-Y-Mと綴ります」と回答した。

将来的には、ChatGPTユーザーはチャットボットとの会話だけでなく、たとえば周囲の物の写真を撮ったり、グリルが起動しないなどのトラブルシューティングをチャットボットに依頼することができるようになります。写真、表、またはグラフを指定した場合、ChatGPTは画像の詳細な説明を提供し、その内容に関する質問に答えることができます。例えば、ユーザーが冷蔵庫内の写真をアップロードすると、チャットボットは手持ちの食材で作れる料理のリストを提案することもあります。

ChatGPTはチャットボットと音声アシスタントの組み合わせ

Microsoftの子会社であるOpenAIのChatGPTの成功により、AIに関する誇大宣伝が巻き起こっています。急速に進歩するAIテクノロジーは、大量のデータを処理及び合成することにより、文書を要約し、コンピューターコードを記述し、理解可能な音声やさらには写真やビデオを生成する能力を持っています。ますます多くの企業がAIの利用に依存し、独自の生成AIベースのアプリケーションを市場に投入しようとしています。

ChatGPTの新バージョンでは、OpenAIは移行しています
Google Bardなどのチャットボットと競合する一方で、AlexaやSiriなどのテクノロジーとも競合しています。AmazonとAppleの音声アシスタントは長らく、スマートフォン、ラップトップ、その他のデバイスとの音声を通じた対話の方法を提供してきました。しかし、ChatGPTやGoogle Bardなどのチャットボットは、より強力な音声機能を備えており、電子メール、詩、定期レポートを即座に作成し、投げかけられたほぼすべてのトピックに対する意見を表現することができます。ChatGPTアップデートにより、OpenAIはこれら2つの通信手段をある方法で組み合わせました。

OpenAIによると、ChatGPTの新しい音声および画像機能は、今後2週間以内にPlusおよびEnterpriseプランの加入者に対して有効化される予定です。その後、他のユーザーグループも追随することになります。ただし、音声

機能は当初iOS、つまりiPhoneとiPad、及び音声機能を備えたAndroidデバイスでのみ利用可能です。一方、画像機能は全プラットフォームで使用可能です。

このページを評価する

BLOG

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています
ブログ

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています

サイバーセキュリティの現状は脅威であり、「いつでもエスカレートする可能性がある」とフェーザー内務大臣が警告しています。BSIは、国内のさらに多くのシステムをスキャンしたいと考えています。

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです
ブログ

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです

ChatGPT 検索エンジンにはボーナスなし + ISS ミッションは非公開で開始 + アイオワ対 TikTok + インディゲームのトレーラー + フランス対 Yahoo + 現金支払い限定

AIテキストジェネレーターのChatGPTが魅力的である理由
ブログ

AIテキストジェネレーターのChatGPTが魅力的である理由

変圧器ネットワークについて ChatGPTは、OpenAIが2020年に開発したGPT-3という言語モデルを基にしています。GPT-3は、ほぼ完璧な英語でさまざまなスタイルのテキストを生成する能力を持っています。このニューラルネットワークは、いわゆる事前学習を通じてインターネットからのテラバイト単位のテキストデータを学習しました。これが名前に「P」が含まれる理由です。また、生成するテキストがトレーニングデータ(名前の「G」)とできるだけ近くなるように学習しています。