試してみました:ChatGPTがあなたに話しかけたとき

試してみました:ChatGPTがあなたに話しかけたとき

これは未来ですか?少なくとも、OpenAIのChatGPTアプリの新しい音声出力機能は非常に未来的で、主人公が音声アシスタントに恋をするSF映画「Her」を彷彿とさせます。

Siri、Alexa、Googleアシスタントなどの以前の音声支援システムよりもはるかに高品質で、チャットボットと直接音声で対話することが初めて可能になりました。ChatGPTアプリでは以前から音声入力が可能でしたが、現在は必要に応じて5つの声の中から1つで返答します。これはiOSとAndroidで利用可能です。写真の分析機能もブラウザで使用できます。

新しいiPhoneの機能を試す機会がありました。今後数週間のうちに、ChatGPT+サブスクリプション(以前と同じ月額20ユーロ)を契約している全ての有料ユーザーが段階的にアクセスできるようになります。

この機能は今後数週間以内に全ての有料顧客に提供される予定です。

音声出力を有効にするには、最初にChatGPTアプリの設定に移動する必要があります。機能を活性化している場合、「新機能」がそこにリストされます。最初はメニュー項目が見えなくて困りましたが、VPNを使ってアメリカのIPアドレスを使用すると、音声出力を有効にするオプションが表示されました。その後、ドイツのIPでこの機能を利用できるようになったので、VPNをオフにしました。

大きな言語モデルとの対話に入るには、チャットに新しく追加された右上のヘッドフォンアイコンをクリックします。非常にユニークでミニマルなUIが表示されます。システムがOpenAIサーバーに接続すると、黒背景にアニメーション化された圧縮円が表示されます。現在、これには数秒かかるため、即座には行われません。円が表示されたら、システムは音声入力の準備が整っています。システムが受信レベルを示す4つの小さな円をリッスンしていることがわかります。ChatGPTは入力の終了を検出し、「考えている」間、アニメーションの吹き出しを表示します。これにも数秒かかり、場合によってはもう少し時間がかかります。最後に、出力は音声になります。また、テキストチャットビューに切り替えると、出力をテキスト形式で利用することもできます。

ChatGPTに注目

ドイツ語でも利用可能です。

ChatGPTアプリはデフォルトでアメリカ英語を話しますが、外国語も話すことができます。たとえば、驚くほど上手なドイツ語だけでなく、フランス語、ポーランド語、日本語、スペイン語も使用できます。選んだ声にもよりますが、若干のアメリカなまりがあります。音声出力が機械的またはロボット的に聞こえることはほとんどありません。出力テキストに

実際には、話して音声出力を停止させることはできませんのでご注意ください。そのため、単に出力に話しかけるだけではChatGPTを止めることはできません。代わりに、黒い領域をタップする必要があります。赤と白の「X」をクリックすると、テキストチャットモードに戻ります。iOSでは、ナレーターモードが終了していないときにアプリがバックグラウンドで実行されることがあり、これは少し不気味な場合があります。「さようなら、お気をつけて。何かご質問がありましたら、お知らせください。」ChatGPTは、すでに完全に別のアプリケーションを使用しているときに話しかけました。

ChatGPTに注目

音声出力以上にエキサイティングだと感じるかもしれないもう一つの新機能は、ChatGPTに画像を提示して分析させたりアドバイスをもらう機能です。iPhoneでは3つのオプションがあります。カメラを直接活用して写真を撮るか、写真ライブラリやファイルブラウザにアクセスします。現在のiOSデバイスでは、写真ライブラリはプライベートモードで活用されています。つまり、すべての写真を見ることができますが、ChatGPTアプリは選択した写真にのみアクセスできます。必要に応じて、ユーザーは特に関心のある画像内の領域にマークを付けることができます。画像がアップロードされると、ChatGPTはすぐにテキストの説明を返します。音声出力で応答を得たい場合は、もう一度ヘッドフォンボタンを押す必要があります。

私たちは、ベルリンのアーティストのスタジオからのドアベルをシステムに提示しました。その後、ChatGPTは何が見えるかを説明し、リストされた名前を「興味深い」とコメントしました。壁に組み込まれたベルボードについても説明されました。リストされているアーティストの一人についてさらに詳細を知ることもできました。画像のアップロードと分析はChatGPTのWeb版でも可能ですが、OpenAIはブラウザで音声出力が利用できるかどうかはまだ明らかにしていません。

このページを評価する

BLOG

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています
ブログ

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています

サイバーセキュリティの現状は脅威であり、「いつでもエスカレートする可能性がある」とフェーザー内務大臣が警告しています。BSIは、国内のさらに多くのシステムをスキャンしたいと考えています。

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです
ブログ

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです

ChatGPT 検索エンジンにはボーナスなし + ISS ミッションは非公開で開始 + アイオワ対 TikTok + インディゲームのトレーラー + フランス対 Yahoo + 現金支払い限定

AIテキストジェネレーターのChatGPTが魅力的である理由
ブログ

AIテキストジェネレーターのChatGPTが魅力的である理由

変圧器ネットワークについて ChatGPTは、OpenAIが2020年に開発したGPT-3という言語モデルを基にしています。GPT-3は、ほぼ完璧な英語でさまざまなスタイルのテキストを生成する能力を持っています。このニューラルネットワークは、いわゆる事前学習を通じてインターネットからのテラバイト単位のテキストデータを学習しました。これが名前に「P」が含まれる理由です。また、生成するテキストがトレーニングデータ(名前の「G」)とできるだけ近くなるように学習しています。