PR

ChatGPT 音声機能が大幅進化 ~別モード不要~

thumbnail_chatgpt_1920 OpenAI

要旨

OpenAI が 2025 年 11 月 25 日に ChatGPT の音声インターフェースの大規模なアップデートを発表しました。これまで音声会話を利用する際には、専用の画面に切り替える必要がありましたが、今回のアップデートにより、通常のチャット画面のまま音声機能を使えるようになりました。音声で話しながら、画像や地図などの視覚的な情報を同時に確認できる、より柔軟で使いやすい体験が実現しています。このアップデートは、モバイルアプリとウェブ版の両方で、無料ユーザーを含むすべてのユーザーに順次展開されています。

従来の音声モードの課題

これまでの ChatGPT 音声モードでは、音声会話を始めるとアニメーション化された青い球体が表示される専用画面に切り替わっていました。この画面では音声のやり取りに集中できる反面、いくつかの不便な点がありました。

最も大きな問題は、音声で聞いた内容を画面上で確認できないことでした。ChatGPT が話した内容を聞き逃してしまった場合、音声モードから一度抜けて、通常のテキストベースの画面に戻らなければ、会話の内容を確認できませんでした。また、画像や地図といった視覚的な情報も、音声モード中には表示されませんでした。

多くのユーザーから、より柔軟な音声体験を求める声が寄せられていたことを受けて、OpenAI は今回の大幅な改良を実施しました。

新しい統合インターフェースの特徴

アップデート後の音声機能では、チャット画面から離れることなく音声会話ができるようになりました。音声で話しかけると、ChatGPT の回答がリアルタイムでテキストとしても画面に表示されます。これにより、聞きながら同時に文字で内容を確認することが可能です。

画像検索の結果、グラフ、地図カードといった視覚的なコンテンツも、音声会話と並行してリアルタイムで表示されます。たとえば、人気のパン屋について尋ねると、ChatGPT が音声で説明しながら、同時に地図上にお店の場所を表示したり、パンの写真を画面に映し出したりできます。

会話を中断せずに、これまでのメッセージ履歴を遡って確認することも可能になりました。また、声を出せない状況では、テキストで入力しても音声で回答を受け取ることができます。さらに、写真を共有しながら音声で話し合うこともできるようになっています。

実際の利用シーンでの活用

この新しい機能は、日常生活のさまざまな場面で役立ちます。たとえば、外国語を学習している際に、単語のスペルを画面で確認しながら発音練習ができます。料理をしながら両手がふさがっている状態でも、レシピの分量を画面で参照しながら音声で次の手順を尋ねることができます。

プログラミングのコードサンプルやデータのグラフについて音声で質問しながら、実際のコードやグラフを画面で視覚的に確認することも可能です。このように、音声によるコミュニケーションと視覚的な確認を同時に行えることで、より効率的で分かりやすいやり取りが実現します。

設定と利用方法

この新しい統合された音声体験は、モバイルアプリをアップデートすることで利用できるようになります。チャット画面に音声アイコンが表示されているか確認してください。

従来の独立した音声モードを好むユーザーのために、設定から元の体験に戻すことも可能です。設定メニューの「音声モード」項目で「セパレートモード」をオンにすることで、以前の青い球体が表示される専用画面での音声会話に切り替えられます。

OpenAI は今後も、より統合され没入感のある音声インタラクションを実現するために、ユーザーからのフィードバックに耳を傾けながら、この機能をさらに改良していく予定です。

おわりに

ChatGPT の音声機能が、モード切り替え不要の統合インターフェースへと進化したことで、音声とテキスト、視覚情報をシームレスに組み合わせた、より自然で便利な対話体験が可能になりました。日常生活のさまざまな場面で、状況に応じた柔軟な使い方ができるこのアップデートは、AI アシスタントの利便性を大きく向上させるものといえます。すべてのユーザーが無料で利用できる点も、多くの人に新しい体験を届けるうえで重要なポイントです。

※ ここに掲載されている情報は、発表日現在の情報です。最新の情報と異なる場合がございますので、あらかじめご了承ください。

出典: OpenAI

コメント