Grok AI、iOSアプリで視覚・音声機能を追加


xAIは、同社のチャットボットGrokに新しい「Voice Mode(音声モード)」を導入し、「Grok Vision」と呼ばれる機能を発表しました。この機能により、ユーザーはスマートフォンのカメラを通して世界と対話できるようになります。ChatGPTやGoogle Geminiと同様に、Grokは現在、スマートフォンが捉えた映像を解釈し、リアルタイムで応答することが可能になりました。

Grok Visionを使用すると、iPhoneユーザーはカメラを物体に向けて「これは何ですか?」と尋ねることができ、チャットボットは状況を認識した音声回答を提供します。この機能は現在GrokのiOSアプリで利用可能ですが、Androidユーザーはアクセスまでもう少し待つ必要があります。

視覚認識機能に加えて、Voice Modeは多言語音声もサポートするようになり、ユーザーは複数の言語でGrokと会話できるようになりました。また、リアルタイム検索も統合されており、チャットボットは最新情報を反映した即時回答を提供できます。

これらの機能強化は、先週リリースされたGrokの新しいメモリ機能に続くものです。このメモリ機能により、チャットボットはユーザーの好みや以前に尋ねた質問など、過去のやり取りを記憶し、よりパーソナライズされた回答や提案を提供できるようになりました。

Grok Visionの導入:多言語音声とリアルタイム検索を搭載した音声モードが現在利用可能

xAIはまた最近、ChatGPTのCanvasに似た文書やコードを生成するためのワークスペースとして、Studioの最初のバージョンをリリースしました。Studioは別のウィンドウで開き、ユーザーにコンテンツ作成のためのより集中した環境を提供するよう設計されています。

GrokはApp Storeから無料でダウンロード可能です。

Source: Macrumors