登陆注册
10430

ChatGPT推出语音和图像多模态功能 预计未来两周内上线

站长网2023-09-26 08:15:330

OpenAI 宣布将在 ChatGPT 中推出新的语音和图像(Voice and image)功能。这些功能可以通过语音对话或展示图片的方式与 ChatGPT 进行交互。

OpenAI举例称,语音和图像功能为您在生活中使用 ChatGPT 提供了更多的方式。您可以在旅行时拍摄地标的照片,并与 ChatGPT 进行有关其有趣之处的实时对话。当您回家时,拍摄您的冰箱和食品储藏室的照片,以确定晚餐的食材,并提出后续问题以获取逐步烹饪指南。晚餐后,您可以通过拍照、圈出问题,并让 ChatGPT 与您和您的孩子分享提示,帮助您解决数学问题。

据悉,若要开始使用语音功能,需要在移动应用程序中进入“设置”然后选择“新功能”,并选择加入语音对话。接着,点击主屏幕右上角的耳机图标,从五种不同的声音中选择您喜欢的声音。而图像理解功能则由多模态GPT-3.5和GPT-4这两个模型提供,它们能够理解和处理各种形式的数据输入,包括文本、语音和图像。

OpenAI表示,语音和图像功能将在未来两周内向 Plus 和 企业 用户推出。语音功能将在 iOS 和 Android 平台上使用,而图像功能将在所有平台上提供。

0000
评论列表
共(0)条