ChatGPT推出语音和图像多模态功能 预计未来两周内上线
站长网2023-09-26 08:15:330阅
OpenAI 宣布将在 ChatGPT 中推出新的语音和图像(Voice and image)功能。这些功能可以通过语音对话或展示图片的方式与 ChatGPT 进行交互。
OpenAI举例称,语音和图像功能为您在生活中使用 ChatGPT 提供了更多的方式。您可以在旅行时拍摄地标的照片,并与 ChatGPT 进行有关其有趣之处的实时对话。当您回家时,拍摄您的冰箱和食品储藏室的照片,以确定晚餐的食材,并提出后续问题以获取逐步烹饪指南。晚餐后,您可以通过拍照、圈出问题,并让 ChatGPT 与您和您的孩子分享提示,帮助您解决数学问题。
据悉,若要开始使用语音功能,需要在移动应用程序中进入“设置”然后选择“新功能”,并选择加入语音对话。接着,点击主屏幕右上角的耳机图标,从五种不同的声音中选择您喜欢的声音。而图像理解功能则由多模态GPT-3.5和GPT-4这两个模型提供,它们能够理解和处理各种形式的数据输入,包括文本、语音和图像。
OpenAI表示,语音和图像功能将在未来两周内向 Plus 和 企业 用户推出。语音功能将在 iOS 和 Android 平台上使用,而图像功能将在所有平台上提供。
0000
评论列表
共(0)条相关推荐
商汤升级发布医疗健康大模型“大医” 支持高质量训练低门槛部署
商汤科技发布了升级版医疗健康大语言模型“大医”,并正式向医疗健康产业链上下游机构客户提供服务。该模型包含13个预设场景,支持个性化功能,高质量训练和低门槛部署。商汤已与多家医疗机构合作,实现“大医”在具体医疗健康场景中的落地。商汤表示,“大医”不仅服务于医院,也希望能覆盖整个医疗健康产业链。商汤还将与营养保健、健康管理等领域的企业、机构合作,为企业服务数智化转型提供强大驱动力。站长网2023-10-16 14:39:410000潞晨科技旗下Colossal-AI开源650亿参数大模型预训练方案
AI创业公司潞晨科技宣布,旗下Colossal-AI首个开源了650亿参数LLaMA低成本预训练方案。据介绍,相比业界其他主流选择,该预训练方案可提升预训练速度38%,仅需32张A100/A800即可使用,并且不限制商业使用。开源地址:https://github.com/hpcaitech/ColossalAI站长网2023-07-20 15:26:490000苹果或将在 2024/25 年推出 Apple Watch X 智能手表
据外媒9to5mac报道,知名爆料者MarkGurman透露苹果正在准备对AppleWatch进行重大重新设计,并称之为AppleWatchX。这款新型智能手表计划于2024年或2025年推出,正好是AppleWatch问世十周年之际。站长网2023-08-14 08:42:160000MindEye2:仅需1小时训练数据即可重建大脑中的图像
在最新的研究中,科学家们开发出了一种名为MindEye2的技术,它能够仅用1小时的功能磁共振成像(fMRI)数据,从大脑活动中重建出观察者所看到的图像。这比传统的需要数十小时的训练数据的类似技术,效率大大提高。站长网2024-03-20 17:58:460000微信小店,支持抢跑视频号分销!
如果你研读过平台发布的《微信小店-商家私域运营指南》文档,会从中见到两个业界超关心的信息,一是小程序如何跳转微信小店,二是怎么用“分享员”这个角色先跑起视频号分销。文档其实并非最新,而是发自今年五月。只是那时,或大家精力尚未聚焦于此,因此讨论不多。直到此次因为微信小店升级,才被业内所留意和关注。在文档中,涉及店铺分享员相关内容。可以包含如下角度:1、一个微信小店可以设置多少分享员。站长网2024-08-31 16:49:370000