OpenAI发布最新旗舰大模型GPT-4o：免费试用价格五折速度提高一倍

站长网2024-05-14 08:38:540阅

GPT-4o具体特性一览:

GPT-4o模型发布:OpenAI发布了GPT-4o模型，其中"o"代表Omni，意为全能。该模型能够接受文本、音频和图像的任意组合作为输入，并生成相应的文本、音频和图像输出。

免费开放:GPT-4o的所有能力将免费向所有用户开放，但新语音模式会在未来几周内优先对ChatGPT Plus会员开放。

API开放:GPT-4o向开发者开放了API，与GPT-4Turbo相比，价格减半，速度提升2倍，速率限制高出5倍。

核心能力:GPT-4o展示了以下核心能力:

零延迟实时语音交互:能够进行自然、真实、富有情感的语音交互。

视觉传达内容:通过摄像头视觉传达内容，解决数学题和解析图形报表。

编程助手:提供实时编程辅助，提高编程效率。

视频通话情绪分析:能够实时分析面部情绪。

同声传译:支持多国语言的同声传译。

性能提升:GPT-4o在文本、推理和编码智能方面达到了GPT-4Turbo级别的性能，并在多语言、音频和视觉能力上设定了新的标准。

站长之家（ChinaZ.com）5月14日消息:今日凌晨，OpenAI发布了最新旗舰大模型GPT-4o。这款全能AI不仅免费可用，而且具备横跨听图片、看图片、说图片的多项能力，为用户带来如视频电话般丝滑流畅的交流体验。

OpenAI表示，GPT-4o不仅在功能上有所突破，更令人惊喜的是，它将向所有用户免费开放，包括之前仅为ChatGPT Plus会员提供的功能。此外，GPT-4o的新语音模式将在接下来的几周内首先对会员用户开放试用。

据悉，GPT-4o（“o”代表“omni”）凭借其Omni(全能)之名，展现了其惊人的实力。无论是文本、音频还是图像，GPT-4o都能轻松处理，并生成相应的输出。更为令人震撼的是，它能在极短的时间内对音频输入做出反应，其速度之快几乎与人类对话中的反应一致。

首先，GPT-4o实现了零延迟的实时语音交互，其表现自然、真实，充满情感。在演示中，当演示者表现出紧张情绪时，GPT-4o能够迅速识别并给予安慰和指导。此外，GPT-4o还能够根据要求调整语气和音调，甚至在被要求时，能够以机器人的声音或唱歌的形式来讲述故事。

与之前的模型相比，GPT-3.5和GPT-4在语音模式下的平均延迟时间分别为2.8秒和5.4秒，这无疑会影响对话的流畅性。而GPT-4o则无需先将语音转录为文本，因此能够更直接地理解和响应语音中的语气、音调等信息。

除了语音交互，GPT-4o还能通过视觉和语音的结合进行多模态交互。例如，在发布会上，OpenAI展示了GPT-4o如何通过摄像头视觉解析图形报表，帮助用户解决数学问题。

在编程辅助方面，GPT-4o的实时交互能力也得到了显著提升。它能够实时检查代码，解释代码的功能，并指导用户如何调整代码以获得期望的结果。

此外，GPT-4o还能够进行视频通话，并实时分析面部情绪。在演示中，GPT-4o能够准确地识别并响应演示者的情绪状态。

在语言能力方面，GPT-4o支持超过50种语言，并在质量和速度上都有所提升。在官方演示中，GPT-4o成功实现了英语和西班牙语之间的实时同声传译。

尽管GPT-4o在人机交互方面取得了革命性的进步，但它并不是GPT-5。OpenAI的首席技术官Mira Murati在直播中提到，GPT-4o是GPT-4模型的一个迭代版本，它在文本、语音和视觉方面的能力都有所提升。

OpenAI的首席执行官Sam Altman也表示，GPT-4o是一个"原生多模态"模型，它在文本、视觉和音频方面进行了端到端的训练，所有输入和输出都由同一个神经网络处理。

GPT-4o的强大不仅体现在其全面的能力上，更在于其高效的API服务。为了让更多用户能够轻松使用GPT-4o，OpenAI提供了价格打五折、速度提高一倍、单位时间调用次数增加五倍的API服务。这无疑将极大推动GPT-4o在各行各业的应用和发展。

最后，OpenAI 还宣布将推出 ChatGPT 桌面版应用程序，首先向 Plus 用户推出 macOS 应用，未来计划推出 Windows 版本。

OpenAI发布最新旗舰大模型GPT4o 免费试用价格五折速度提高一倍

0000

评论列表

共(0)条

相关推荐

站长资讯
88VIP淘宝天猫全网商品都能用花呗分期免息，可叠加860元大额券
2023天猫双11今晚8点正式开始预售，88VIP用户第一波大额消费券同步开始领取。今年88VIP大额券总规模达到200亿，用户可领券额度达到860元。今年，88VIP还可享额外的福利:在购买单价超100元的淘宝及天猫实物商品，可使用最多24期的花呗分期免息。直接省掉利息，买大件商品非常划算。
站长网2023-10-24 23:06:54
0001
站长资讯
True Fit利用生成式AI帮助在线购物者找到合身的衣服
划重点:⭐️TrueFit推出新功能"FitHub"，利用生成式AI改善在线购物者找到适合自己身材的衣服。⭐️FitHub整合产品页面信息，帮助购物者快速了解商品并确定合适尺码，减少退货率。⭐️TrueFit还计划推出更多功能，如“ShopperInsights”和“BrandSizing”，提供更深入的个性化购物体验。
站长网2024-06-05 15:41:17
0000
站长资讯
Keep正式登陆港交所：市值155亿港元
运动科技平台Keep于2023年7月12日在香港交易所主板上市，股票代码为“3650”。此次上市标志着Keep正式成为了运动科技领域的第一家上市公司。
站长网2023-07-12 17:37:07
0000
站长资讯
通义千问开源720亿参数大模型Qwen-72B
要点:通义千问开源全家桶推出多款模型，包括18亿、70亿、140亿、720亿参数的大型模型，满足不同需求。Qwen-72B是其中一款720亿参数的模型，性能强劲，在多个权威基准测评中超越其他开源和商用模型，填补了中国大模型市场的空白。通义千问的开源模型具有全尺寸、全模态的特点，包括小型模型Qwen-1.8B和音频模型Qwen-Audio，以及强大的推理性能和个性化角色设置。
站长网2023-12-01 14:23:54
0002
站长资讯
TikTok 现在支持从 AI 支持的 Adobe 应用程序、CapCut、Twitch 等直接发布内容
站长之家(ChinaZ.com)10月11日消息:TikTok今天推出了一个新功能，允许用户直接从一系列热门编辑应用程序发布视频到其平台上，包括Adobe的人工智能视频编辑软件PremierePro，以及其AI创意应用AdobeExpress等，还包括Twitch、SocialPilot和字节跳动的CapCut等其他应用。图片来自TikTok
站长网2023-10-11 18:20:02
0000