OpenAI发布最新旗舰大模型GPT-4o:免费试用 价格五折速度提高一倍
GPT-4o具体特性一览:
GPT-4o模型发布:OpenAI发布了GPT-4o模型,其中"o"代表Omni,意为全能。该模型能够接受文本、音频和图像的任意组合作为输入,并生成相应的文本、音频和图像输出。
免费开放:GPT-4o的所有能力将免费向所有用户开放,但新语音模式会在未来几周内优先对ChatGPT Plus会员开放。
API开放:GPT-4o向开发者开放了API,与GPT-4Turbo相比,价格减半,速度提升2倍,速率限制高出5倍。
核心能力:GPT-4o展示了以下核心能力:
零延迟实时语音交互:能够进行自然、真实、富有情感的语音交互。
视觉传达内容:通过摄像头视觉传达内容,解决数学题和解析图形报表。
编程助手:提供实时编程辅助,提高编程效率。
视频通话情绪分析:能够实时分析面部情绪。
同声传译:支持多国语言的同声传译。
性能提升:GPT-4o在文本、推理和编码智能方面达到了GPT-4Turbo级别的性能,并在多语言、音频和视觉能力上设定了新的标准。
站长之家(ChinaZ.com)5月14日 消息:今日凌晨,OpenAI发布了最新旗舰大模型GPT-4o。这款全能AI不仅免费可用,而且具备横跨听图片、看图片、说图片的多项能力,为用户带来如视频电话般丝滑流畅的交流体验。

OpenAI表示,GPT-4o不仅在功能上有所突破,更令人惊喜的是,它将向所有用户免费开放,包括之前仅为ChatGPT Plus会员提供的功能。此外,GPT-4o的新语音模式将在接下来的几周内首先对会员用户开放试用。

据悉,GPT-4o(“o”代表“omni”)凭借其Omni(全能)之名,展现了其惊人的实力。无论是文本、音频还是图像,GPT-4o都能轻松处理,并生成相应的输出。更为令人震撼的是,它能在极短的时间内对音频输入做出反应,其速度之快几乎与人类对话中的反应一致。

首先,GPT-4o实现了零延迟的实时语音交互,其表现自然、真实,充满情感。在演示中,当演示者表现出紧张情绪时,GPT-4o能够迅速识别并给予安慰和指导。此外,GPT-4o还能够根据要求调整语气和音调,甚至在被要求时,能够以机器人的声音或唱歌的形式来讲述故事。
与之前的模型相比,GPT-3.5和GPT-4在语音模式下的平均延迟时间分别为2.8秒和5.4秒,这无疑会影响对话的流畅性。而GPT-4o则无需先将语音转录为文本,因此能够更直接地理解和响应语音中的语气、音调等信息。

除了语音交互,GPT-4o还能通过视觉和语音的结合进行多模态交互。例如,在发布会上,OpenAI展示了GPT-4o如何通过摄像头视觉解析图形报表,帮助用户解决数学问题。

在编程辅助方面,GPT-4o的实时交互能力也得到了显著提升。它能够实时检查代码,解释代码的功能,并指导用户如何调整代码以获得期望的结果。
此外,GPT-4o还能够进行视频通话,并实时分析面部情绪。在演示中,GPT-4o能够准确地识别并响应演示者的情绪状态。
在语言能力方面,GPT-4o支持超过50种语言,并在质量和速度上都有所提升。在官方演示中,GPT-4o成功实现了英语和西班牙语之间的实时同声传译。
尽管GPT-4o在人机交互方面取得了革命性的进步,但它并不是GPT-5。OpenAI的首席技术官Mira Murati在直播中提到,GPT-4o是GPT-4模型的一个迭代版本,它在文本、语音和视觉方面的能力都有所提升。
OpenAI的首席执行官Sam Altman也表示,GPT-4o是一个"原生多模态"模型,它在文本、视觉和音频方面进行了端到端的训练,所有输入和输出都由同一个神经网络处理。

GPT-4o的强大不仅体现在其全面的能力上,更在于其高效的API服务。为了让更多用户能够轻松使用GPT-4o,OpenAI提供了价格打五折、速度提高一倍、单位时间调用次数增加五倍的API服务。这无疑将极大推动GPT-4o在各行各业的应用和发展。
最后,OpenAI 还宣布将推出 ChatGPT 桌面版应用程序,首先向 Plus 用户推出 macOS 应用,未来计划推出 Windows 版本。
88VIP淘宝天猫全网商品都能用花呗分期免息,可叠加860元大额券
2023天猫双11今晚8点正式开始预售,88VIP用户第一波大额消费券同步开始领取。今年88VIP大额券总规模达到200亿,用户可领券额度达到860元。今年,88VIP还可享额外的福利:在购买单价超100元的淘宝及天猫实物商品,可使用最多24期的花呗分期免息。直接省掉利息,买大件商品非常划算。站长网2023-10-24 23:06:540001True Fit利用生成式AI帮助在线购物者找到合身的衣服
划重点:⭐️TrueFit推出新功能"FitHub",利用生成式AI改善在线购物者找到适合自己身材的衣服。⭐️FitHub整合产品页面信息,帮助购物者快速了解商品并确定合适尺码,减少退货率。⭐️TrueFit还计划推出更多功能,如“ShopperInsights”和“BrandSizing”,提供更深入的个性化购物体验。站长网2024-06-05 15:41:170000Keep正式登陆港交所:市值155亿港元
运动科技平台Keep于2023年7月12日在香港交易所主板上市,股票代码为“3650”。此次上市标志着Keep正式成为了运动科技领域的第一家上市公司。站长网2023-07-12 17:37:070000通义千问开源720亿参数大模型Qwen-72B
要点:通义千问开源全家桶推出多款模型,包括18亿、70亿、140亿、720亿参数的大型模型,满足不同需求。Qwen-72B是其中一款720亿参数的模型,性能强劲,在多个权威基准测评中超越其他开源和商用模型,填补了中国大模型市场的空白。通义千问的开源模型具有全尺寸、全模态的特点,包括小型模型Qwen-1.8B和音频模型Qwen-Audio,以及强大的推理性能和个性化角色设置。站长网2023-12-01 14:23:540002TikTok 现在支持从 AI 支持的 Adobe 应用程序、CapCut、Twitch 等直接发布内容
站长之家(ChinaZ.com)10月11日消息:TikTok今天推出了一个新功能,允许用户直接从一系列热门编辑应用程序发布视频到其平台上,包括Adobe的人工智能视频编辑软件PremierePro,以及其AI创意应用AdobeExpress等,还包括Twitch、SocialPilot和字节跳动的CapCut等其他应用。图片来自TikTok站长网2023-10-11 18:20:020000