OpenAI 增强 Assistants API 引入视觉能力支持多种图像格式
站长网2024-05-10 17:23:090阅
OpenAI 最近宣布,其 Assistants API 现在支持视觉能力,这标志着该公司在多模态AI领域的进一步扩展。这项更新使得API能够处理和理解图像内容,为用户提供更加丰富的交互体验。
Assistants API 的视觉能力特点包括:
支持多种图像格式:用户现在可以提交 PNG、JPG、GIF 和 WebP 格式的图像,以供API进行分析和理解。
数据使用限制:OpenAI 为每个组织设定了100GB的使用限制,而组织内每个用户的限制为10GB。这确保了服务的公平使用,并为不同规模的组织提供了灵活性。
图像理解自由控制:API 支持低保真度或高保真度的图像理解,开发者可以根据自己的需求和应用场景自由控制图像处理的精细程度。
这项更新为开发者提供了新的工具,以创建能够结合视觉和文本信息的应用程序,从而在各种场景下提供更准确的响应和更丰富的用户体验。无论是在客户服务、内容审核、教育还是娱乐领域,增强的视觉能力都有望带来新的创新和改进。
OpenAI 持续推动 AI 技术的边界,Assistants API 的这一新功能将进一步促进 AI 在各个行业中的集成和应用。
0000
评论列表
共(0)条相关推荐
阿里文字生成图像产品“通义万相”将于月底逐步开放
近日,阿里巴巴达摩院基础视觉团队表示,基于阿里云,阿里构建了文字生成图像产品“通义万相”,将于本月底开放给公众。此前,阿里云已发布了大模型“通义千问”,开启企业邀测。阿里集团董事会主席兼CEO张勇表示,阿里巴巴所有产品未来都将接入大模型全面升级。站长网2023-04-21 18:11:210002Bored Humans提供Midjourney等100多款主流AI工具的免费平替版本
本文概要:1.BoredHumans是一个拥有100多种免费AI工具的网站,包括图像生成、播客生成、背景去除等,可替代许多付费工具。2.该网站的许多工具具有趣味性和创新性,但AI生成的图像质量通常不如Midjourney等更复杂的模型。3.该网站由美国域名投资者EricBorgos创立,他有25年互联网工具开发经验。站长网2023-08-27 14:16:420000黄仁勋:未来职场会更卷 AI可以充当“员工”
快科技7月2日消息,据媒体报道,英伟达掌门人黄仁勋在近期的一次演讲中,深刻剖析了人工智能(AI)在未来职场格局中的革命性影响。他指出,随着AI技术的日新月异,拥有强大推理能力的智能体正逐步蜕变为职场中的超级员工”,不仅能够高效处理复杂多变的任务,更在特定领域内展现出超越人类的卓越能力。黄仁勋警示称,这一变革将引领职场进入一个前所未有的超级竞争”时代,他形象地称之为更卷”现象。站长网2024-07-02 18:04:580000618收官,小红书“买手+店播”两条腿走路
在各平台超头叙事逐渐失灵的这个618,小红书的商业化之路,依靠直播,水花渐起。6月19日,小红书电商公布“小红书618直播季”收官战报。战报显示,截至6月18日,直播订单数达去年同期5.4倍,直播间购买用户数达去年同期5.2倍,小红书电商业务正在持续加速跑。站长网2024-06-22 11:45:370000斯坦福研究人员推出 Sophia 可高效低成本训练大模型
斯坦福大学的研究人员开发了一种名为Sophia的新型优化器,可将语言模型的预训练时间缩短一半。相比于Adam优化器,Sophia可以更快地解决语言模型的问题。Sophia通过轻量级估计对角Hessian矩阵作为二阶优化器的预条件。在更新之后,通过取梯度的平均值除以估计Hessian的平均值来进行元素级别的剪切。站长网2023-07-26 16:13:050000