OpenAI多模态AI系统GPT-Vision即将推出 与谷歌Gemini竞争
站长网2023-09-19 15:10:140阅
据The Information报道,知情人士透露,鉴于谷歌上周开始向部分企业测试其多模态大模型Gemini,OpenAI希望抢占先机,推出自己的多模态AI系统。
OpenAI在3月份推出语言模型GPT-4时曾预览了多模态功能,但至今仅向为盲人提供服务的Be My Eyes公司开放。六个月过后,OpenAI准备大范围推出这款名为GPT-Vision的多模态系统。

OpenAI之所以耽搁这么长时间,主要是担心新功能可能被不法分子滥用,例如自动识别验证码冒充人类,或者面部识别跟踪他人。不过OpenAI工程师似乎已解决围绕这项新技术的法律顾虑。当询问谷歌采取了哪些措施防止Gemini被滥用时,谷歌发言人提到该公司在7月做出负责任AI开发的承诺。
在GPT-Vision之后,OpenAI可能推出更强大的多模态模型代号Gobi。不同于GPT-4,Gobi从一开始就是作为多模态模型进行训练,但此模型似乎还未开始训练。
OpenAI积极推进多模态AI的商业化,与谷歌Gemini形成直接竞争,这标志着多模态AI进入实质应用阶段。业内人士认为,图像生成等视觉能力将增强AI系统的商业价值,OpenAI的GPT-Vision具有与谷歌抗衡的实力。AI领域两大巨头互相竞争有利于行业技术进步,消费者也将从中受益。
0000
评论列表
共(0)条相关推荐
出门问问发布大模型“序列猴子”内测
据新浪科技报道,出门问问推出大模型“序列猴子”内测,致力于提供具备多模态生成能力的大语言模型。在这个能力体系中,语言被视为核心,涵盖知识、对话、数学、逻辑、推理、规划六个维度。这一功能集可以同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。0000Mobile ALOHA:一种低成本的整体远程操作系统用于数据收集
划重点:1.💡研究人员提出了一种低成本的整体远程操作系统,名为MobileALOHA,用于收集关于整体远程操作的数据。2.💡MobileALOHA通过将其放在轮式底座上,扩展了原始ALOHA的功能,使其具有移动能力。3.💡研究人员使用静态ALOHA数据集进行模仿学习,通过预训练和联合训练,实现了在移动操作任务中的良好性能。站长网2024-01-11 17:56:420001GPT-4作弊被抓,吉娃娃or松饼打乱顺序就出错,LeCun:警惕在训练集上测试
GPT-4解决网络名梗“吉娃娃or蓝莓松饼”,一度惊艳无数人。然鹅,现在它被指出“作弊”了!全用原题中出现的图,只是打乱顺序和排列方式。结果,最新版全模式合一的GPT-4不但数错图片数量,原来能正确识别的吉娃娃也识别出错了。那么为什么GPT-4在原图上表现的这么好呢?站长网2023-11-14 14:06:170002华为上半年净利润465.23亿元!砸了826亿搞研发
快科技8月30日消息,今日晚间,华为在上清所公布了2023年半年报,报告显示,上半年,华为实现营收3082.90亿元,上年同期为2986.80亿元;净利润为465.23亿元,上年同期为146.29亿元。在研发上,华为依然重金持续投入,2023年上半年,华为研发费用达到826.04亿元,同比增加35.41亿元,上年同期为790.63亿元。站长网2023-08-30 22:21:470000谷歌 Colab 添加 AI 编码功能,包括代码生成和聊天机器人
AI自动编码将上线!GoogleColaboratory(Colab)将添加新的AI编码功能,包括代码生成、代码完成和编程聊天机器人。新功能将免费使用,并将得到能够与GPT-4竞争的PaLM2模型的支持。新功能将减轻重复编码任务的负担,让开发人员能够专注于更有价值的编程和数据科学任务。添加AI驱动的代码生成、完成和聊天机器人将使开发人员的机器学习开发更加方便。站长网2023-05-18 15:50:020000