微软的 Bing AI 聊天机器人现已支持使用图像进行搜索
站长网2023-07-19 19:18:284阅
站长之家(ChinaZ.com) 7月19日消息:微软周二宣布对其人工智能聊天机器人进行重大更新,加入图像搜索功能。用户现在可以拍摄照片或将图片上传到 Bing 聊天,并通过桌面或 Bing 应用程序询问有关该照片的更多信息。
微软在一份新闻稿中写道:「Bing 可以理解图像的上下文,解释图像并回答与之相关的问题。无论您是在度假时前往一个新城市并询问特定建筑物的建筑风格,还是在家中根据冰箱里的食材想出午餐的主意,只需将图像上传到 Bing Chat 中,利用网络的知识获取答案。」
这一更新是在聊天机器人领域的 AI 竞赛愈发激烈的背景下推出的,包括微软、谷歌、OpenAI 和 Anthropic 在内的领导者们都在努力开发最先进的生成式 AI,并迅速推出新功能,以与不仅是基于文本的聊天机器人竞争对手保持一致,还要满足图像密集型 AI 工具的需求。
虽然图像搜索和包含图像的回答现在已成为聊天机器人用户体验的一部分,但目前似乎还没有领先的基于文本的聊天机器人能够生成自己的图像,不像 Midjourney、Stable Diffusion 和 DALL-E 2 等工具。然而,谷歌表示其 Bard 聊天机器人即将推出这一功能。
微软允许在 Bing Chat 中使用图像的决定是在谷歌最近为其 AI 聊天机器人 Bard 推出图像搜索功能之后做出的。使用 Google Lens,用户可以向 Bard 请求关于上传的图像的信息,要求它生成标题,甚至在聊天机器人的回答中增加一些趣味,例如要求附带餐厅内部照片的餐厅推荐。
截至目前为止,OpenAI 的 ChatGPT 不允许上传照片,因为该聊天机器人仍完全基于文本,Anthropic 的聊天机器人 Claude 2 也是如此。
0004
评论列表
共(0)条相关推荐
苹果研究团队揭示WRAP技术:用合成数据进行预训练大模型 成本低准确性高
**划重点:**1.🔄**预训练效率提升:**WRAP应用于嘈杂的C4数据集,预训练速度提高了近三倍,显著降低了LLM训练的高昂成本和时间投入。2.🚀**模型性能提升:**WRAP在相同计算预算下使模型性能更出色,通过使用Pile的不同子集,减少了超过10%的歧义,并在13种不同活动的零-shot问题回答准确性上提高了超过2%。站长网2024-02-05 10:42:350000Suno推出生成式音频AI基础模型 输入文本即可生成30秒音乐
最近,科技公司Suno推出了一款生成式音频AI基础模型,用户只需简单的文本输入,就可以生成两段约30秒带有歌词的音乐。这个玩法跟之前的Midjourney很相似,在Suno的Discord频道里输入“/chirp”命令,再加上提示词,告诉它你想要的音乐风格和歌词即可。官方建议输入的内容不要超过4-8行。体验地址:https://discord.com/invite/QRrnYufqZV站长网2023-08-10 16:52:450001Powder利用AI为游戏主播自动剪辑 可检测直播间取胜、击杀等重要瞬间
法国初创公司Powder最近推出了一款人工智能驱动的视频剪辑工具,它可以自动从游戏直播和视频中提取精彩片段,大大简化了游戏主播的后期编辑工作。Powder训练了40多个游戏专用的AI模型,能够分析音频、检测笑声并找到游戏中的亮点时刻,如取胜、击杀等重要瞬间。Powder会自动剪辑这些精彩片段生成短视频,供主播分享到社交平台。站长网2023-11-21 09:51:040000“穷鬼套餐”,卖爆抖音
买一送一、加1元送一个、9块9套餐……在小红书,声量比肩麦当劳、肯德基,塔斯汀正在成为年轻人“穷鬼攻略”的一员。图源:小红书用户今年8月,塔斯汀在北京西站开出北京首店,引起了小红书用户的强烈反馈。交通枢纽本就是快餐类热衷的选址,加上北京西站又是人员流动极大的地方,把门店设立在此,相当于立了一块广告牌。站长网2023-09-05 20:41:380001FF宣布重获纳斯达克上市合规计划 继续推进中东战略融资
今日,FaradayFuture(FF)宣布重获纳斯达克上市合规的计划。其董事会已批准一系列提案,其中包括实施公司普通股反向股票分割,该提案将在即将召开的年度股东大会上提交给股东审批。根据提案,现有公司已发行普通股和被授权普通股总数按1:2至1:40范围内的进行同比例反向分割授权。最终比例将在股东批准后由董事会决定,董事会有权选择放弃、延迟或推迟反向股票分割。站长网2024-06-25 15:18:360000