Gemini将更好地理解手机屏幕上的内容 包括网页、文件、视频
划重点:
- Google 将更新 Android 上的 Gemini,使其 AI 能更好了解屏幕上的内容。
- 通过 Gemini Advanced 订阅,用户可以使用 Gemini 来理解 PDF 文件,并在特定题上获得专家建议。
- 可以摘要或回答关于网页和屏幕截图的问题。
- Gemini 将能够识别屏幕上的视频,并根据视频的自动字幕回答用户的问题。
Google 正在更新 Android 的 Gemini,以使其 AI 能够更好地了解屏幕上的内容。这次更新将使 Gemini 发挥出其最佳例之一,即在用户日常生活中帮助他们理解有限的数据。
如果将 Gemini 设置为 Android 手机上的默认助手,它已经可以对网页或屏幕截图进行摘要或回答问题。不久之后,它还将能够别屏幕上是否有视频,并提示用户提问。Gemini 使用视频的自动字幕来寻找答案,这在以前的版本中经实现,只是需要绕一些弯路。
如果您正在查看 PDF 文件,Gemini 也会采取类似的操作,但有条件:您需要使用 Google 付费版本的 Gemini Advanced 才能使用该功能。这是因为该功能需要整个 PDF 作为上下文窗,这只在 Gemini Advanced 订阅者中可用。但一旦 Gemini 获得了 PDF 文件,您基本上就把它变成了该主题的专家 - 也许是您的洗碗机使用手册或当地的路边回收指南。Gemini Advanced 是每月20美元的 Google One AI 高级计划的一部分。
此外,还有一个小的更新:您很快就可以将 Gemini生成的图像拖放到正在使用的应用程序中,而无需在应用程序之间切换。您只需在 Gemini 叠加中长按图像,然后将其拖放到聊天或电子邮件中。总体而言,这使 Gemini 像是一个与系统其他部分无缝集成的东西,而不是您必须去获取的东西。
谷歌的 Gemini 在 Android 上的更新将在未来几个月内向 “数亿设备” 推出,并且还有更多上下文功能正在开发中。
新AI模型DPPFA−Net可精准检测到小型3D物体存在
##划重点:-🌐研究团队在日本立命馆大学开发了一种名为“DynamicPoint-PixelFeatureAlignmentNetwork”(DPPFA−Net)的模型,通过创新策略准确地结合3DLiDAR数据和2D图像,显著提高了小目标检测的性能。站长网2024-01-10 14:53:390000霸榜测评的开源大模型,为何是阿拉伯人搞出来的?
在当下的大模型赛道上,开源大模型已经成了一股愈发无法忽视的力量。无论是Meta的LLMA2,还是国内的百川大模型,都在竞相迭代,渴望在这场AI浪潮中取得更多优势。然而,就在中美AI企业角力之时,“评分最高开源大模型”的桂冠,却突然在一夜之间被阿拉伯人拿下了。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-09-12 10:44:080000我在直播间“卖鱼”,一年卖出8个亿
在拥有千年饮食文化的中国,一道菜就能成就一个赛道。这道诞生于重庆的川菜——酸菜鱼,因为口感丰富、做法独特,从上世纪90年代开始风靡全国,成为大小饭店中一道经典名菜。酸菜鱼成为餐桌爆品后,线下也出现了多家主打这道菜的餐饮店,例如太二酸菜鱼、鱼你在一起等品牌。凭借“吃货”对酸菜鱼的喜爱和消费,太二品牌在2018年中国酸菜鱼市场排名第一,为母公司九毛九贡献了超四成营收,助其于2020年1月成功上市。站长网2023-04-23 09:21:510000科技资产管理公司 Ark Invest认为人工智能投资的机会在于小众领域
近日,专注于科技领域的资产管理公司ArkInvest选定了几家公司作为其“沉睡浪潮”战略的一部分,这些公司在人工智能领域拥有前景可期的投资机会。值得注意的是,著名科技公司如苹果、Alphabet、微软和英伟达等,并未被列入其中。ArkInvest公司特别强调不应认为这些“巨型”科技股将是“人工智能革命”的主要受益者。站长网2023-08-22 12:00:570000拼多多宣布首页新增了9块9特卖频道横滑入口
拼多多官方日前宣布在首页新增了一个9块9特卖频道的横滑入口,并且正在进行招商。这一入口目前处于内测阶段,部分用户已经可以看到。站长网2023-07-12 09:09:590000