Gemini将更好地理解手机屏幕上的内容 包括网页、文件、视频
划重点:
- Google 将更新 Android 上的 Gemini,使其 AI 能更好了解屏幕上的内容。
- 通过 Gemini Advanced 订阅,用户可以使用 Gemini 来理解 PDF 文件,并在特定题上获得专家建议。
- 可以摘要或回答关于网页和屏幕截图的问题。
- Gemini 将能够识别屏幕上的视频,并根据视频的自动字幕回答用户的问题。
Google 正在更新 Android 的 Gemini,以使其 AI 能够更好地了解屏幕上的内容。这次更新将使 Gemini 发挥出其最佳例之一,即在用户日常生活中帮助他们理解有限的数据。
如果将 Gemini 设置为 Android 手机上的默认助手,它已经可以对网页或屏幕截图进行摘要或回答问题。不久之后,它还将能够别屏幕上是否有视频,并提示用户提问。Gemini 使用视频的自动字幕来寻找答案,这在以前的版本中经实现,只是需要绕一些弯路。
如果您正在查看 PDF 文件,Gemini 也会采取类似的操作,但有条件:您需要使用 Google 付费版本的 Gemini Advanced 才能使用该功能。这是因为该功能需要整个 PDF 作为上下文窗,这只在 Gemini Advanced 订阅者中可用。但一旦 Gemini 获得了 PDF 文件,您基本上就把它变成了该主题的专家 - 也许是您的洗碗机使用手册或当地的路边回收指南。Gemini Advanced 是每月20美元的 Google One AI 高级计划的一部分。
此外,还有一个小的更新:您很快就可以将 Gemini生成的图像拖放到正在使用的应用程序中,而无需在应用程序之间切换。您只需在 Gemini 叠加中长按图像,然后将其拖放到聊天或电子邮件中。总体而言,这使 Gemini 像是一个与系统其他部分无缝集成的东西,而不是您必须去获取的东西。
谷歌的 Gemini 在 Android 上的更新将在未来几个月内向 “数亿设备” 推出,并且还有更多上下文功能正在开发中。
上海发布“元宇宙”关键技术攻关行动方案
近日,上海市科学技术委员会印发《上海市“元宇宙”关键技术攻关行动方案(2023—2025年)》的通知。明确聚焦沉浸式技术、Web3技术两大主攻方向,在沉浸影音、沉浸计算、新型显示、感知交互与区块链等关键技术领域打造新高地。站长网2023-06-15 03:53:100000YouTube 宣布负责任的人工智能创新方法:要求披露 AI 生成的内容并添加标签
YouTube正在推出针对AI内容的新规则,包括要求创作者透露他们是否使用了生成式人工智能来制作逼真的视频。YouTube在周二的一篇博客文章中概述了一系列与AI相关的政策更新,表示那些不透露是否使用AI工具制作「改动过的或合成的」视频的创作者将面临处罚,包括被移除内容或被暂停参与该平台收益分享计划。站长网2023-11-15 18:06:450001MIT与Adobe联手开发DMD:生成图像质量媲美Stable Diffusion ,速度快30倍
**划重点:**1.🔄**创新方法:**研究团队提出了分布匹配蒸馏(DMD)方法,将扩散模型转化为一步图像生成器,在保持图像质量的同时显著减少神经网络评估次数。2.🌐**数据优化:**通过对文本到图像数据进行精细调整,研究团队成功解决了在通用文本到图像数据上扩大模型的难题,实现了高效的图像生成。站长网2023-12-07 11:53:12000070亿,张勇去做VC了
张勇挥一挥衣袖。昨晚(9月10日),阿里巴巴集团董事会主席蔡崇信发布全员信宣布,已在当日按计划完成集团管理职务交接,由他接任集团董事会主席职务,吴泳铭出任集团CEO。令人意外的是,原本计划Allin阿里云的张勇(逍遥子),这一次却选择告别——卸任阿里云董事长与CEO的职务。站长网2023-09-11 16:44:500000小米AI大模型MiLM通过备案 将应用于手机、汽车产品中
5月16日,小米公司宣布,小米大语言模型MiLM正式通过大模型备案,小米大模型将逐步应用于小米汽车、手机、智能家居等产品中。5月15日,北京市生成式人工智能服务新增已备案信息正式公布。此次19家企业新增备案,包括了北京小米科技有限责任公司“小米”、腾讯云计算(北京)有限责任公司“行业大模型”等名列其中。站长网2024-05-16 10:43:420000