谷歌发布Gemini 1.5技术报告 详细介绍Gemini 1.5 Pro模型架构改进情况
Google DeepMind 发布了一份长达150页的技术报告,详细介绍了 Gemini1.5Pro 和 Gemini1.5Flash 两个模型的性能特点和架构以及这个多模态大型模型的最新进展。
Gemini1.5于今年2月上线,通过工程优化、MoE架构等策略显著提升了性能和速度。该模型具有更长的上下文理解能力、更强的推理能力,能够处理跨模态内容。
报告中提到了两个新型号:
Gemini1.5Pro:在多个功能和基准测试中超越了2月份的版本。
Gemini1.5Flash:轻量级变体,旨在提高效率,性能损失极小。
Gemini1.5Flash是一个Transformer解码器模型,拥有超过2M的上下文和多模态功能,优化了张量处理单元(TPU)的使用,并减少了模型服务延迟。它能够并行计算注意力和前馈分量,使用高阶预处理方法提高训练质量。
报告还评估了Gemini1.5在处理英语、中文、日语和法语查询时,每个输出字符的平均时间。结果显示,Gemini1.5Flash在所有测试语言中实现了最快的生成速度。
此外,Gemini1.5在跨模态长上下文检索任务上实现了近乎完美的召回,提高了长文档问答、长视频问答和长上下文自动语音识别的最佳水平,并在一系列广泛的基准测试中匹配或超越了Gemini1.0Ultra的性能。
Gemini1.5Pro在5月份的版本在多个推理、编码、视觉和视频基准测试中进行了改进,而音频和翻译性能保持不变。
报告还介绍了Gemini1.5Pro数学增强版本的性能,它在Hendryck的MATH基准测试中取得了91.1%的突破性性能,解决了此前模型无法解决的亚太数学奥林匹克题目。
最后,报告强调了Gemini1.5在现实世界的应用潜力,展示了它与专业人士合作完成任务的能力,在10个不同的工作类别中可节省26-75%的时间。此外,该模型还能学会将英语翻译成Kalamang,一种只有不到200人使用的语言,与人类学习者的水平相当。
Gemini1.5的技术报告展示了谷歌在大型多模态模型领域的最新进展,其性能的提升和应用潜力为未来的AI技术发展提供了新的方向。
详细报告:https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf
苹果发布Vision Pro耳机首个安全补丁 修复潜在黑客利用漏洞
苹果在科技巨头首次实际评测VisionPro耳机后的第二天发布了混合现实耳机的首个安全补丁。公司推出了visionOS1.0.2软件,该软件修复了VisionPro上运行的WebKit中的漏洞,该漏洞可能被黑客利用。漏洞修复后,苹果表示,如果受到利用,恶意代码将无法在受影响的设备上运行。站长网2024-02-01 11:06:220000沃尔玛认为人工智能不会导致裁员:将在推出更多 AI 技术时继续雇用相同数量或更多的员工
沃尔玛正在使用人工智能工具来提高其商店的效率和生产力,但该公司声称这并没有导致裁员。人工智能软件用于确定最有效的卡车装载方式、根据客户购买模式组织货架以及回答客户问题等任务。沃尔玛表示,该技术让员工能够更加专注于客户服务,并且没有导致任何裁员。该公司计划在未来推出更多人工智能技术时继续雇用相同数量或更多的员工。站长网2023-10-07 18:00:400000最新文生3D基础模型 3DTopia,五分钟生成一件 “3D 展品”
划重点:-研究人员推出了新款文生3D基础模型3DTopia,可以在5分钟内生成出多样化、高精度的3D模型。-3DTopia的推理过程分为两个阶段,第一个阶段生成粗糙模型,第二阶段用theeefiner进行细化。-部署3DTopia需要一定的操作,但也有Colab笔记可供使用,一键完成部署。站长网2024-01-25 15:41:250000OpenAI 与好莱坞接轨:Sora 文本到视频生成器引发行业热议
OpenAI近日传出消息,计划将其最新文本到视频生成器Sora推向好莱坞。据知情人士透露,下周该人工智能公司将在洛杉矶与多家工作室、人才机构和媒体高管进行会面,旨在探讨未来合作伙伴关系。此次会议的核心议题将集中在让更多电影制作人熟悉即将发布的Sora上。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-03-23 17:12:030000ambientGPT:开源多模态MacOS基础模型操作界面 可调用GPT-4o API
划重点:⭐AmbientGPT可以运行GPT-4和本地基础模型,并直接了解屏幕环境,使基础模型不再局限于浏览器。⭐使用AmbientGPT,屏幕上下文将直接作为查询的一部分进行推断,无需再次显式上传上下文。⭐若要运行本地模型,需要使用ARM64MacBook,并使用兼容的OpenAIAPI密钥。站长网2024-05-24 10:21:030000