谷歌发布多模态大模型Gemini 1.0 预计明年初向开发者推出
站长网2023-12-07 08:43:301阅
Gemini 是 Google 推出的最新一代 AI 模型,Gemini 具有多模态的能力,可以处理和结合文本、代码、音频、图像和视频等不同类型的信息。
Gemini 分为三种规模:Ultra、Pro 和 Nano,分别针对不同的复杂任务和设备。
Gemini Ultra——最大、最有能力的模型,适用于高度复杂的任务。
Gemini Pro——可扩展各种任务的最佳模型。
Gemini Nano——最高效的模型,适用于设备任务

Gemini 在性能方面表现出色,超越了当前领先的大型语言模型研究中的30项常用基准测试中的30项。其中,在 "MMLU"(大规模多任务语言理解)基准测试中,Gemini Ultra 的得分达到了90.0%,首次超过人类专家的水平。Gemini 还在多模态基准测试中取得了优异的成绩,显示出其出色的多模态能力。
Gemini 具备先进的多模态推理能力,能够从复杂的文本和视觉信息中提取洞察力,并能够理解和回答与复杂主题相关的问题。此外,Gemini 还在编码方面表现出色,能够理解和生成高质量的代码。
Gemini 已经开始在 Google 产品中应用,包括 Bard 和 Pixel 系列。开发者和企业客户也可以通过 Gemini API 在 Google AI Studio 或 Google Cloud Vertex AI 中使用 Gemini Pro。
Gemini Ultra 目前正在进行严格的安全检查,计划在明年初向开发者和企业客户推出。

0001
评论列表
共(0)条相关推荐
VMware 和英伟达合作推出 VMware Private AI Foundation:帮助企业拥抱生成式 AI
站长之家(ChinaZ.com)8月23日消息:VMware当地时间周二宣布,扩大与英伟达的战略伙伴关系,以让运行在VMware云基础设施上的数十万企业准备好迎接生成式AI时代。图片来自NVIDIAVMware已与英伟达合作开发了一套新的软件工具,针对希望在自己的数据中心开发生成式人工智能的企业,而不是在云上进行。站长网2023-08-23 16:26:550000苹果App Store Awards 2023榜单公布:《崩坏:星穹铁道》获年度iPhone游戏
苹果AppStoreAwards2023榜单正式出炉,表彰了今年在技术创新、用户体验和设计方面表现出色的应用程序与游戏。在应用程序方面,《AllTrails》获得了年度iPhoneApp奖项。这款应用程序由AllTrails,Inc.开发,它以创新的方式提供了户外运动和探险的路线和指南,帮助用户探索新的地方和挑战自我。站长网2023-11-30 14:10:060000电商平台在短剧里捞金
猫狗拼加入短剧赛道今年狗血上头、节奏快、爽点多的短剧备受大众欢迎。1天2000万,8天破1亿的吸金速度更是迅速带动资本涌入。横店变“竖店”,就连香港知名导演王晶也开始涉足短剧。互联网行业出现又一流量新风口,这也恰好为正在建设内容化的货架电商平台提供了契机。短剧开始正在成为货架电商平台新宠。淘宝、拼多多、京东等平台都开始出现短剧的身影。0000谷歌开发实时渲染大型三维场景技术SMERF
Google团队开发了一种名为SMERF的技术,可以在最大300平方米的房间内实时创建非常逼真的三维场景,其精度达到厘米级别。这项技术的最大特点是,它可以在普通智能手机和笔记本电脑上实现60fps或更高的速度实时渲染,并提供完整的六自由度(6DOF)3D导航体验。站长网2023-12-15 14:49:150001开源聊天机器人框架Lobe Chat 支持语音合成、多模态等多种功能
要点:1.LobeChat是一个高性能、开源的聊天机器人框架,支持语音合成、多模态和可扩展的插件系统,能一键自由部署私有ChatGPT/LLMWeb应用。2.新增特性包括对gpt-4-vision模型的视觉支持,支持文本转语音(TTS)和语音转文本(STT)技术,以及一个功能调用插件系统,为ChatGPT提供实时信息检索和处理的能力。站长网2023-12-15 18:03:400002