谷歌发布多模态大模型Gemini 1.0 预计明年初向开发者推出
站长网2023-12-07 08:43:301阅
Gemini 是 Google 推出的最新一代 AI 模型,Gemini 具有多模态的能力,可以处理和结合文本、代码、音频、图像和视频等不同类型的信息。
Gemini 分为三种规模:Ultra、Pro 和 Nano,分别针对不同的复杂任务和设备。
Gemini Ultra——最大、最有能力的模型,适用于高度复杂的任务。
Gemini Pro——可扩展各种任务的最佳模型。
Gemini Nano——最高效的模型,适用于设备任务

Gemini 在性能方面表现出色,超越了当前领先的大型语言模型研究中的30项常用基准测试中的30项。其中,在 "MMLU"(大规模多任务语言理解)基准测试中,Gemini Ultra 的得分达到了90.0%,首次超过人类专家的水平。Gemini 还在多模态基准测试中取得了优异的成绩,显示出其出色的多模态能力。
Gemini 具备先进的多模态推理能力,能够从复杂的文本和视觉信息中提取洞察力,并能够理解和回答与复杂主题相关的问题。此外,Gemini 还在编码方面表现出色,能够理解和生成高质量的代码。
Gemini 已经开始在 Google 产品中应用,包括 Bard 和 Pixel 系列。开发者和企业客户也可以通过 Gemini API 在 Google AI Studio 或 Google Cloud Vertex AI 中使用 Gemini Pro。
Gemini Ultra 目前正在进行严格的安全检查,计划在明年初向开发者和企业客户推出。

0001
评论列表
共(0)条相关推荐
AutoAgents:基于LLM的自动代理生成框架
AutoAgents是一个创新性的框架,旨在通过GPT生成不同的角色,以形成协作实体,用于处理复杂任务。无需手动编写规则或代理,AutoAgents利用LLM的能力,可以根据您设定的目标生成多个专家角色代理,这些代理可以协同工作,执行复杂任务,无论是信息搜索、问题解答还是其他各种应用。项目地址:https://github.com/LinkSoul-AI/AutoAgents站长网2023-10-07 11:15:400000我用AI 3D,终于实现了我的手办自由。
我真的很喜欢一些奇奇怪怪的小玩意。家里手办乐高啥的也买了不少。但是我一直,想玩一点自己的东西。毕竟,谁不想,亲手搞点自己的东西呢。然后周末的时候,在群里看到一个可爱的蟑螂小姐的图,让我超级心动。真的,太喜欢了。就是这个。我当时第一个想法,就是去淘宝上搜,看看有没有这个玩意的小手办。结果,搜出来的都是蟑螂药,还有那种肌肉大玩偶。0000生成式语音AI工具Resemble AI 支持50多种语言
ResembleAI是一款可以生成人类声音的人工智能工具。它可以从你提供的语音数据中克隆声音,只需要5分钟的数据就可以开始。它提供文本到语音、语音到语音、神经音频编辑、语言配音、情感、实时语音克隆、本地化和类似填充功能。体验地址:https://www.resemble.ai/站长网2023-08-16 14:33:020000ChatGPT解锁新身份 为美国一对新人当婚礼司仪
近日,美国科罗拉多州的一对新人婚礼上,ChatGPT首次以婚礼司仪的身份出现,为这场婚礼增添了科技与个性化的色彩。在仪式上,ChatGPT用熟练的语言表达出了这个历史性时刻的重要性,以及爱情与科技交织的无限可能性。它还即兴发挥,为新人和客人带来了个性化的祝福和感谢。站长网2023-07-04 14:40:320001