谷歌发布多模态大模型Gemini 1.0 预计明年初向开发者推出

站长网2023-12-07 08:43:301阅

Gemini 是 Google 推出的最新一代 AI 模型，Gemini 具有多模态的能力，可以处理和结合文本、代码、音频、图像和视频等不同类型的信息。

Gemini 分为三种规模:Ultra、Pro 和 Nano，分别针对不同的复杂任务和设备。

Gemini Ultra——最大、最有能力的模型，适用于高度复杂的任务。

Gemini Pro——可扩展各种任务的最佳模型。

Gemini Nano——最高效的模型，适用于设备任务

Gemini 在性能方面表现出色，超越了当前领先的大型语言模型研究中的30项常用基准测试中的30项。其中，在 "MMLU"（大规模多任务语言理解）基准测试中，Gemini Ultra 的得分达到了90.0%，首次超过人类专家的水平。Gemini 还在多模态基准测试中取得了优异的成绩，显示出其出色的多模态能力。

Gemini 具备先进的多模态推理能力，能够从复杂的文本和视觉信息中提取洞察力，并能够理解和回答与复杂主题相关的问题。此外，Gemini 还在编码方面表现出色，能够理解和生成高质量的代码。

Gemini 已经开始在 Google 产品中应用，包括 Bard 和 Pixel 系列。开发者和企业客户也可以通过 Gemini API 在 Google AI Studio 或 Google Cloud Vertex AI 中使用 Gemini Pro。

Gemini Ultra 目前正在进行严格的安全检查，计划在明年初向开发者和企业客户推出。

谷歌发布多模态大模型Gemini1 0 预计明年初向开发者推出

0001

评论列表

共(0)条

相关推荐

站长资讯
AutoAgents：基于LLM的自动代理生成框架
AutoAgents是一个创新性的框架，旨在通过GPT生成不同的角色，以形成协作实体，用于处理复杂任务。无需手动编写规则或代理，AutoAgents利用LLM的能力，可以根据您设定的目标生成多个专家角色代理，这些代理可以协同工作，执行复杂任务，无论是信息搜索、问题解答还是其他各种应用。项目地址:https://github.com/LinkSoul-AI/AutoAgents
站长网2023-10-07 11:15:40
0000
我用AI 3D，终于实现了我的手办自由。
我真的很喜欢一些奇奇怪怪的小玩意。家里手办乐高啥的也买了不少。但是我一直，想玩一点自己的东西。毕竟，谁不想，亲手搞点自己的东西呢。然后周末的时候，在群里看到一个可爱的蟑螂小姐的图，让我超级心动。真的，太喜欢了。就是这个。我当时第一个想法，就是去淘宝上搜，看看有没有这个玩意的小手办。结果，搜出来的都是蟑螂药，还有那种肌肉大玩偶。
站长网站长资讯2024-10-24 14:29:36
0000
站长资讯
生成式语音AI工具Resemble AI 支持50多种语言
ResembleAI是一款可以生成人类声音的人工智能工具。它可以从你提供的语音数据中克隆声音，只需要5分钟的数据就可以开始。它提供文本到语音、语音到语音、神经音频编辑、语言配音、情感、实时语音克隆、本地化和类似填充功能。体验地址:https://www.resemble.ai/
站长网2023-08-16 14:33:02
0000
站长资讯
ChatGPT解锁新身份为美国一对新人当婚礼司仪
近日，美国科罗拉多州的一对新人婚礼上，ChatGPT首次以婚礼司仪的身份出现，为这场婚礼增添了科技与个性化的色彩。在仪式上，ChatGPT用熟练的语言表达出了这个历史性时刻的重要性，以及爱情与科技交织的无限可能性。它还即兴发挥，为新人和客人带来了个性化的祝福和感谢。
站长网2023-07-04 14:40:32
0001
站长资讯
生成式AI：三块短板、两道难题、一个悖论
闫德利腾讯研究院资深专家炼大模型，大炼模型
站长网2024-04-24 19:48:23
0001