DeepMind联合创始人:GPT-5正在训练中 比当前模型大100倍
站长网2023-09-03 17:04:420阅
快科技9月3日消息,DeepMind联合创始人Suleyman近日在采访中表示,GPT-5仍在秘密训练中,未来将会比现在的GPT-4大100倍。
其实,Open AI CEO Sam Altman此前曾否认训练GPT-5的这一说法。有消息人士表示,OpenAI可能给它起了一个新名字,所以他们才说没有训练GPT-5。
Suleyman目前是Inflection AI的CEO,Inflection AI正在建造世界上最大的超级计算机之一,并且他认为在接下来的18个月内,他们可能会进行一次比制造GPT-4的语言模型训练运行大10倍或100倍的训练运行。
今年3月份GPT-4正式发布,和ChatGPT最初使用的GPT-3.5模型相比,GPT-4实现了几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至2.5万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。
GPT-3.5有1750亿参数规模,OpenAI没有公布过GPT-4的具体规格,但之后的分析认为它拥有16个专家模型,每个MLP专家大约有1110亿个参数,总计1.8万亿参数,是GPT-4的10倍规模。
GPT-5如果按照这个比例来提升,那要突破10万亿参数了,有可能成为最大规模的AI大模型,远超其他所有对手。
0000
评论列表
共(0)条相关推荐
微软开源创新LoRA组合方法,增强文生图复杂细节控制
LoRA(低秩适应)的高效能力已在文生图领域获得广泛应用,可以准确渲染、融合图像中的特定元素,例如,不同字符、特殊服装或样式背景等,同时可对图像进行压缩、去噪、补全进行优化操作。但想在模型中应用多个LoRA构建更复杂的图像时,会出现图像失真、难以控制细节的难题。因此,微软和伊利诺伊大学的研究人员开发了Multi-LoRAComposition(多重LoRA组合方法)。站长网2024-03-25 19:12:170000华为PixArt-Σ放出模型文件 可在Comfyui使用
最近,华为的4K图像模型PixArt-Σ放出了模型文件,而且diffusers也支持了这个架构,用户可以在Comfyui上尝试。尽管他们XL-1024版本的模型大小只有2G,但在图像表现和提示词理解方面,它与SD3模型相当接近。可以在Comfyui上尝试。工作流地址:https://civitai.com/models/420163站长网2024-04-29 19:28:1800015分钟生成漫威3D数字人 渐进式3D生成框架“DreamFace”来了!
最近,影眸科技与上海科技大学的研发团队提出了一种文本指导的渐进式3D生成框架——DreamFace,结合了视觉-语言模型、隐式扩散模型和基于物理的材质扩散技术,可以生成符合计算机图形制作标准的3D资产。项目网站:https://sites.google.com/view/dreamface预印版论文:https://arxiv.org/abs/2304.03117站长网2023-05-04 10:30:510000网络安全公司Okta 凭借与 OpenAI 的合作进入印度市场
本文概要:1.Okta与OpenAI合作,提供身份验证和访问管理服务,加强安全性。2.Okta在印度成立新办事处,满足印度对数字身份解决方案和网络安全措施的需求。3.Okta考虑与印度政府合作,提供多因素身份验证解决方案。Okta是一家提供身份和访问管理解决方案的公司,为OpenAI提供客户身份验证和访问管理服务(CIAM)。站长网2023-08-14 15:07:030000吉宏股份与华为云签署创新协议 打造盘古跨境电商大模型
据吉宏股份官方消息,6月5日,吉宏股份与华为云正式签署人工智能大模型联合创新协议,双方将以跨境电商平台的智能化改造升级为核心,在AIGC赋能企业全流程、大模型战略联创、跨境电商平台深度赋能、应用现代化改造、数据挖掘和数据治理等领域展开全面交流,打造盘古跨境电商大模型,推进更深层次的数字化转型。站长网2023-06-14 13:54:280000