AI视野:百度发布首个量子领域大模型;Runway推出镜头控制功能;Colossal把大模型门槛打下来了
🤖📈💻💡大模型动态
百度发布首个量子领域大模型
百度发布首个量子领域大模型,以及百度量子助手和量子写作助手两大AI原生应用,旨在全面推动量子技术与大模型深度融合,释放潜力。
AiBase提要:
👉 百度发布首个量子领域大模型,深度融合量子技术与大模型。
👉 百度量子助手降低百度量子平台门槛,提高使用效率。
👉 量子写作助手高效创作量子领域文档,促进知识产权沉淀。
智谱AI发布MathGLM数学模型,算术任务性能优于GPT-4
智谱AI最新发布的MathGLM数学模型在数学推理方面表现出卓越性能,准确率接近100%,明显优于GPT-4。该模型能够精确计算算术运算,提升中文数学解决能力,对不同年级数学问题和应用题也表现出良好的效果。
论文链接:https://arxiv.org/abs/2309.03241
Github链接:https://github.com/THUDM/MathGLM
模型下载:https://modelscope.cn/models/ZhipuAI/MathGLM
AiBase提要:
🚀 MathGLM数学模型卓越性能:MathGLM在算术任务上准确率接近100%,胜过GPT-4。
📈 提升中文数学解决能力:MathGLM能够精确计算算术运算,提高中文数学解决能力。
🎯 多用途数学模型:MathGLM在不同年级数学问题和数学应用题上取得了出色的结果。
Deci AI推出8.2亿参数的文本到图像潜在扩散模型DeciDiffusion1.0
Deci AI最近发布了DeciDiffusion1.0,这是一项具有8.2亿参数的文本到图像生成模型,速度比传统方法快3倍。它采用了创新的U-Net-NAS架构,通过四阶段培训过程提高了效率和图像质量。用户研究显示,它在图像美学方面有优势,并在与文本描述的匹配上表现良好,为文本到图像生成领域带来了新的创新。
项目地址:https://huggingface.co/spaces/Deci/DeciDiffusion-v1-0
AiBase提要:
- 🚀 Deci AI发布DeciDiffusion1.0,8.2亿参数的文本到图像生成模型,速度快3倍
- 🌟 采用U-Net-NAS架构,提高效率和图像质量,经过四阶段培训过程优化
- 🖼️ 用户研究显示在图像美学和文本匹配方面表现出色,带来文本到图像生成领域的创新
百川智能发布闭源大模型Baichuan2-53B 并开放API
百川智能发布闭源大模型Baichuan2-53B,该模型在数学和逻辑推理方面表现出显著提升,通过高质量数据体系和搜索方法减少了模型幻觉,并开放了Baichuan2-53B的API接口,进军商业领域。
AiBase提要:
1. 🚀 Baichuan2-53B全面升级,数学和逻辑推理能力显著提升。
2. 📊 百川智能优化数据体系,确保使用优质数据进行预训练。
3. 🤖 Baichuan2-53B开放API接口,进军商业化领域。
恒生电子:恒生大模型产品LightGPT已开启内测
恒生电子宣布,恒生大模型产品LightGPT已开始内测,该大语言模型专为金融领域打造,具有更专业、更合规和更轻量的特点。通过海量金融数据训练,提升了对金融相关问题的理解能力,有望推动大模型在金融行业的应用。
AiBase提要:
🌐 专业性:LightGPT经过训练使用了2000亿中文tokens,覆盖金融多个领域的应用场景。
📚 合规性:LightGPT学习了中国的金融法律法规,符合中国金融市场的监管要求。
☁️ 轻量化:LightGPT支持私有化/云部署,通过API调用,部署成本较低。
度小满“轩辕70B”金融大模型开源
度小满发布了金融行业大模型“轩辕70B”,具有出色的通用能力和专业金融性能。该模型在中文任务评测和金融领域获得高分,是首个参数量级达到70B的开源大模型,具备8k以上的上下文长度。它在预训练阶段融入了专业金融语料,采用加速优化策略,训练效率出色。模型已在开源社区全面开放,为金融领域提供高效的中文基座模型,用户可自定义微调,有望为自然语言处理和信息抽取任务带来新机遇。
项目地址:https://github.com/Duxiaoman-DI/XuanYuan
AiBase提要:
1. 🌐 中文增强:轩辕70B通过中文增强和金融领域预训练,提升金融领域理解能力。
2. 📜 上下文长度扩展:首个70B参数级别开源大模型,上下文长度达8k以上,满足金融领域长文本需求。
3. 💼 专业性能:在金融领域评测中获得显著提升,成为处理金融文本的理想选择。
阿里云开源通义千问140亿参数模型Qwen-14B、Qwen-14B-Chat
阿里云于9月25日开源通义千问模型Qwen-14B及其对话模型Qwen-14B-Chat,免费商用。Qwen-14B在多项评测中表现卓越,接近Llama2-70B水平。
AiBase提要:
🔍 数据质量提升:Qwen-14B使用3万亿Token训练数据,强化推理、认知、规划和记忆。
💬 对话升级:Qwen-14B-Chat基于强大基座模型,准确度提升,内容更符合人类偏好。
📥 下载与调用:用户可在魔搭社区或阿里云灵积平台获取Qwen-14B和Qwen-14B-Chat模型。
👨💻💡🎯聚焦开发者
几千元训完中文版LLaMA2!Colossal-LLaMA-2把大模型门槛打下来了!
从头预训练大模型过去需要高达5000万美元的投资,但Colossal-LLaMA-2降低了门槛。只需15小时和几千块钱的投入,即可训练出中文LLaMA2大模型,性能接近SOTA水平,完全开源,可用于各领域低成本构建大模型。
AiBase提要:
🚀 低成本训练:15小时、几千元训完中文版LLaMA2,降低大模型训练成本。
📈 性能提升: 中文版LLaMA2在多项任务上表现出色,达到SOTA水平。
🌐 全面开源: 开源训练流程、代码和权重,可广泛应用于不同领域。
融资1亿美元的类ChatGPT模型开源啦!可商用,8个模型
生成式AI平台Writer获得1亿美元融资,开源了8个型号的大语言模型Palmyra,包括支持数据微调,适用于多个领域的型号。其中InstructPalmyra-20b支持高级自然语言处理,Palmyra-Med用于医疗保健,Palmyra-Large适用于多种业务场景,性能评测表现出色。Writer成为ChatGPT的主要竞争对手。
开源地址:https://huggingface.co/Writer
在线免费体验地址:https://app.writer.com/organization/
AiBase提要:
🚀 Writer获1亿美元融资,开源Palmyra大语言模型。
💡 Palmyra包括多个型号,支持数据微调,适用于不同领域。
🌟 Palmyra在性能评测中表现出色,成为ChatGPT竞争对手。
UCSD 研究人员开源Graphologue:将LLM文本响应转化为交互式图表
大型语言模型(LLMs)如GPT-4因其生成各种用户查询的文本响应的能力而广受欢迎。加州大学圣地亚哥分校的研究人员开发了Graphologue,这是一种新颖的技术,旨在通过实时将基于文本的LLM响应转换为交互式图形图表来解决这些限制。Graphologue识别重要的文本组件,将它们组织成图形表示,并从LLM答案中创建节点链接图表,使复杂的关系和概念更容易理解。
项目地址:https://github.com/ucsd-creativitylab/graphologue
AiBase提要:
1. 📊 Graphologue改变了LLM与用户之间的互动方式,通过引入图形表示,使非线性对话成为可能。
2. 💡 这项技术通过将文本响应转化为图形图表,提供更清晰的可视化,帮助用户更好地理解复杂信息。
3. 🔄 用户可以积极互动,自定义图形表示,促进更具动态性和个性化的对话。
中国研究团队发布多视角数据集“FreeMan” 解决3D人体姿势估计局限性
中国的研究团队合作推出了名为“FreeMan”的大规模多视角数据集,旨在解决现有3D人体姿态估计数据集的局限性。该数据集包含来自8台智能手机的1100万帧视频,跨足了室内和室外环境,具备不同光照条件,提供了更真实的场景多样性。研究者通过自动化的标注流程生成了精确的3D标注,可用于多种任务。这一数据集的开源将推动人体建模、计算机视觉和人机交互领域的进步,弥合了受控实验室条件与真实场景之间的差距。
项目网址:https://wangjiongw.github.io/freeman/
AiBase提要:
📊 数据集多样性: "FreeMan"包含1100万帧视频,涵盖了室内、室外、不同场景和光照条件,为3D人体姿态估计提供更真实的数据多样性。
🧬 自动化标注: 研究团队开发了自动化标注流程,包括人体检测、2D关键点检测、3D姿态估计和网格标注,为多种任务提供了有价值的数据。
🌐 推动领域进步: "FreeMan"的开源将促进人体建模、计算机视觉和人机交互领域的进步,有望提高模型在真实场景中的性能。
📰🤖📢AI新鲜事
Runway推出镜头控制功能,提升AI视频生成
Runway最新功能为AI视频生成带来精准镜头控制,包括运动速度和方向的调整,不仅适用于图像生成视频,还能用于文本生成视频。此举是应对竞争对手Pikalabs的举措之一,两者在AI视频领域竞争激烈,各有优势。Runway侧重加强镜头控制,而Pikalabs致力于提升模型理解能力。AI视频生成领域发展迅猛,文章提到了两者的竞争情况以及未来的发展方向。
AiBase提要:
1. 📹 Runway推出精准镜头控制功能,可单独调整镜头运动和速度。
2. 💥 功能不仅适用于图像生成,还可用于文本生成视频。
3. ⚔️ Runway和Pikalabs竞争激烈,前者加强镜头控制,后者提升模型理解能力。AI视频领域竞争白热化。
中文在线与华为云签署合作协议 涉及大模型训练等
华为云与中文在线签署合作协议,重点合作领域包括大模型训练,双方将共同推动数字内容生态的发展。
AiBase提要:
- 🤝 合作协议签署: 华为云与中文在线正式签署合作协议,涉及公有云和AI等领域。
- 📚 数字内容合作: 华为云将优先承载中文在线的大模型训练内容。
- 🌐 业态多元化: 中文在线积极拓展多模态内容,包括文字生成漫画和动态漫画。
谷歌或于2027年自主生产AI芯片
谷歌计划自主生产Tensor处理单元(TPUs),摆脱博通依赖,以降低成本,每年可节省数十亿美元。
AiBase提要:
🔍1、谷歌考虑自主研发TPUs,不再依赖博通,旨在节省大量成本。
🔍2、与亚马逊和微软类似,谷歌希望自主研发AI芯片,预计每年可节省数十亿美元。
🔍3、决策受博通价格策略影响,但最终尚未确定,谷歌重点是降低芯片成本和减少对Nvidia的依赖。
新研究称,利用AI创作者比人类更环保 碳排放更少
最新研究发现,基于人工智能的系统如ChatGPT、BLOOM、DALL-E2和Midjourney在文学和艺术创作方面,与人类创作者相比,碳排放明显减少。
AiBase提要:
🌱 环保文创:AI创作者环保性能超越人类,碳排放显著降低。
🖋️ 文学艺术:ChatGPT、BLOOM等系统以小数千分之一的碳排放量完成创作。
🧐 质量比较:AI在一些任务上胜过人类,但在复杂任务中仍有局限。
好莱坞编剧就AI和薪酬问题达成“暂定”协议
好莱坞编剧工会(WGA)与电影电视制片和制作人联盟(AMPTP)达成了一项“暂定”协议,结束了长达数月的罢工,涵盖了2023年集体协议、薪酬和AI在剧本创作中的使用等问题,具体条款未公布。
AiBase提要:
🤝协议达成:好莱坞编剧工会(WGA)宣布与电影电视制片和制作人联盟(AMPTP)达成了一项“暂定”协议,结束了长达数月的罢工。
💰 涉及薪酬:协议覆盖了新的2023年集体协议,包括薪酬和AI在剧本创作中的使用等所有问题,但具体的协议条款尚未立即公布。
⏸ 罢工暂停:在工会董事会和会员批准之前,罢工将暂停,否则工会将继续罢工。
引入Bard后,谷歌Gmail工具生成了一些虚构的电子邮件
谷歌最近将其大型语言模型驱动的聊天机器人Bard引入了一系列产品,包括Gmail、Google Drive、Google Docs、Google Maps以及谷歌旗下的YouTube等。尽管谷歌试图将其新一代生成式AI与已有的产品线相结合,但似乎行动有些仓促。一名记者测试后发现,Bard AI制造了虚假的电子邮件,甚至错误地提供航班信息和虚构的列车信息。谷歌表示Bard扩展仍处于实验阶段,但这一产品引发了隐私担忧,也让人担心谷歌在AI领域可能会犯一些严重错误。
AiBase提要:
1. 😳 谷歌引入Bard,但AI制造虚假电子邮件,引发隐私担忧。
2. 🤖 Bard扩展试验阶段,错误提供航班和列车信息。
3. 🌐 谷歌将AI整合到多款产品中,但行动似乎仓促,引发问题。
Canalys预测:2027年将有60%的个人电脑兼容AI功能 出货量预计超过1.75亿台
Canalys预测,到2027年,60%的个人电脑将兼容AI功能,出货量预计将超过1.75亿台,兼容AI的个人电脑市场将迎来爆发式增长。
AiBase提要:
📈 趋势预测: Canalys预测2027年,60%的个人电脑将兼容AI功能,出货量预计将超过1.75亿台。
💻技术要求: Canalys指出,兼容AI的个人电脑必须配备可加快AI计算的芯片组或模块,包括高通的Hexagon张量加速器、苹果的神经引擎、英特尔的Movidius VPU和AMD的APU。
🚀 市场增长: 随着Windows操作系统和AI工具的应用,2025年和2026年兼容AI个人电脑市场有望实现爆发式增长,到2027年,出货量预计将超过1.75亿台,占总个人电脑出货量的60%,年均增长率达94%。
🤖📱💼AI应用
Meta计划推出AI聊天机器人服务「Gen AI Personas」
Meta计划推出名为「Gen AI Personas」的AI聊天机器人服务,旨在挽回社交媒体平台的用户流失问题。然而,Meta的新产品受到了来自Character.AI的直接竞争,后者已经成功吸引了数百万年轻用户。虽然Meta希望通过这一产品吸引年轻用户,但目前的反应复杂,不确定性较大。
AiBase提要:
🤖 Meta计划推出AI聊天机器人服务: Meta计划推出名为「Gen AI Personas」的AI聊天机器人服务,具备个人助理功能、不同性格的聊天机器人选择以及帮助用户更好表达的能力。
🥊 直接竞争Character.AI: 与Character.AI相比,Meta的新产品主打「虚拟角色聊天」,但目前的虚拟角色设定被批评为过时,引发了复杂的用户反应和疑虑。
📈 Character.AI的成功: Character.AI在短短两年内取得了令人印象深刻的成功,拥有超过1500万用户,主要吸引18-24岁的年轻用户,这使得Meta对其产生浓厚兴趣并尝试模仿。
Genmo AI秒杀Midjourney!3秒创作视频、图像和3D模型
Genmo是一款基于人工智能的创意产品,通过简单的语言描述,能够快速生成视频、图像和3D模型,为内容创作者、设计师和艺术家提供了强大的创作工具。
地址:https://www.genmo.ai/create/video
AiBase提要:
🚀 创意无限:Genmo利用人工智能技术,通过简单的文字描述,能够快速生成栩栩如生的视频,用户可以制作各类视频内容。
🎨 多样图像生成:除了视频,Genmo还提供强大的图像生成功能,用户只需输入文字描述,就能获得多样风格的高清图片。
🤖3D模型轻松制作:Genmo的3D生成功能让用户能够轻松创建各种3D模型,应用范围广泛,无需专业技能。
豆绘AI:专注为建筑设计从业者提供空间设计AI服务
豆绘AI平台是南京豆绘科技有限公司的产品,专注于为建筑室内园林景观从业者提供空间设计AI服务,包括AI绘图、AI设计助手和AI全景合成。它通过将AI技术与艺术领域相结合,协助用户提高绘画技巧,实现创作效率。
体验地址:https://www.douhuiai.com/
AiBase提要:
1. 🏢 专注建筑设计:豆绘AI平台为建筑室内园林景观从业者提供AI服务,致力于简化设计工作。
2. 🎨 多功能平台:平台拥有多项功能,包括AI绘图、AI设计助手和AI全景合成,不断更新改进。
3. 🚀 技术驱动发展:豆绘AI的长期目标是通过技术推动行业进步与效率提升,改变行业的发展格局,使从业者受益于科技的便利。
媲美激光雷达!百度发布纯视觉高阶智驾ANP3 Pro:全国都能开
快科技4月23日消息,百度Apollo昨日举办智能汽车产品发布会,围绕汽车智能化,发布了全新升级的驾舱图”系列产品。会上,百度Apollo正式发布了纯视觉城市领航辅助驾驶产品ANP3Pro,将高阶城市智驾的硬件成本拉入万元时代。而且ANP3Pro可支持15-25万元价格区间的新能源车型搭载,将加速高阶智驾走向大众市场”。站长网2024-04-23 14:45:360000小鹏大众,互换半条命
一个要技术,一个要规模7月26日晚,受小鹏与大众合作影响,小鹏股价持续冲高。截至当晚收盘,小鹏汽车报收20.22美元/股,市值回升至175亿。近年,大众集团为了解决自身软件领域的短板,开始推进“本地化合作”战略,先后与地平线与中科创新等国内技术厂商成立合资公司。此外,5月大众投资江淮231亿元,大众安徽成为一汽、上汽之外,第三个合资体系。毫无疑问,大众期待在中国市场打一场翻身仗。站长网2023-07-30 10:00:300000民调显示:58%美国成年人认为AI将在2024年选举中增加虚假信息
划重点:🔍近6成美国成年人认为人工智能工具将增加2024年总统选举中虚假和误导性信息的传播。🔍绝大多数人认为2024年总统候选人使用人工智能的方式是不好的,特别是制作虚假或误导性的媒体(图片或视频)。🔍民调显示,人们对人工智能生成的聊天机器人所提供的信息持怀疑态度,多数人不认为其可靠。站长网2023-11-03 15:54:130000创新性生成框架InsActor:用指令就能将人体运动模型转化为逼真的物理动画
**划重点:**1.🚶♂️利用最新的扩散式人体运动模型,InsActor能够生成基于高级人类指令的物理动画。2.🌐通过扩散策略进行灵活条件化运动规划,InsActor捕捉高级人类指令与角色动作之间的复杂关系。3.🎮在实验证明,InsActor在包括指令驱动运动生成和航点导向等任务上取得了最先进的结果。站长网2024-01-02 10:45:230000AI音乐生成器Beatoven.ai:适用于生成视频、播客和游戏背景音乐
**划重点:**1.🌐利用AI轻松生成适用于视频、播客和游戏的免费背景音乐。2.🎨创作者可选择音乐风格、剪辑内容,并在16种心情中选择,通过一键生成独特音轨。3.🚀应用广泛,适用于制作广告、YouTube、播客、游戏等多种创作场景。站长网2024-01-22 14:26:540001