AI日报:AMD向英伟达亮剑推出最强AI芯片;斯坦福AI团队承认抄袭国产大模型;suno将推“哼歌”功能;昆仑万维开源2千亿稀疏大模型天工MoE
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、挑战英伟达!AMD亮出旗下最强AI芯片锐龙AI 300系列
AMD在Computex科技大会上展示了最新的AI芯片产品线,展示了Zen5架构的Ryzen99950X处理器和锐龙AI300系列APU,挑战英伟达在AI领域的地位。
【AiBase提要:】
🚀 英伟达和AMD在Computex科技大会上展示最新技术成果,AMD展示了Zen5架构的Ryzen99950X处理器和锐龙AI300系列APU。
💥 苏姿丰强调Zen5架构的Ryzen CPU具有更宽的CPU引擎指令窗口,支持完整的AVX512吞吐量,提升AI性能一倍。
🔥 AMD的锐龙AI300系列APU采用XDNA AI NPU,算力高达50TOPS,超越了其他竞争对手的性能标准。
2、Suno又要推新功能!随便哼两句它就能帮你创作成歌曲了
Suno最近宣布推出令人激动的新功能,可以通过哼唱声音生成完整的歌曲,展示出人工智能在音乐创作领域的无限可能。Suno的创新举措为音乐创作注入新活力,让用户通过日常声音创作音乐作品,开拓了音乐创作的新可能性。期待Suno未来带来更多令人惊叹的创新。
【AiBase提要:】
🎵 哼唱生成歌曲:Suno推出新功能,用户哼唱一小段即可创作完整歌曲,音乐与原声融合自然
🎶 日常声音转化音乐:Suno新功能能将任何声音转化为音乐作品,展示技术强大创意潜力
🎤 激发音乐创作活力:Suno的创新举措为音乐创作领域注入新活力,开拓音乐创作新可能性
详情链接:https://top.aibase.com/tool/suno-ai
3、昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
昆仑万维公司开源了具有里程碑意义的稀疏大型语言模型Skywork-MoE,该模型性能强劲,推理成本大幅降低,为大规模密集型LLM带来有效解决方案。
【AiBase提要:】
🌟 开源和免费商用: Skywork-MoE模型权重、技术报告完全开源,免费商用,推动人工智能领域发展。
💡 推理成本降低: Skywork-MoE在保持性能的同时大幅降低了推理成本,解决大规模数据处理挑战。
🚀 技术创新和性能优势: Skywork-MoE是首个支持单台4090服务器推理的开源千亿MoE大模型,性能强劲且参数量大。
详情链接:https://top.aibase.com/tool/skywork-moe
4、Adobe 发布 VideoGigaGAN 超分辨率视频模型
Adobe 和研究人员合作推出 VideoGigaGAN,兼顾帧率连贯性和细节丰富的超分辨率视频模型。该模型解决了超分辨率视频模型的时间连贯性和细节丰富性问题,为视频处理领域带来了重要突破。
【AiBase提要:】
⭐ VideoGigaGAN 基于 GigaGAN 模型开发,添加时序卷积、自注意力层和光流引导模块,解决超分辨率视频模型的时间连贯性和细节丰富性问题。
⭐ VideoGigaGAN 利用时序卷积捕捉视频帧之间的时间依赖性,自注意力层提取空间细节和纹理信息,光流引导模块保持特征的空间一致性,生成清晰的超分辨率视频。
⭐ VideoGigaGAN 具有视频超分辨率、时域一致性、丰富细节处理、抗锯齿处理等功能特点,适用于多种视频处理场景。
详情链接:https://top.aibase.com/tool/videogigagan
5、斯坦福大学AI研究团队被指抄袭清华系模型
这篇文章报道了斯坦福大学AI研究团队的Llama3-V开源模型因抄袭清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V2.5而引发的风波。事件曝光后,斯坦福团队的两位主要作者向面壁智能团队和公众道歉,并承诺撤下所有Llama3-V模型。
【AiBase提要:】
🔍 斯坦福大学AI研究团队的Llama3-V模型被指抄袭清华系明星创业公司面壁智能开发的MiniCPM-Llama3-V2.5模型。
🚨 网友发现Llama3-V模型的结构和代码与“小钢炮”模型高度相似,引发广泛关注和热议。
🔗 面壁智能团队证实抄袭事实,斯坦福团队的两位主要作者在社交平台上公开道歉并承诺撤下所有Llama3-V模型。
详情链接:https://top.aibase.com/tool/minicpm-llama3-v-2-5
6、多模态模型再进化,已学会看图玩扑克、算“12点”
本文介绍了UC伯克利等高校研究团队提出的新强化学习框架RL4VLM,成功提升了多模态大模型在决策任务上的表现。该模型通过强化学习微调学会了看图玩扑克、算“12点”等任务,超越了GPT-4v。研究团队由多位重量级人物组成,成果已在GitHub上开源。
【AiBase提要:】
🧠 新强化学习框架RL4VLM成功提升多模态大模型决策能力,超越GPT-4v。
🌟 研究团队由重量级人物组成,包括图灵奖得主LeCun等。
💡 RL4VLM采用强化学习微调,直接使用环境奖励信息,赋予多模态模型自主决策能力。
论文地址:https://arxiv.org/abs/2405.10292
项目地址:https://top.aibase.com/tool/rl4vlm
7、OpenAI衍生公司人工智能模型 让机器人像人一样思考、学习
本文介绍了OpenAI衍生公司Covariant推出的人工智能模型,使机器人具备像人类一样思考、学习的能力。该模型结合推理与物理能力,具有多模态输入、自主执行任务、反馈与交互、适应性等特点,代表了机器人学习和自动化技术的重大进步。
【AiBase提要:】
🤖 Covariant AI系统融合了推理技能和物理灵巧性,开发了RFM-1模型处理多种输入类型,使机器人更全面地理解任务需求。
🧠 机器人可以自主执行任务,根据反馈和交互请求建议,适应环境而不依赖特定任务代码,简化了编程过程。
🔗 Covariant的AI系统赋予机器人视觉识别、思考、行动和学习的能力,提高了自动化的灵活性和效率。
8、比特币矿工向人工智能企业投入数百万美元,寻求数十亿美元回报
比特币矿工Core Scientific与云公司CoreWeave达成35亿美元合作,拓展人工智能业务,迎接人工智能领域需求增长。这一举动将带来丰厚收入,推动矿工企业转型应对比特币减半带来的挑战。
【AiBase提要:】
⭐ 比特币矿工Core Scientific与CoreWeave达成35亿美元合作,拓展人工智能业务。
⭐ 人工智能领域需求巨大,将提供丰厚收入,推动矿工企业转型。
⭐ 比特币矿工们在AI市场中寻求多样化收入,应对减半带来的挑战。
9、IBM 推出高效 LLM 基准测试方法,计算成本降低99%
IBM研究推出了一种创新的LLM基准测试方法,通过微型化基准测试大幅降低评估LLM所需的时间和金钱成本,引起AI社区关注,有望推动人工智能模型评估领域的快速发展。
【AiBase提要:】
⭐️ 创新的LLM基准测试方法降低计算成本99%。
⭐️ 高效方法利用微型化基准测试,减少评估LLM时间和金钱成本。
⭐️ 引起AI社区关注,被广泛采用,有望推动人工智能模型评估领域发展。
10、麦肯锡全球调查:生成式AI采用开始产生价值
AI的广泛应用正在改变组织的运营方式,但也带来了一些负面影响。麦肯锡的调查显示,人工智能在营销、销售等领域带来成本降低和收入增长,但不准确性和安全性仍是关注点。高绩效者在GenAI采用中更具挑战性,但通过最佳实践取得成功。
【AiBase提要:】
⭐️ 65%的组织正在定期使用AI,GenAI在多个领域得到广泛应用,带来成本降低和收入增长。
⭐️ 44%的受访者表示从GenAI使用中经历了负面影响,主要包括不准确性、网络安全和知识产权侵权等风险。
⭐️ 高绩效者在GenAI采用中更有挑战性,但通过增加风险认识、建立明确流程和培养员工技能取得成功。
小米 Civi 3「Pro 级新潮流旗舰」正式发布:售价 2499 元起
小米Civi3手机于今天下午正式发布,新机采用了「双生双色」同色调拼配,半色调设计,拥有前置仿生双眸,号称「后置承袭旗舰光学实力」。站长网2023-05-25 15:04:250000爱荷华州学区使用 ChatGPT 决定禁书清单
本文概要:1.爱荷华州梅森城社区学区使用ChatGPT选出了19本被禁书籍,这款工具认为这些书籍包含性内容。2.学区表示他们无法逐一阅读每本书籍,因此决定使用ChatGPT来帮助决定哪些书籍应该被禁止。3.不过使用ChatGPT决策的方法存在问题,因为该工具答案有时会因用户的查询方式而产生矛盾。站长网2023-08-16 10:30:380000微软发布AI天气预测模型 能精准预报未来30天天气
微软Start团队近日宣布,他们开发出了一种全新的数据驱动AI天气预测模型,该模型能够准确预测未来30天的天气情况。这一研究成果不仅在预报准确率上取得了显著提升,同时在计算效率上也实现了巨大突破。论文地址:https://arxiv.org/pdf/2403.15598站长网2024-05-06 21:09:230000李开复称AI大模型是绝不能错过的机遇 将重构人类工作
在5月28日的中关村论坛上,创新工场的董事长和首席执行官李开复发表了讲话。他表示,AI大模型是一个绝不可错过的历史机遇,因为这代表着有史以来规模最大的一个平台革命。这个机遇比Windows和Android的影响还要大十倍,它将推动每一个应用程序的变革,并将重构人类的工作。与此同时,很多重复性的劳动也将被取代。站长网2023-05-29 10:42:020000D-ID Agents:1张照片+声音克隆定制数字分身 能代替你进行视频对话
D-ID上线数字分身功能AgentsBeta版。这是一种新颖的数字分身技术,可以利用用户的照片和克隆声音创建一个虚拟人,并将用户的知识库同步到这个虚拟人身上。通过这种方式,用户可以进行视频对话,实现仅有2秒延迟的效果。体验地址:https://top.aibase.com/tool/d-id-agents然而,一些用户反映在尝试使用该技术时,系统一直提示不在线,无法体验到真实的效果。站长网2024-03-04 17:25:040000