AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📈💻💡大模型动态
谷歌推数学几何模型Alpha Geometry
【AiBase提要:】
🥇AlphaGeometry解决复杂几何问题
🧠语言神经模型和规则推理引擎结合
🧩运用高度并行计算寻找解决方案,实力达奥林匹克金牌得主
模型代码:https://github.com/google-deepmind/alphageometry
🤖📱💼AI应用
谷歌推AI搜索功能新功能 画个圈就能搜索
【AiBase提要:】
🔄 Google在与三星联合发布活动中宣布推出了一种名为“Circle to Search”的新搜索方式。
🌐 “Circle to Search”并非仅限于画圈手势,用户还可以通过其他手势方式启动搜索。
🔍 此功能使用户能够在任何应用中方便地进行搜索。
Runway更新Multi-Motion Brush运动笔刷功能
【AiBase提要:】
⭐️ 更新了Multi-MotionBrush运动笔刷功能
⭐️ 可同时控制5个物体运动路径
⭐️ 提供更多创作可能性,灵活控制图像动态效果
亚马逊APP测试新AI功能,不仅能解答产品问题还能逗你笑
【AiBase提要:】
💡 新AI功能能解答产品问题
🚀 功能目前处于测试阶段
🤖 也能回答更富创意的查询
Midjourney v6下周将补齐缩放平移及视频生成等功能
【AiBase提要:】
⭐ 下周将推出v6新版本
⭐ 引入缩放、平移和改变区域的能力
⭐ 风格一致性将得到提高
谷歌计划直接在 Bard 中添加 AI 图像生成器
【AiBase提要:】
🎨 Google Bard即将推出自家的图像生成器
🖼️ 用户可以通过Bard轻松创作令人惊艳的图像
🔒 图像生成器注重用户安全,配备安全功能确保使用体验
低成本AI音色克隆软件GPT-SoVITS 完美复刻HeyGen核心功能
【AiBase提要:】
⭐ 输入5秒声音样本即可转换文字为语音
⭐ 仅需1分钟训练数据实现模型微调
⭐ 支持多语言,集成多种辅助工具
项目地址:https://top.aibase.com/tool/gpt-sovits
PhotoMaker平替?一张照片InstantID几秒钟就能生成个性化图片
【AiBase提要:】
- InstantID是一项新技术
- 它可以几秒钟内生成不同风格的人物照片
- InstantID不需要复杂的训练或微调过程
项目地址:https://top.aibase.com/tool/instantid
Motion推新功能Video-to-Motion 可通过视频捕捉运动
【AiBase提要:】
⭐ 通过视频捕捉运动
⭐ 生成各种角色视频
⭐ 可以将视频中的角色替换为3D化身
体验地址:https://discord.gg/AapmuVJqxx
Whimsical:超好用的AI生成思维导图工具
【AiBase提要:】
⭐ 集白板和文档于一体的协作中心
⭐ 提供AI文本转流程图功能
⭐ 为团队会议和交流提供便利
体验地址:https://top.aibase.com/tool/whimsical
📰🤖📢AI新鲜事
三星发布AI手机Galaxy S24
【AiBase提要:】
🔄 支持谷歌"Circle to Search"功能,通过画圈即可获取图像、视频或文本信息。
🗣️支持13国语言,通话中即时翻译,解放出国语言障碍。
📝 可自动提取要点进行翻译、生成摘要,实现文件整理、思维导图制作、页面风格转化。
非营利组织计划推出Fairly Trained认证计划:确保AI模型生成内容不侵权
【AiBase提要:】
🤖 为那些证明已获得版权许可的AI模型提供认证标签,以防侵犯版权。
⚖️ 已批准并颁发了第一个名为“Licensed Model”认证的标签
🤖生成式AI版权争议一直存在,曾有艺术家和作者起诉多家AI公司侵犯版权
AI图形设计工具Recraft完成1200万美元A轮融资
【AiBase提要:】
🚀 Recraft专注于为专业人士提供图形设计生成工具
🤖 利用自有基础模型实现一致设计元素生成,已吸引30多万用户
🔧 Recraft融资支持构建自己的基础模型,旨在提供图形设计生成工具
CNET的发行商因AI丑闻而难以出售
【AiBase提要:】
🔸CNET没有充分披露AI生成文章
🔸人工智能丑闻导致网站声誉负面影响
🔸出售难题包括品牌声誉问题
👨💻💡🎯聚焦开发者
蚂蚁开源ATorch 、 Lookahead两项大模型技术
【AiBase提要:】
🔸 ATorch 是一个大模型分布式训练加速扩展库
🔸 Lookahead 是一个推理加速框架
🔸 ATorch已集成到蚂蚁集团的大模型训练开源产品 DLRover 中
开源地址:
https://github.com/intelligent-machine-learning/dlrover/atorch
https://github.com/alipay/PainlessInferenceAcceleration
LeCun曝多模态LLM重大缺陷 提出Interleaved-MoF显著增强视觉理解能力
【AiBase提要:】
💡 多模态大语言模型MLLM在视觉模式性能差距明显
💡 通过「交错特征混合」方法取得了10.7%的能力增强
💡 研究对于解决当前MLLM在视觉理解方面的缺陷问题具有重要意义
论文地址:https://arxiv.org/pdf/2401.06209.pdf
浙大提出SIFU模型 单图即可重建高质量3D人体模型
【AiBase提要:】
🧠 SIFU模型创新性使用单张图片进行3D人体模型重建
🌐 引入侧视图条件隐函数和扩散模型
💡 成功解决传统方法中的问题,提高了重建精度和效果
项目地址:https://top.aibase.com/tool/sifu
照片分享平台EyeEm被收购后 将用户照片用于训练人工智能模型
柏林照片分享社区EyeEm在去年被西班牙公司Freepik收购后,正在采取一项引发争议的举措-将用户上传的照片用于训练人工智能模型。EyeEm最近通过电子邮件通知用户,它正在其条款和条件中添加一项新条款,授予其"训练、开发和改进软件、算法和机器学习模型"的权利。用户有30天的时间可以选择退出,否则他们就同意这一用途。站长网2024-04-28 16:57:230000高效机器人学习软件SERL 25分钟学会一个任务
SERL(机器人强化学习软件套件)是一种特别高效的机器人学习软件,能够让机器人通过更少的尝试就能快速学会新任务。相比传统方法,SERL只需25到50分钟就能学会一个新任务,并且能够执行多种复杂任务,例如组装电路板、布线或者移动物体。站长网2024-01-31 12:01:390000通义千问72B模型登顶Hugging Face开源大模型预训练模型榜首
开源大模型社区HuggingFace公布了最新的开源大模型排行榜,通义千问在预训练模型类别中脱颖而出,占据榜首位置。HuggingFace开源大模型排行榜涵盖了全球上百个顶尖的开源大模型,并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面评估。在这些模型中,通义千问的Qwen-72B模型表现尤为出色,凭借其720亿个参数和73.6的综合得分,成为了所有预训练模型中的第一。站长网2023-12-11 09:35:180001OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺
近日,OpenAI、谷歌、微软和智谱AI等来自不同国家和地区的16家公司,在“人工智能首尔峰会”(AISeoulSummit)上共同签署了前沿人工智能安全承诺(FrontierAISafetyCommitments)。这一承诺标志着AI开发领域的一次重大进展,旨在加强AI技术的安全性和透明度。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-05-24 11:42:100000华为Mate60 RS非凡大师今日开启预售 售价11999元起
华为Mate60系列全线产品价格已经公布,其中华为Mate60RS非凡大师的起售价为11999元,华为Mate60Pro起售价为8999元,Mate60系列总共有四款产品供消费者选择。站长网2023-09-25 17:20:040000