今日AI:阿里欲推AI电商产品“绘蛙”;北大团队发起复现Sora计划;ComfyUI LayerDiffusion正式上线;AI工具DUSt3R GitHub爆火
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
阿里正在打造一款AI电商产品“绘蛙”
【AiBase提要:】
⭐该产品主要针对商家和达人,主要功能有AI文案生成和AI生图
⭐AI文案主要实现单商品种草、爆文改写、穿搭分享等
⭐AI生图主要将为淘宝、天猫商家和达人训练专属AI模特,打造网红同款商品图
北大团队发起复现Sora计划“OpenSora”AnimateDiff大神响应
【AiBase提要:】
🔍北大团队与兔展启动复现Sora计划,名为OpenSora,目前框架已搭建。
🌐OpenSora计划采用三部分组成的框架,包括VideoVQ-VAE、DenoisingDiffusionTransformer和ConditionEncoder。
🚀目前团队需要更多的数据和GPU进行训练,北大校友、AnimateDiff大神等积极响应。
项目地址:https://top.aibase.com/tool/open-sora-plan
ComfyUI透明图层生成插件LayerDiffusion正式上线
【AiBase提要:】
⭐不仅支持直接生成透明的图片元素,还可以在已有图片上生成与环境融合的透明图片。
⭐该插件主要包含两个节点,其中一个遮罩节点需要安装comfyui-tooling-nodes插件。
⭐目前只支持生成,图像质量可媲美真实的商业级透明素材
项目地址:https://top.aibase.com/tool/comfyui-layerdiffusion
ComfyUI-Mana-Nodes:一个好玩的ComfyUI插件可自定义字体动画
【AiBase提要:】
⭐️支持生成自定义程度极高的字体动画
⭐️用户可自定义背景颜色、字体颜色等
⭐️插件支持使用本地字体文件,提供更多创作可能性
项目地址:https://top.aibase.com/tool/comfyui-mana-nodes
D-IDAgents:1张照片 声音克隆定制数字分身
【AiBase提要:】
⭐1张照片 克隆你的声音 同步用户知识库就能定制专属数字分身
⭐数字人可以代替你进行视频对话,仅有2秒延迟,可用在视频开会等场景
⭐注册账号就可以体验,每个用户有200次免费使用的机会
体验地址:https://top.aibase.com/tool/d-id-agents
浙大&微软推出视频编辑框架UniEdit,无须训练、支持多种编辑场景
【AiBase提要:】
⭐ UniEdit在多种视频编辑场景中表现优异
⭐ UniEdit独特之处在于支持动作编辑和多种外观编辑场景
⭐ UniEdit利用时间自注意层和空间自注意层实现编辑视频动作和外观
项目主页:https://jianhongbai.github.io/UniEdit
AI漫画生成应用Dashtoon小说推文制作一大利器
【AiBase提要:】
🌟可一次性生成漫画,提供充分的编辑和自定义空间
🌟人物一致性处理成熟,具有高借鉴价值
🌟提高制作效率和质量,打开新的可能性
体验地址:https://top.aibase.com/tool/dashtoon
GitHub又火了一款AI工具 DUSt3R :2张图2秒钟3D 重建
【AiBase提要:】
⭐️ DUSt3R 在单目 / 多视图深度估计以及相对位姿估计任务上表现出色。
⭐️ 作者团队采用全新方法,无需相机校准或视点姿势先验信息,能在任意图像中完成3D 重建。
⭐️ DUSt3R 在多项任务上取得了 SOTA 的成绩,展现出其强大功能和适用性。
论文https://arxiv.org/abs/2312.14132
项目入口:https://top.aibase.com/tool/dust3r
什么值得买AI购物助手“小值”上线 提供全网购物推荐和建议
【AiBase提要:】
⭐️ 自主研发的AI购物助手“小值”在“什么值得买”App上线
⭐️ 提供实时优惠价格和商品口碑评价,帮助用户做出明智购物决策
⭐️ 通过意图识别模型推荐符合用户需求的优质商品,带来全新购物体验
📰🤖📢AI新鲜事
Meta AI提出MobileLLM:为在移动设备上部署LLM提供新思路
【AiBase提要:】
⭐️ LLM在移动设备上遇到挑战
⭐️ MobileLLM通过深窄结构设计和参数优化提高性能表现
⭐️ 打开了在资源受限环境下应用LLM的新可能性
谷歌Chrome在搜索栏中增加更多搜索功能
【AiBase提要:】
⚙️ Chrome应用中与购物相关的搜索会展示更广泛的产品和购物类别的图片缩略图。
📶 即使在网络连接较差的情况下,Chrome会通过“改进的设备端功能”提供搜索建议。
🔍 搜索框中显示基于之前搜索记录的建议查询内容,为用户提供更智能、个性化的搜索体验。
港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!
【AiBase提要:】
⭐ 港大和NYU的研究团队合作开发V-IRL平台,将真实世界地图等信息融入虚拟环境,提供AI Agent更真实生活体验。
⭐ V-IRL平台模拟真实环境,使智能体执行复杂任务,并可在不同任务间协作解决问题。
⭐ 研究人员基于V-IRL进行了地点识别、视觉问答和导航等测试,展示AI在现实世界的广泛应用潜力。
项目地址:https://github.com/VIRL-Platform/VIRL
清华、哈工大提出OneBit方法:可把大模型压缩到1bit 保持83% 性能
【AiBase提要:】
⭐ 清华大学和哈尔滨工业大学联合发布论文,将尝试1bit 量化,突破了2bit 的限制;
⭐ 新方法结合1bit 层结构、基于 SVID 的参数初始化和量化感知训练。
⭐1bit 量化突破了2bit 障碍,为在移动设备上高效运行大模型提供新可能性。
论文地址:https://arxiv.org/pdf/2402.11295.pdf
2023特斯拉股东大会召开 马斯克:正在开发两款全新车型
特斯拉CEO马斯克今日凌晨在2023年的股东大会上宣布,特斯拉正在开发两款全新的车型,并计划达到超过500万辆的产量,同时,马斯克还放出了新车型的轮廓。此外,他还表示,预测ModelY将成为2023年全球销量最高的汽车。但4680电池开始大规模生产还需要时间,特斯拉的生产目标是达到每年2000万辆。在会上,马斯克还强调,他不会卸任特斯拉CEO。站长网2023-05-17 08:32:140000微信灰度测试小绿书功能 看一看或新增“图文”板块
站长之家(ChinaZ.com)8月1日消息:微信近日在“发现-看一看”版块中,灰度测试新图文板块。部分用户的页面顶部新增了“图文”。图文板块类似于小红书,所有用户都可以在此发布。同时,在页面的底部还有“”号发布图文按钮,使得用户可以更加方便地发布自己的图文内容。总的来说,这一改进将使得微信的用户体验更加丰富和多样化,同时也能够更好地满足用户的需求。站长网2023-08-01 09:02:540000五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈
屹立不倒的Transformer迎来了一个强劲竞争者。在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的半壁江山」。但在AI大模型领域,Transformer架构不能这么形容,因为它几乎撑起了「整个江山」。站长网2023-12-05 14:15:180001研究人员推出深度学习模型RECAST 改进地震预测
文章概要:-研究人员推出名为RECAST的新模型,利用更大的数据集改进地震预测准确性。-RECAST模型相较当前标准模型ETAS拥有更高灵活性,可处理更大规模数据集。-研究人员在NVIDIAGPU工作站上训练该模型,以提升地震预测的状态。最近,来自加州伯克利分校、圣克鲁斯分校以及慕尼黑工业大学的研究人员发表论文,阐述了一种崭新的模型,将深度学习引入地震预测领域。站长网2023-10-08 15:09:320000挑战谷歌的 Neeva 搜索引擎将于 6 月 2 日关闭:重点转向 AI 领域
搜索引擎初创公司Neeva宣布关闭其搜索引擎,这家公司曾经是有机会挑战Google搜索统治地位的希望之一。Neeva宣布将重心转向人工智能,据TheInformation报道,Neeva很可能被Snowflake收购,但对于失败的原因,Neeva相信他们的搜索引擎无法打动用户。站长网2023-05-22 17:44:530000