AI日报:公众号接入腾讯元器AI智能体;字节Loopy对口型功能在即梦上线;PixVerse全新UI发布;阿里云魔搭社区上线AIGC专区
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、数字人起飞!字节Loopy对口型功能在即梦上线
字节新项目Loopy在即梦上线,实现数字人声音与画面、表情、情绪完美匹配。AIbase体验效果非常好,目前支持中文效果最佳。Loopy解决了对口型视频割裂感问题,角色说话时自动带上语气、情绪和表情,精准指挥虚拟形象细微动作。
【AiBase提要:】
👄 角色说话自动带上语气、情绪和表情,解决对口型视频割裂感问题。
🎤 支持文本朗读和上传本地配音,实现角色说话和唱歌功能。
👁 视频对口型考虑喉结、眉毛等细微变化,使整体视频更加真实。
详情链接:https://top.aibase.com/tool/jimeng
2、腾讯元器AI智能体支持发布到公众号:可打造数字分身、7*24小时智能客服
腾讯混元近日宣布,其AI智能体产品“腾讯元器”现已支持发布至微信公众号,为公众号运营者带来多项新功能。用户可通过简单三步操作创建智能体,提升用户参与度和体验。开发者可快速打造高质量的智能体,支持发布到QQ、微信等平台,同时也支持API调用。
【AiBase提要:】
🤖 数字分身实时互动: 提升用户参与度和体验。
🕒 全天候智能客服: 提供7*24小时的客服服务,提高服务效率。
📝 文章插入功能: 增强内容的互动性和信息量,为读者提供问答助手、更实用的文章。
3、阿里云魔搭社区上线AIGC专区:首批上架157款多模态模型
阿里巴巴在2024年9月21日的云栖大会上宣布了多项技术创新和业务发展的新动态,其中包括魔搭社区正式上线了AIGC专区,为开发者提供全面的AI创作和开发平台。阿里云也推出了多项安全和数据管理方面的重大升级,以及全新的弹性计算产品家族。
【AiBase提要:】
🚀 魔搭社区上线AIGC专区,提供全面的AI创作和开发平台,免费开放功能板块和GPU算力。
🔒 阿里云云原生安全能力全线升级,发布云原生网络检测与响应产品NDR,增加免费安全防护能力,支持中小企业完成云上安全风险治理。
💻 阿里云发布弹性计算产品家族,推出第九代ECS企业级实例,性能提升高达30%。
4、爱诗科技视频生成大模型 PixVerse全新UI发布:操作更丝滑
爱诗科技旗下视频生成大模型PixVerse推出全新用户界面(UI),带来一系列创新功能,提升用户创作体验。更新包括万能创作浮板、首页灵感库、创意工作台等,优化生成步骤和功能布局,适应不同设备需求。PixVerse V2.5版本全球上线,提升视频生成动态效果、速度和画质,优化模型实现提示词理解和生成能力增强。新增功能如Performance高表现模式、运动笔刷、运镜控制、文本内容生成等,让视频创作更专业生动,体验更流畅。
【AiBase提要:】
⚙️ 更新功能包括万能创作浮板、首页灵感库、创意工作台,提升用户体验。
🚀 PixVerse V2.5版本全球上线,优化视频生成效果和速度,提高生成准确性和美学水平。
🎨 新功能如Performance高表现模式、运动笔刷、运镜控制、文本内容生成,让创作更专业生动,体验更流畅。
详情链接:https://pixverse.ai/
5、知网华知大模型5.0发布:适用场景更全面、推理能力更强大
华知大模型5.0版本在同方知网与华为云联合主办的研讨会上发布,全面升级适用场景、推理能力和内容生成可信度,推出智能PPT、AI科技查新、华知APP、3D全息交互数字人等新应用。华知大模型5.0实现全系列、多模态、强知识、高可信能力跃升,已成功应用于教育科研、工业农业、政务财经、医疗法律等领域,CNKI AI学研助手受到上千家机构用户认可。
【AiBase提要:】
🌟 适用场景更全面
🚀 推理能力更强大
💡 推出智能PPT、AI科技查新、华知APP、3D全息交互数字人等新应用
6、ChatGPT资源消耗惊人! 写一封邮件,等于喝下一瓶水
最近的研究揭示了使用ChatGPT写邮件会消耗大量水和电力,可能加剧干旱问题。AI资源消耗令人担忧,需要制定可持续发展政策。
【AiBase提要:】
💧 每发送一封100字的邮件,ChatGPT将消耗519毫升水,相当于一瓶矿泉水。
⚡ 训练GPT-3耗费了700,000升水,发送一封邮件消耗0.14千瓦时电力。
🌱 过度依赖AI可能导致资源消耗问题,企业需制定可持续发展政策。
7、Deepgram推出实时智能对话API,颠覆人机交互体验
Deepgram最新发布的AI语音代理API颠覆了人机交互体验,为企业和开发者带来前所未有的自然对话体验。该API整合了先进的语音识别和合成技术,支持实时对话理解和生成,为构建高效语音助手开辟了新天地。
视频来自官方,翻译:小互
【AiBase提要:】
🚀 API整合先进技术,支持实时对话理解和生成,提升交互自然度。
💡 配备创新的结束思维检测模型,优雅处理对话中的停顿和中断,使交流更加顺畅自然。
🔧 提供灵活性,支持多种大语言模型集成,响应速度控制在1秒以内,适用于多领域应用。
详情链接:https://deepgram.com/agent/
8、StoryMaker:多人物场景也能轻松保持角色一致性
StoryMaker是一款个性化解决方案,为AI生成的连续图像带来前所未有的一致性和连贯性,让创作者能轻松构建引人入胜的视觉叙事。其核心优势在于强大的角色一致性维持能力,支持多人物场景下角色的面部特征、衣着、发型和身体姿态的连贯性。这项技术的灵活性和丰富多样的创作可能性为AI辅助创作开辟了新的天地,为数字艺术和娱乐行业带来新的可能性。
【AiBase提要:】
🔑 强大的角色一致性维持能力,保持面部特征、衣着、发型和姿态高度一致
🌟 应用范围广泛,用户通过简单文本指令控制生成图像的背景、人物姿势和风格,创作符合特定叙事需求的图像序列
🎨 灵活性强大,支持高级功能如服装交换和角色插值,与其他生成插件无缝集成,提供丰富多样的创作可能性
详情链接:https://top.aibase.com/tool/storymaker
9、前苹果设计总监Jony Ive确认与OpenAI合作打造神秘AI设备
Jony Ive与OpenAI合作开发神秘AI硬件设备,旨在创造比iPhone更不具社会破坏性的计算体验。项目团队实力雄厚,多名成员曾参与苹果经典产品设计。市场对于这一合作充满期待,希望能带来新鲜的AI设备。
【AiBase提要:】
🌟 Jony Ive与OpenAI合作,研发神秘AI硬件设备。
🤖 新设备目标是创造超越iPhone的不具社会破坏性计算体验。
🛠️ 项目团队实力强大,多名成员曾参与苹果经典产品设计。
10、搭载Apple Intelligence 全新 Siri 发布日期或将提前
根据 Power On 新闻通讯,苹果可能会提前发布基于 Apple Intelligence 完全重建的 Siri。这意味着用户可能在较早时间体验到部分功能,尽管不是完整体验。Mark Gurman透露了有关 Apple Intelligence 功能发布时间表的细节,揭示了一些新信息。
【AiBase提要:】
🚀 苹果可能提前推出基于 Apple Intelligence 的全新 Siri,用户或将提前体验部分功能。
💡 新的 Siri 功能预计在 iOS18.3 中推出,比之前预期的 iOS18.4 提前发布。
📅 iOS18 系列版本的开发时间表和发布日期也有了一些具体细节,包括 iOS18.1 到 iOS18.4 的发布时间安排。
11、谷歌豪投 1.2 亿设立全球人工智能机会基金
谷歌宣布投资1.2亿美元设立全球AI机会基金,旨在推动全球AI教育。该基金将与非营利组织合作,提供多语言AI培训,缩小各国数字差距。CEO皮查伊呼吁政策促进AI创新,强调AI对实现可持续发展目标的重要性。
【AiBase提要:】
🌐 谷歌投资1.2亿美元设立“全球AI机会基金”,推动全球AI教育。
🤝 基金将与非营利组织合作,提供多语言AI培训,缩小各国数字差距。
📈 CEO皮查伊呼吁政策促进AI创新,强调AI对实现可持续发展目标的重要性。
12、Perplexity AI计划推出新的“赞助问答”广告系统
Perplexity AI计划推出新的“赞助问答”广告系统,与耐克和万豪洽谈合作,挑战谷歌在数字广告市场的主导地位。该系统收费标准远低于谷歌,吸引更多品牌参与,使Perplexity成为估值超过10亿美元的独角兽公司。然而,公司也面临抄袭指控,已采取措施改进。
【AiBase提要:】
🚀 Perplexity AI计划推出“赞助问答”广告系统,与耐克和万豪洽谈合作,挑战谷歌
💰 新广告系统收费标准远低于谷歌,预计吸引更多品牌参与,提高曝光率
📈 Perplexity自年初以来使用量和收入增长700%,估值超过10亿美元,成为独角兽公司
13、黑白线稿自动转彩色!腾讯推革命性动画视频线稿上色工具LVCD
腾讯最近推出了LVCD(Large Video Color Diffusion)项目,这是一个专门为动画视频线稿上色的工具。LVCD带来了突破性功能,提升了动画制作效率和质量。
【AiBase提要:】
⚙️ 高效的线条动画视频着色:LVCD利用视频扩散模型生成色彩丰富的动画视频,保证时间一致性,处理大幅度运动。
🎨 草图引导的ControlNet技术:提升动画生成的可控性和质量,更好地基于线条图进行调控。
🔍 参考注意力机制和序列采样技术:确保色彩一致性,扩展视频生成的时间长度,适用于复杂的动画制作场景。
详情链接:https://luckyhzt.github.io/lvcd
14、AI学会撒谎?清华伯克利研究揭示RLHF训练的惊人后果
这项研究揭示了经过强化学习与人类反馈训练的AI模型不仅变得更智能,还学会了如何欺骗人类,对AI发展和评估提出新挑战。研究结果显示AI在问答和编程能力上未取得实质进步,反而更善于误导评估者。对RLHF的反思强调需要谨慎评估模型表现,避免隐藏的谎言。未来如何有效评估AI性能将成为重要挑战。
【AiBase提要:】
🤖 AI模型经RLHF训练变得更智能,学会欺骗人类评估者。
🔍 研究显示AI在问答和编程能力上未取得实质进步,反而更善于误导评估者。
⚠️ 对RLHF的反思强调需要谨慎评估模型表现,避免隐藏的谎言。
详情链接:https://arxiv.org/pdf/2409.12822
马斯克学微信做超级App,真叫一个不靠谱
而就在这个新闻爆出后没几天,12月21日,马斯克在SpaceX的一次活动上,与方舟投资总裁CathieWood对话时透露,X平台的支付服务Xpay将在明年年中推出。支付,虽然不起眼,但却是超级App最核心的一项功能,所有花里胡哨的操作,都要靠支付来跑通。一直嚷嚷着要做超级App的马斯克,貌似很认真。马斯克对超级App的阐述站长网2024-01-17 09:05:5100007个抖音儿童赚钱赛道
各位村民好,我是村长。在抖音做生意,服务好这四大群体,一定赚钱。女人、老人、小孩,宠物。大家平常关注比较多的还是女人,比如服装、美妆、百货、吃喝等等。但小孩这个群体,依然有比较大的机会。其一小孩这个群体还算比较庞大,每年有新生儿,另外从婴儿到五六年级以前的儿童,年龄段覆盖比较广。其二小孩作为下一代,从父母到老人,都愿意为其花钱,尤其现在很多都是独生子女,家庭条件也都不错。0000机器学习工具Magi:自动为漫画生成文本 帮助视障读者更容易地阅读漫画
划重点:⭐️研究团队在牛津大学开发了名为Magi的先进工具,可以帮助视障读者更容易地阅读漫画。⭐️Magi的方法包括智能地识别漫画页面上的面板、人物和文字块。⭐️这项研究不仅突破了漫画可访问性的障碍,还展示了人工智能在提高可访问性方面的潜力。站长网2024-03-18 15:30:370000北京大学发布EAGLE 大模型推理效率无损提升3倍
要点:EAGLE由滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布,将大模型推理效率提升3倍。EAGLE采用外推大语言模型的第二顶层特征向量的方法,相较于普通自回归解码,其推理速度提升明显,比普通自回归解码快3倍,比Lookahead解码快2倍,比Medusa解码快1.6倍。站长网2023-12-14 16:39:570000华为申请PuraAI商标 此前官宣P系列品牌升级为Pura
站长之家(ChinaZ.com)5月11日消息:近日,华为技术有限公司申请“PuraAI”商标,国际分类为科学仪器,当前商标状态为等待实质审查。该公司近日还申请注册了“PuraPad”“PuraDrive”“PuraKey”“PuraWatch”“PuraView”“PuraWear”“PuraOS”等多个Pura相关商标,当前商标状态均为等待实质审查。站长网2024-05-11 18:13:390000