AI日报:阿里推多角色一致性框架UniPortrait;腾讯混元上线三款ControlNet插件;苹果研发桌面机器人;Claude推提示词缓存功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、阿里团队推新框架UniPortrait:支持多角色一致性和风格参考
阿里巴巴集团研究团队发布了UniPortrait框架,专注于人像图像的个性化处理,实现单角色一致性、多角色一致性和风格参考。该框架具备高度逼真的面部特征保留,支持广泛的面部编辑功能,用户可通过自由文本描述生成图像。UniPortrait为人像个性化定制带来新可能性,提升图像生成质量,为未来应用场景铺平道路。
【AiBase提要:】
🌟UniPortrait框架专注于单一和多重身份的图像个性化处理,保持高质量的面部特征。
✍️框架由ID嵌入模块和ID路由模块组成,通过两阶段训练方案实现高效定制。
🚀UniPortrait支持自由文本描述和多样化布局生成,为人像个性化定制提供丰富可能性。
详情链接:https://top.aibase.com/tool/uniportrait
2、可精准控图!腾讯混元文生图开源模型上线三款ControlNet插件
腾讯混元文生图大模型(HunyuanDiT)近日发布了三款新的可控制插件ControlNet,进一步扩展了其应用场景,为开发者和创作者提供更精准的图片生成和更大自由度的创作能力。
【AiBase提要:】
🔍 Tile插件实现超清放大,适合对细节有极致追求的场景。
🎨 Inpainting插件填充涂抹部分,实现背景更换、人物主体改变等效果。
🖌️ Lineart插件创作真人、动漫和建筑图片,适用于建筑效果图生成和手稿上色。
详情链接:https://dit.hunyuan.tencent.com/
3、苹果正在研发一款神奇的桌面机器人,预计2026年面世!
苹果公司正秘密研发一款结合 iPad 显示屏和机械臂的桌面机器人,将彻底改变家庭生活。这款设备功能多样,可控制智能家居、进行视频通话和监控家庭安全,内置 Siri 语音助手,操作便捷。预计在2026年或2027年发布,售价约1000美元。
【AiBase提要:】
📱 苹果正在研发一款结合 iPad 显示屏和机械臂的桌面机器人,功能多样。
🛋️ 这款设备可以控制智能家居、进行视频通话和监控家庭安全,预计在2026年或2027年发布。
🗣️ 内置 Siri 语音助手,支持语音命令,让用户操作更便捷。
4、Claude推出提示缓存功能 允许开发人员在API缓存常用上下文
Anthropic公司推出的提示缓存功能在提高AI使用效率和降低成本方面具有潜在的重要意义,然而其实际效果还需市场检验。该功能允许用户存储和重复使用特定上下文信息,为商业AI应用带来效率提升。
【AiBase提要:】
🔑 提示缓存功能可降低企业AI成本并提升性能,但实际效果需市场验证。
🚀 功能适用于长时间对话、文档处理等场景,有望带来高达90%的成本降低和响应速度提升。
💡 其他AI公司也在探索提高模型效率和降低成本的方法,市场对功能表现持谨慎态度。
5、Grok2图像生成无所不能!原来用的是FLUX.1模型
在这个AI日新月异的时代,马斯克推出了AI助手Grok的新功能,让图片生成变得自由而充满争议。Black Forest Labs开发的FLUX.1模型引领着AI界的创新,但也引发了版权和虚假信息等问题。马斯克的选择反映了对信息自由的态度,但也可能带来信息灾难。在AI快速发展的时代,我们需要提高辨识能力,谨慎应对这种无拘无束的创造力。
【AiBase提要:】
🌟 Grok2 推出新图像生成功能,生成图片无过滤机制,质量上甚至超过了Midjourney和OpenAI的产品
💰 Grok2 用的是Black Forest Labs 开发的FLUX.1 模型
⚠️ 不受约束的图像生成可能导致假新闻和版权问题。
6、HeadGAP:三张视角图片即可生成逼真3D虚拟人
研究团队开发的"HeadGAP"方法引起了广泛关注,通过少量照片快速创建高仿真3D虚拟人头部形象,实现个性化定制与优化。该方法结合高斯点网络和动态建模技术,展示出色的渲染质量和动画表现,适用于多种应用场景。
【AiBase提要:】
🎨 通过"HeadGAP"方法,仅需少量照片即可创建逼真的3D虚拟人头部形象。
🚀 采用高斯点网络和动态建模技术,实现头像个性化定制与优化。
🖼️ 实验结果显示,生成的头像在渲染质量和动画表现上都非常出色,适用于多种应用场景。
详情链接:https://top.aibase.com/tool/headgap
7、联想发布2025财年Q1财报 杨元庆:混合式AI是巨大机遇
联想集团在2024/25财年第一财季业绩表现亮眼,营收增长20%,净利润同比增长65%。杨元庆强调混合式人工智能的愿景,认为是未来发展的重要方向。公司全球市场份额接近23%,AI PC出货量环比增长228%。
【AiBase提要:】
📈 营收增长20%,净利润同比增长65%。
🖥 全球市场份额接近23%,高端产品线占比31.6%。
🤖 混合式人工智能是未来发展重要方向,为个人和企业打造智能体。
8、OpenAI投的代码神器Cursor叛变,程序员却拍手叫好,疯狂买单
在科技圈,OpenAI投资的代码生成工具Cursor突然叛变,引起轰动。程序员们纷纷支持并购买Cursor,导致OpenAI失去统治地位。这一事件揭示了投资协议松散的问题。
【AiBase提要:】
🤯 程序员们疯狂支持Cursor,愿意支付双倍价格,使其成为新宠。
👀 Cursor支持Claude-3.5-Sonnet和多行编辑功能,提高代码编写效率。
💥 Claude-3.5-Sonnet在Livebench基准测试中稳坐榜首,超越GPT-4和ChatGPT。
详情链接:https://www.cursor.com/blog/openai-fund
9、Nature惊人内幕:无数论文被偷偷高价出售喂AI
学术出版商将研究论文出售给AI开发公司,引发科研界争议。研究数据用于训练AI模型,作者无知情。大型语言模型需大量数据训练,学术论文成宝贵资源。购买高质量数据集趋势上升,合作与保密并存。版权诉讼引发关注,研究者意见不一。
【AiBase提要:】
🔍 学术出版商将研究论文出售给AI开发公司,引发科研界争议。
💡 大型语言模型需大量数据训练,学术论文成宝贵资源。
⚖️ 版权诉讼引发关注,研究者意见不一。
详情链接:
https://www.nature.com/articles/d41586-024-02599-9
https://arxiv.org/pdf/2112.03570
字节复旦团队提出meta prompts 扩散模型图像理解力刷新SOTA
过去一年扩散模型风头正劲,彻底改变了文生图领域!那么,扩散模型能否处理视觉感知任务?字节跳动和复旦大学技术团队在最新研究中提出了一个简单有效的方案。扩散模型在生成高清晰度图像方面显示出了卓越的能力,这一成就得益于其在大规模图像-文本对上的预训练。团队提出了一种利用扩散模型处理视觉感知任务的方案,通过引入可学习的元提示到预训练的扩散模型中,以提取适合特定感知任务的特征。站长网2024-01-16 17:16:250000罗永浩称车企一把手们是笑面虎:吐槽北京车展CEO互捧
罗永浩对北京车展车企CEO间亲密互动的真实性提出质疑,这一观点迅速在网络上引发了热烈讨论。在2024年的北京车展上,小米的雷军和360的周鸿祎无疑成为了备受瞩目的焦点人物。不过,除了他们之外,其他车企的领军人物,如比亚迪的王传福、理想汽车的李想、蔚来的李斌、小鹏汽车的何小鹏等也悉数登场,共同为这场行业盛宴增添了不少色彩。站长网2024-04-29 18:42:060000苹果 App Store 官方微博账号正式上线
站长之家(ChinaZ.com)1月11日消息:苹果的AppStore今日正式开通了官方微博账号,并发布了首条消息:“很高兴,在微博遇见你!做好准备,发现更多令你心动的App和游戏。关注我们,让AppStore为你带来更多新鲜内容。”这一动态引发了众多网友的关注和热议。站长网2024-01-11 10:57:340000微信视频号、小程序支持数字人民币支付
微信宣布,即日起,微信用户可以在数字人民币APP内的钱包快付功能下开通“微信支付”,选择将任意运营机构——如微众银行(微信支付)——的钱包推送到微信支付,就可在视频号、小程序场景内支持数字人民币的商家中使用数字人民币进行交易。目前,支持数字人民币支付的小程序商户已覆盖出行、餐饮、零售、便民服务等众多场景。微信表示,下一步更多小程序商家也将陆续支持使用数字人民币。站长网2023-04-26 10:26:290000直播间的东西为什么越来越贵了?
直播带货兴起之时,消费者的核心诉求在于“低价”。如今,消费者有了新的诉求,不只是低价,更要“质优”,这也使消费者逐渐回归传统电商平台。2024年已经开启,为春节购置年货皆已提上日程。从过往经验来看,尽管直播间特别是超头直播间,大多会开设生鲜、零食等专场促销,但陆玖商业评论从身边朋友了解到,越来越多人正开始重新回到传统电商平台上,或是线下场景。这是一个不容忽视的消费转变。站长网2024-01-18 15:57:350000