首页站长资讯AI视野：英伟达推文生图模型ConsiStory；高度可控AI试衣OOTDiffusion；开发者推SoraWebui开源项目；Groq最快AI推理芯片成本推算高得离谱

19050

AI视野：英伟达推文生图模型ConsiStory；高度可控AI试衣OOTDiffusion；开发者推SoraWebui开源项目；Groq最快AI推理芯片成本推算高得离谱

站长网2024-02-21 16:12:170阅

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📱💼AI应用

英伟达推出免训练，可生成连贯图片的文生图模型ConsiStory

【AiBase提要:】

⭐️ 多数文生图模型使用随机采样模式，导致生成图像不连贯

⭐️ AI生成连贯图像连环画难度大，现有模型效果有限

⭐️ ConsiStory是一种免训练连贯文生图模型，可提升图像一致性和连贯性

论文地址:https://arxiv.org/abs/2402.03286

OOTDiffusion:一个高度可控的虚拟服装试穿AI工具

【AiBase提要:】

⭐️ 高度可控的虚拟服装试穿工具

⭐️ 按性别和体型自动调整，与模特身形贴合

⭐️ 支持半身模型和全身模型，试穿效果自然逼真

项目地址:https://top.aibase.com/tool/ootdiffusion

试玩地址:https://ootd.ibot.cn/

Sora还没正式开放有开发者已经搞出了SoraWebui

【AiBase提要:】

🚀 Sora因视频生成效果惊艳火爆出圈，但仍在内测阶段，多数用户只能看。

🛠️ SoraWebui开源项目提前研究，模拟API接口字段实现，为未来上线做准备。

🔗 开源项目支持Vercel一键部署，便于开发者使用和测试。

项目地址:https://top.aibase.com/tool/sorawebui

Adobe推类ChatGPT助手AI Assistant 并集成到PDF中

【AiBase提要:】

⭐ Adobe推出生成式AI助手AI Assistant

⭐ AI Assistant类似于ChatGPT，提供摘要、核心见解

⭐ 用户可通过AI生成引擎验证答案来源，提升Reader和Acrobat的商业价值

谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型

【AiBase提要:】

⭐️GoogleAI团队推出了ScreenAI，一个视觉语言模型。

⭐️ScreenAI在多个任务上表现出色，包括图形问答和摘要生成。

⭐️发布了三个新数据集，为未来研究提供更多资源。

论文地址:https://arxiv.org/abs/2402.04615

FreeControl:无需训练即可控制任何文本到图像扩散模型的空间控制方法

【AiBase提要:】

⭐️支持多个条件、架构和检查点同时进行控制生成

⭐️通过结构和外观引导，实现对生成图像的控制

⭐️展示了 T2I 扩散模型进行可控生成的定性结果

项目网址:https://top.aibase.com/tool/freecontrol

Comfyui更新Stable Cascade 7个模型整合为两个模型文件

【AiBase提要:】

⭐ 简化操作流程，用户只需选择C和B阶段的模型文件

⭐ 提高用户便利性，更新后生成的图片质量和美观度显著提升

⭐ 但更新带来伪影问题，期待官方修复，提升用户体验

项目地址:https://top.aibase.com/tool/stable-cascade

工作流及模型下载:https://comfyanonymous.github.io/ComfyUI_examples/stable_cascade/

Reddit大佬开发GLIGEN GUI 可指定图像大小、位置等

【AiBase提要:】

⭐️ GLIGEN GUI让用户可以控制生成图像的大小、位置和元素之间的空间关系

⭐️ GLIGEN可以根据自然语言描述生成高质量的图像

⭐️ GLIGEN提供灵活性和创造性，让用户创造惊人的图像作品

GLIGEN GUI项目地址:https://top.aibase.com/tool/gligen-gui

GLIGEN项目地址:https://top.aibase.com/tool/gligen

目标检测跟踪模型YOLOv8能快速识别和定位多个对象

【AiBase提要:】

⭐ YOLOv8是一种先进的目标检测跟踪模型

⭐ 支持多种格式部署，提高了模型的可用性和兼容性

⭐ 适用于多种领域，包括安防监控、医疗图像分析、自动驾驶等

项目地址:https://top.aibase.com/tool/yolov8

FiT:一种全新的Transformer架构图像生成模型分辨率和高宽比不受限制

【AiBase提要:】

⭐ FiT将图像视为一系列可变大小的图像块（Token）

⭐ FiT在处理不同分辨率的图像方面表现出卓越性能

⭐ FiT为生成不受限制的图像提供新的解决方案

项目地址:https://top.aibase.com/tool/fit

AnyGPT:实现任意模态输入到任意模态输出

【AiBase提要】

⚙️ 采用离散表示技术，实现多模态输入的统一处理

🔄 灵活性: 可稳定训练并轻松集成新模态

🎭 实用性: 生成大规模多模态指令数据集，实现任意多模态对话

产品入口:https://top.aibase.com/tool/any-gpt-

📰🤖📢AI新鲜事

Groq最快AI推理芯片成本推算高得离谱运行LIama2得1171万美元

【AiBase提要:】

⚙️ Groq公司推出AI芯片与英伟达GPU性价比对比

💰 运行LIama2所需成本高达1171万美元

🔎 分析师评估成本效益，Groq需面对英伟达竞争

项目入口:https://top.aibase.com/tool/groq

马斯克X平台与Midjourney正商谈合作致力于生成式AI项目

【AiBase提要】

⚙️ Elon Musk的X与Midjourney商谈合作，可能推动生成式人工智能项目。

🧠 可能合作在选举前识别X平台上的GenAI内容，推动人工智能技术应用。

🌐 Midjourney的生成式AI计划可根据自然语言描述生成图像，与其他项目类似。

B站UP主让AI修习春山学视频播放量近200万

【AiBase提要:】

⭐️ 央视春晚《上春山》引发热议，UP主让AI修习春山学。

⭐️ AI识别节目表演者面部情绪，实时显示在视频中。

⭐️ AI情绪识别技术或带来更多便利和乐趣。

AI视野英伟达推文生图模型ConsiStory高度可控AI试衣OOTDiffusion开发者推SoraWebui开源项目Groq最快AI推理芯片成本推算高得离谱

0000

评论列表

共(0)条

相关推荐

站长资讯
中国移动上线骚扰电话亲情防护功能：一人拉黑全家屏蔽
快科技6月15日消息，当今社会，诈骗套路层出不穷，老年人常常成为诈骗分子的下手对象。尤其是如今很多年轻人在外打拼，父母老人不在身边，非常容易落入电信诈骗的圈套。对此，中国移动高频骚扰电话防护”最新上线了亲情防护功能，支持将黑白名单、号段拦截等防护设置同步给其他家庭成员使用。家庭成员开通高频后，无需单独设置，防护功能同样生效。同时，自己还能收到家人的拦截通知，掌握全家的骚扰拦截情况。
站长网2024-06-16 14:09:42
0000
站长资讯
英伟达推出合规版RTX4090D显卡规格下调性能依旧强劲
12月29日，英伟达官网显示，英伟达面向中国市场推出了合规版旗舰显卡GeForceRTX4090D，这是英伟达应对美国新一轮芯片出口管制措施的产品。据悉，RTX4090D在原版RTX4090的基础上进行了微调，核心规格包括CUDA核心数从16384降至14592，SM单元从128降至114;GPU频率得到小幅提升，基础频率由2.23GHz提高到2.28GHz，加速频率提高到2.52GHz。
站长网2023-12-29 13:16:17
0000
美妆占领短剧，抖音淘宝必有一战
去年年初，喜欢看短剧的90后女生芊芊留意到，除了向用户收费，短剧同时在赚品牌们的钱:短剧中的品牌植入越来越多了。美妆护肤品牌，更成了短剧植入的常客。随着剧情推进，霸总的宠妻礼物是韩束红蛮腰礼盒，小姨送给初入职场的女主，第一份礼就是珀莱雅双抗精华，女主的设定成了丸美集团千金……韩束、丸美、珀莱雅、谷雨等越来越多国产美妆品牌开始试水短剧营销。
站长网站长资讯2024-03-14 14:20:34
0000
赵丽颖新妆爆火全网，“簪花生意”日入5万？
今生戴花，来世漂亮。一个小渔村，因为簪花的习俗，迎来了新机遇。数据显示，春节期间，以簪花闻名的蟳埔村接待游客36.1万人次，同比增长600%，旅游收入超过7000万元。这阵簪花潮也从春节一直火到了阳春三月，从线下旅拍，延伸出线上的“簪花生意”——在淘宝等电商平台上，仿“泉州簪花围”的饰品月销2000多件，按照108元的客单价算，有商家仅一个SKU就月入20万。
站长网站长资讯2024-03-08 13:36:37
0000
站长资讯
新AI工具DemoFusion：让用户在个人电脑上就能生成高分辨率图像
**划重点:**1.🚀DemoFusion技术让用户在普通电脑上生成高质量AI图像，无需昂贵的服务或超强计算机。2.🎨通过在低分辨率图像上添加更多细节和特征，DemoFusion技术实现了对开源AI模型的增强，至少提高16倍的细节和分辨率。3.💻该技术的创新之处在于，用户无需庞大的计算能力或对模型进行重新训练，突破了数字艺术和图像生成的门槛，为更广泛的人群提供了机会。
站长网2023-12-05 10:22:28
0000