登陆注册

T

  • T-Rex2:文字来描述、框选就能识别图片中的目标物体

    >划重点:⭐T-Rex2是一种通用目标检测技术,通过视觉和文本提示协同作用,实现对各种对象的识别。没有开源,有API可以使用。⭐T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器,实现了最先进的性能。⭐T-Rex2除了通过文字来描述要检测的物体,还支持直接在图里框出一个样例,系统自动识别出剩余的目标。
    站长网2024-03-26 17:15:45
    0002
  • T​Salesforce 领投! Together AI 最新融资估值飙升至12.5亿美元

    据路透社报道,TogetherAI宣布在最新一轮融资中筹集了1.06亿美元,由SalesforceVentures领投,使该公司估值达到12.5亿美元。此次融资还得到了CoatueManagement、LuxCapital和EmergenceCapital等现有投资者的支持。图源备注:图片由AI生成,图片授权服务商Midjourney
    站长网2024-03-14 14:40:39
    0000
  • 李飞飞携斯坦福联袂谷歌推出比肩Pika的视频生成模型W.A.L.T

    要点:谷歌与李飞飞的斯坦福团队合作推出了基于Transformer的视频生成模型W.A.L.T,在图像和视频生成领域取得了媲美Gen-2的逼真效果。W.A.L.T采用因果编码器和基于窗口注意的变压器架构,将图像和视频压缩到共享潜在空间,实现联合训练和生成,为自然语言提示生成逼真且时间一致的视频。
    站长网2023-12-12 14:17:47
    0000