AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
📰🤖📢AI新鲜事
OpenAI公布Sora技术报告:模拟世界、视频扩展等,强的离谱!
【AiBase提要:】
⭐️ Sora可以模拟物理世界中的人、动物和环境
⭐️ Sora具备无缝视频剪辑连接功能
⭐️ Sora可以生成不同大小、高分辨率的图像
报告地址:
https://openai.com/research/video-generation-models-as-world-simulators
Reddit与AI公司达成协议 内容支付“开采”AI培训数据
【AiBase提要:】
⭐️ 签署内容许可协议,价值6000万美元
⭐️ Reddit成为AI企业高质量训练数据来源
⭐️ 预计AI内容支付将提升Reddit整体估值
谷歌 Gemini1.5Pro 称 OpenAI Sora 生成的视频是假的
【AiBase提要:】
🤖 谷歌的新技术Gemini1.5Pro质疑Sora生成的视频真实性。
🌸 OpenAI的Sora是新文本转视频工具,展现复杂场景和角色。
💥 Gemini1.5Pro对视频不一致处提出质疑,怀疑其真实性。
AI视频之战升级:Runway、Stability积极应对OpenAI的Sora
【AiBase提要:】
⭐ Runway首席执行官回应OpenAI Sora,拉开视频AI竞赛序幕
⭐ 视频AI领域竞争激烈,Runway、Google、Stability AI推出新模型
⭐ Runway推出新功能,Sora功能和局限性尚不明确
魅族 All in AI 将停止传统「智能手机」新项目
【AiBase提要:】
⭐️ 魅族决定全力投入AI领域
⭐️ 魅族发布AI战略规划
⭐️ 魅族计划完成All in AI愿景
🤖📱💼AI应用
Meta首发AI视频模型V-JEPA 可用人类的理解方式看世界
【AiBase提要:】
⭐️ V-JEPA是非生成式模型,以人类的方式看世界。
⭐️ 自监督学习方法提高效率,适用于多任务。
⭐️ 利用抽象表示空间预测视频中缺失部分。
项目介绍网址:
https://ai.meta.com/blog/v-jepa-yann-lecun-ai-model-video-joint-embedding-predictive-architecture/
阿里开源万能图片生成工作台SCEPTER Studio 一键搞定AI绘图模型训练到推理
【AiBase提要:】
⭐ 不需代码,通过Web界面训练与微调模型
⭐ SCEPTER支持多种模型和微调方式
⭐ 提供多种训练数据和推理任务支持
传送门:https://github.com/modelscope/scepter
ComfyUI发布最新3D Pack 可快速将图片转换为3D模型
【AiBase提要:】
🌟 可快速将图片转换为3D模型
🌟 支持多种先进算法和多种格式导出
🌟 提供工具和工作流,使用户能够轻松处理和优化3D图像
产品入口:https://top.aibase.com/tool/comfyui-3d-pack
FaceFusion换脸软件更新至2.3.0版本
【AiBase提要:】
⭐️ 新版本采用了先进的68点面部标记模型
⭐️ 处理面部边缘情况更为有效
⭐️ 算法优化,提高面部交换效果
项目地址:https://top.aibase.com/tool/facefusion
谷歌推具备空间推理能力的视觉语言模型SpatialVLM
【AiBase提要:】
⭐ 视觉语言模型缺乏空间推理能力
⭐ 借鉴人类空间推理能力
⭐ 创新框架设计大规模空间VQA数据集
项目地址:https://top.aibase.com/tool/spatialvlm
Nomic AI 发布首个完全开源的长文本嵌入模型nomicembed-text-v1
【AiBase提要:】
⭐ Nomic AI发布完全开源的nomicembed-text-v1长文本嵌入模型
⭐ 该模型序列长度达8192,在短文本和长文本评估中表现优异
⭐ 模型开发过程强调审计性和可复制性,为AI社区树立新标准
项目入口:https://top.aibase.com/tool/contrastors
离开OpenAI待业的Karpathy推出大模型新项目minbpe
【AiBase提要:】
⭐ GitHub标星量一天内达到1.2k
⭐ minbpe项目为LLM中的BPE算法提供清晰代码
⭐ minbpe项目提供两个Tokenizer,实现训练和编码解码功能
项目地址:https://top.aibase.com/tool/minbpe
郭明錤:预期 Apple Intelligence 将推动苹果 iPhone 16 销售「可能过于乐观」
站长之家(ChinaZ.com)7月20日消息:根据苹果分析师郭明錤的说法,尽管有些报道声称苹果增加了iPhone16的订单,但实际情况似乎并非如此。郭明錤引用了苹果供应商台积电和大立光最近发布的财报作为佐证。站长网2024-07-21 06:29:510000给外国人听中国音乐,reaction视频怎么就火了?
外国人把自己看视频、听音乐的反应录下来,就能有人爱看?B站上无数的reaction视频让这个问题不言自明,有人看,且很多。早在几年前,B站上,@郭杰瑞、@不是柯桑德等一系列外国人UP主就凭借reaction视频走红。简单来说,reaction视频指的是创作者录制自己看视频做出反应的材料,对材料进行剪辑之后产生的视频。0001B站播放次数改为播放分钟 预计未来几周内完成更新
在昨晚的B站14周年庆直播中,B站董事长兼CEO陈睿宣布,B站播放次数将改为播放分钟,计划在未来几周内完成产品更新。陈睿解释称,播放分钟数比播放次数更能反映视频的质量,但统计播放分钟数的技术复杂度更高,成本更高。幸运的是,随着技术的成熟,现在B站已经有能力统计播放分钟数,替代B站播放次数作为外显数据,使用户有更好的参考。站长网2023-06-28 15:35:300000谁拿了腾讯巨额年终奖?
规则从未改变,一切都是业绩说了算。每到岁末年初,各大企业的年终奖都成为备受关注的话题。作为曾经巨额年终奖的领头羊公司,腾讯如今依然处在话题中央。近日有消息称,腾讯微信事业群年终奖最高30个月,游戏最高25个月,折合能有百万以上,一刹那间,全网都投去了羡慕的目光。0000一碗「番茄肥牛饭」的 AI 之旅
很多走在前沿的企业正在用AIGC辅助进行快速进化,并在用更短的时间进行弯道超车。比如这次我们要聊的这家餐饮公司,认识他们,可以先从一些数据开始:-关于小红书推广,使用AI数字员工后,至少能帮助节省1个运营人员、2个文案、3个设计,大大降低了成本。-关于新品研发,使用AI工具后,周期缩短的同时,判断也更精准了。之前仅做产品调研就要用一个月,现在几天就能快速决策和搞定。站长网2023-12-27 12:17:160000