AI日报:豆包视频生成模型正式发布;腾讯推“养老”机器人小五;中科大推人像视频编辑神器PortraitGen
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、字节跳动豆包视频生成模型正式发布 支持多镜头视频一致性生成
豆包·视频生成模型今日发布!火山引擎总裁谭待表示,豆包·视频生成模型在视频生成方面具有多项先进性能,包括精准的语义理解、多动作多主体交互、强大的动态效果和一致性多镜头生成能力。
【AiBase 提要:】
🆕 新发布的豆包视频生成模型具备多种视频生成能力,主要有PixelDance和Seaweed两个版本。
🎥 模型支持多镜头切换和动态效果,保持一致性。
🌈 模型支持包括黑白、3D动画、2D动画、国画等多种风格,适配不同屏幕比例。
2、OpenAI 官方账号被黑,竟推广虚假加密货币!
近日,OpenAI 官方账号在社交平台遭到黑客攻击,发布虚假加密货币广告。这一事件提醒我们网络安全问题严峻,需保持警惕,避免成为诈骗受害者。
【AiBase提要:】
🚨 虚假广告事件:OpenAI 官方账号遭黑客攻击,发布虚假加密货币广告。
🔒 网络安全警示:用户需提高警惕,不轻信陌生链接和信息,避免上当受骗。
💻 删除推文回应:推广加密货币推文已删除,账号回应评论关闭,提醒大家注意恶意链接。
3、腾讯Robotics X实验室推出人居环境机器人“小五”
腾讯Robotics X实验室最新推出的人居环境机器人“小五”具有革新性设计和智能控制系统,成为家庭中不可或缺的助手。其灵活性和感知能力使其能够在多种环境中自如移动并理解人类需求。未来,这一创新产品将引领智能家居行业发展,智能机器人将成为日常生活中必不可少的成员。
【AiBase提要:】
🤖 小五采用四腿轮足复合结构,具备快速移动速度和对不平整地形的适应能力。
🧠 小五智能控制系统通过全局定位和建图系统实时感知周围环境,避开障碍物实现安全自主运动。
🏡 小五具备先进的多模态人机交互技术,能理解并预测人类行动需求,成为家庭生活中灵活、高效的工作伙伴。
4、中国科学技术大学出品!AI人像视频编辑工具PortraitGen:风格化、换衣、修改光照通通搞定
中国科学技术大学的研究团队推出了名为PortraitGen的创新视频编辑工具,可实现多模态的人像编辑,编辑速度快,编辑效果流畅。特别的面部意识编辑模块提升表情质量,保留个性化特征,展现强大潜力。
【AiBase提要:】
✨ PortraitGen仅需30分钟将2D人像视频编辑为4D高斯场,支持每秒100帧的流畅播放。
🎨 提供多种编辑方式,包括文本驱动和图像驱动,视频风格变换更加灵活多样。
💡 通过面部意识编辑模块,提升表情质量,并保留用户个性化的面部特征。
详情链接:https://top.aibase.com/tool/portraitgen
5、PDF一键转播客!PDF2Audio让文档开口说话
在信息爆炸的时代,PDF2Audio是一款开源工具,利用人工智能技术将PDF文档转换为多种音频形式,如播客、讲座或摘要,为用户提供全新的信息获取方式。工具设计考虑用户需求,支持批量处理文档,提供多种内容模板,个性化选择GPT模型和语音风格,提供草稿编辑和反馈迭代功能。采用Gradio接口,降低使用门槛,让更多用户享受AI便利。
【AiBase提要:】
🔊 PDF2Audio将PDF文档转换为多种音频形式,如播客、讲座或摘要,提供全新信息获取方式。
📚 工具设计考虑用户需求,支持批量处理文档,提供多种内容模板,包括播客、讲座和摘要。
🎵 用户可个性化选择GPT模型和语音风格,提供草稿编辑和反馈迭代功能,确保生成内容质量。
详情链接:https://huggingface.co/spaces/lamm-mit/PDF2Audio
6、强的离谱!Leonardo AI推图片高清放大神器
Leonardo AI推出的高清放大功能速度更快更便宜,效果惊人。通过X博主James Yeung和另一位博主Dogan Ural的分享视频,展示了夜景下建筑和家具的清晰放大效果,甚至可以看到沙发上抱枕的纹路。值得一试!
【AiBase提要:】
🔍 Leonardo AI推出高清放大功能,速度更快更便宜。
🏙️ 夜景下建筑在高清放大后变得更清晰,甚至可以看到大楼里的人和家具。
🛋️ 放大64倍后的图像效果惊人,可以清楚地看到沙发上抱枕的纹路。
详情链接:https://top.aibase.com/tool/leonardoai
7、AI巨头暗战升级:Claude3.5Opus、Gemini2蓄势待发
人工智能领域正迎来一场激烈的较量,Anthropic公司融资动向引发广泛关注。Claude3.5Opus和Gemini2的竞争备受瞩目,AI革命即将迎来新阶段。
【AiBase提要:】
🔥 Anthropic公司寻求新一轮融资,估值目标高达300亿到400亿美元,投资者对AI技术发展信心十足。
💰 Anthropic已获得76亿美元投资,亚马逊是最大投资方,融资将使其成为AI初创公司估值王。
⚙️ Anthropic加速推出最新版本Claude3.5Opus,Gemini阵营也蓄势待发,AI行业竞争激烈。
8、OpenAI CEO预测:人类可能在“几千天”内实现超级智能 AI
Sam Altman在个人博客中展望AI驱动的技术进步和全球繁荣未来,预测超级智能AI可能在未来十年内出现。他强调降低计算成本和基础设施建设的重要性,称当前时代为“智能时代”,预言AI将带来深远社会变革。
【AiBase提要:】
🌐 超级智能AI可能在未来几千天内实现,OpenAI全力以赴
🔍 降低计算成本和基础设施建设是推动AI普及的关键
🚀 当前时代被称为“智能时代”,将带来深远的社会变革
9、OpenAI 重磅发布多语言 AI 数据集,推动全球语言平等
OpenAI 最近推出了名为“多语言大规模多任务语言理解”(MMMLU)数据集,旨在评估人工智能在14种语言中的表现。该举措填补了AI研究中对低资源语言的关注空白,为全球用户提供更好的AI互动体验。同时,OpenAI还推出了OpenAI Academy项目,支持低收入国家AI开发者的成长和发展。
【AiBase提要:】
🌍 OpenAI发布MMMLU数据集,涵盖14种语言,推动多语言AI的研究和应用。
💡 数据集由专业人类翻译制作,确保高准确性,尤其适用于高要求的行业。
🧑🏫 OpenAI Academy推出,提供支持以促进低收入国家AI开发者的成长和发展。
详情链接:https://huggingface.co/datasets/openai/MMMLU
10、OpenAI推出AI学院计划
OpenAI推出OpenAI Academy,旨在投资开发者和组织,利用人工智能解决难题,促进经济增长。该计划支持本地AI人才培养,促进全球卫生、农业、教育和金融等行业的发展。
【AiBase提要:】
🌟 OpenAI推出AI学院,全球范围内投资AI开发者和组织
🚀 提供培训、API积分和社区建设,促进经济增长和技术创新
🌐 支持本地AI人才培养,促进全球卫生、农业、教育和金融等行业的发展
11、研究发现,AI语音模型在归纳推理中表现出色,在演绎任务中“碰壁”
这篇文章深入探讨了大型语言模型在归纳推理和演绎推理方面的挑战。研究结果显示,模型在归纳推理方面表现优秀,准确率接近100%,但在演绎推理,特别是处理反事实任务时遇到困难。另一项研究则考察了Transformer模型在逻辑推理能力方面的表现。
【AiBase提要:】
🌟 归纳推理方面表现出色,准确率接近100%
🧩 演绎推理仍然是挑战,尤其在处理反事实任务时
🔍 Transformer模型在组合任务中获得隐含推论能力,但泛化能力有限
小米SU7 Ultra 原型车征战纽北纪录片《6′46″874》发布
小米公司创始人雷军今日宣布,小米SU7UltraPrototype(原型车)在纽博格林北环赛道(纽北)的挑战中取得了历史性成就,并发布了一部名为《6′46″874》的46分钟纪录片,记录了这一过程。雷军透露,为了这次纽北挑战,小米团队进行了超过两年的准备,并在焦急等待了一个月后,由于赛道湿滑,仅获得了一次跑圈的机会。0000全面超越LLaMA2,月下载量超三百万,国产开源大模型如何成为新晋顶流?
图源备注:图片由AI生成,图片授权服务商Midjourney回想两个月前,LLaMA2的开源,曾以一己之力改变了大模型领域的竞争格局。站长网2023-09-17 10:32:520001科大讯飞:讯飞星火大模型数学能力方面结果优于ChatGPT
近日,科大讯飞表示,根据系统、科学的评测体系结果,讯飞星火认知大模型数学能力方面结果优于ChatGPT,针对大模型普遍存在的问题,星火大模型有明确的升级迭代里程碑计划,6月9日,星火大模型的数学能力还会再上一个新的台阶。站长网2023-05-26 08:46:490000《2023微信视频号年中发展报告》发布,视频号拐点何时到来?
今年上半年,视频号交出了一份还不错的答卷。2023年8月16日,腾讯发布的2023年第二季度财报指出:“视频号总用户使用时长同比几乎翻倍,2023年第二季度视频号广告收入超过人民币30亿元。”回望过去两年,微信视频号的变化可谓翻天覆地。站长网2023-08-30 16:28:030000百川智能大模型API将于9月20日上线
在今日举办的2023腾讯全球数字生态大会上,百川智能联合创始人、总裁洪涛透露,百川智能的大模型API将于9月20日上线,届时客户可以直接申请调用。此前,百川智能在9月6日举行的大模型发布会上正式开源了Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat以及其4bit量化版本,并且免费可商用。站长网2023-09-08 12:11:390001