AI日报:对标GPT-4o!开源大模型Moshi登场;Google Pixel 9新增多个AI功能;ElevenLabs发布消音神器VOICE ISOLATOR
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、对标GPT-4o!开源大模型Moshi震撼登场
Moshi是一款多模态大模型,具备听、说能力,未来可能展示看的能力。Kyutai实验室发布Moshi是对AI技术的大胆尝试,展现了开源精神。用户体验方面,响应速度快,语言支持有待提高,使用便捷。Moshi的拟人化语气让对话更自然流畅,未来的迭代优化将提升回答准确度。对教育行业将产生深远影响,为学生提供循环讲解。期待更多类似产品出现,支持更多地方语言,让AI技术贴近人们生活。
【AiBase提要:】
💡多模态能力:Moshi可以听取人的语音提问后进行实时推理回答,而且它的语音模式已经开放,比GPT-4o的秋天上线要快得多。
💡无区域限制:无论你身在何处,都能使用Moshi。
💡手机移动端支持:虽然对普通话支持不太好,但用英语提问完全没问题。
💡即将开源:Kyutai计划很快开源Moshi,届时将公布代码、模型权重和论文。
详情链接:https://top.aibase.com/tool/moshi-chatMoshi
2、Google Pixel 9新功能曝光:AI加持,类似微软Recall的智能体验即将到来!
谷歌Pixel 9系列即将推出一系列令人惊艳的AI新功能,包括Add Me、Studio和Pixel Screenshots。这些功能将提升用户拍照体验、激发创意表达并注重隐私保护,展现了谷歌对AI技术的深刻理解和创新应用。期待Pixel 9系列为数字生活带来更多可能性。
【AiBase提要:】
✨ Add Me功能:捕捉每个人最佳表情,融合不同照片中的人物表情,确保每个人以最佳状态出现。
🎨 Studio功能:集成到截图编辑器应用中,让用户创建和重新混合贴纸,释放无限创意。
🔒 Pixel Screenshots功能:提供隐私保护解决方案,只在用户手动截图时工作,通过本地AI处理保障用户隐私安全。
3、AI搜索Perplexity AI发布 Pro Search:提升问题解决与代码执行能力
Perplexity近日宣布对其Pro Search服务进行重大升级,新版Pro Search不仅能处理更复杂的查询,还具备多步推理能力,为用户提供更深入、全面的研究支持。这一升级展示了AI在信息检索和问题解决领域的巨大潜力,为未来的智能研究工具设立了新的标准。
【AiBase提要:】
🔍 复杂查询处理能力提升:新版Pro Search能执行高级数学和编程计算,提供更全面的调研结果。
🧠 多步推理功能:Pro Search现在能进行多步推理,逐步实现目标,并根据发现采取智能行动。
🔢 增强的数学和编程能力:通过整合Wolfram|Alpha引擎,Pro Search在解决复杂数学问题方面的准确性和速度得到显著提升。
4、Cloudflare 推出一键阻止AI机器人网络爬虫的新方法
Cloudflare最近推出了一种新方法,可以阻止AI机器人抓取网站内容并未经允许使用数据训练机器学习模型。这项举措旨在保护内容创作者在互联网上的安全。
【AiBase提要:】
⭐️ Cloudflare 推出一键封堵 AI 网络爬虫功能,确保网站内容不被未经允许的 AI 机器人使用。
⭐️ 生成式 AI 被视为盗窃源头,各大公司纷纷采取措施阻止 AI 机器人未经授权地擅用内容。
⭐️ Cloudflare 利用机器学习模型识别和阻止伪装的网络爬虫,保障内容创作者在互联网上的权益。
5、ElevenLabs发布消音神器VOICE ISOLATOR
ElevenLabs推出的VOICE ISOLATOR是一款让音频爱好者们兴奋不已的新产品,能够消除背景噪音、提取清晰对话,让音频制作更专业化。该工具简单易用,提供多项功能如Extract vocals、音效生成等,极大地提升了音频制作效率和创意空间。ElevenLabs持续创新,为用户带来全新的音频制作可能性。
【AiBase提要:】
🎵 消除背景噪音、提取清晰对话,让音频制作更专业化
🔊 提供Extract vocals功能,增强人声,清除不需要的背景噪音
🎶 音效生成功能让用户无需费时寻找音效,提供更多创意空间
详情链接:https://elevenlabs.io/voice-isolator
6、商汤科技发布可控人物视频生成算法模型Vimi
商汤科技推出了具有里程碑意义的Vimi可控人物视频生成大模型,展现了AI技术对复杂场景的高度适应性和商汤在视频生成技术上的深厚积累。Vimi具有卓越的可控性,超越传统技术,精准操控人物表情和肢体动作,同时处理细节精细,支持沉浸式视觉体验,稳定生成高质量视频。
【AiBase提要:】
✨ Vimi实现了前所未有的视频生成灵活性,能够接收多元化输入并精准操控人物生成目标动作匹配的视频。
🌟 Vimi突破了传统图片表情控制技术的局限,实现细腻的表情和肢体动作操控,生成符合逻辑且生动自然的视频内容。
💡 Vimi稳定生成长达1分钟的高质量视频,保持画面质量如一,展现出非凡的实力和连贯性。
详情链接:https://www.wjx.cn/vm/mhSxfGv.aspx
7、AI跳舞也疯狂?MimicMotion发布新技术 可根据任何动作引导生成任意长度的视频
MimicMotion推出的新技术“High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance”引起了业界轰动。该技术利用置信度感知姿势引导生成高质量人体运动视频,提升视频质量,手部精炼机制增强细节,灵活生成任意长度视频,应用广泛前景广阔,将在视频制作和动作捕捉领域扮演关键角色。
【AiBase提要:】
🌟 利用置信度感知姿势引导生成高质量人体运动视频
🔍 手动精炼机制专注于细节打磨,特别增强手部训练
🎥 灵活生成任意长度视频,应用前景广泛
详情链接:https://top.aibase.com/tool/mimicmotion
8、ChatGPT Mac客户端存在明文存储对话的安全问题
OpenAI最近推出的ChatGPT Mac客户端存在安全漏洞,对话以明文形式存储在计算机上,可能被恶意行为者访问。公司已发布更新加密对话记录以提高安全性。
【AiBase提要:】
🔒 对话以纯文本形式存储在计算机上,存在安全隐患。
🚫 恶意行为者或应用程序可轻松读取ChatGPT对话及其中数据。
🔑 OpenAI发布更新,加密聊天记录以提升安全性。
9、谷歌新举措:将为使用AI生成的政治广告披露信息
谷歌正在采取新举措简化广告商披露政治广告是否包含人工智能生成内容的流程。广告商选择 “修改或合成内容” 复选框后,谷歌将自动生成披露信息,提高广告透明度和可信度。
【AiBase提要:】
✨ 谷歌简化广告商披露政治广告是否包含AI生成内容的流程,提高广告透明度。
🔍 广告商选择“修改或合成内容”复选框后,系统自动生成披露信息,减轻广告商负担。
💡 披露信息将在移动设备信息流、YouTube Shorts和流媒体广告中显示,其他格式广告需广告商提供披露信息。
10、固执还是恪守?任天堂反对在游戏中使用生成式AI
任天堂总裁古川俊太郎对游戏中使用生成式人工智能发表了立场,担心侵犯知识产权,强调保持独特性。他认为任天堂拥有足够的创造力和经验,不需要依赖生成式人工智能工具。生成式AI制作的内容缺乏个性化,与任天堂注重原创性和创造力不符。未来,任天堂将谨慎对待生成式人工智能的使用,依靠团队内部的创造力和经验。
【AiBase提要:】
⭐ 任天堂反对在游戏中使用生成式人工智能,担心侵犯知识产权。
⭐ 古川强调任天堂有足够的创造力和经验创造独特游戏体验。
⭐ 生成式人工智能制作的内容缺乏个性化,任天堂注重原创性与创造力。
雷军模仿者“雷民”改名 已删除所有与模仿雷军相关视频
站长之家(ChinaZ.com)5月20日消息:一个曾经以模仿雷军而备受关注的账号“雷民”,近日该账号已正式更名为“民子”,并删除了所有与模仿雷军相关的视频内容。自5月2日起,“雷民”的短视频便以高度还原雷军形象为特色,从衣着到发型,再到神态,都努力呈现出与雷军本人极高的相似度。其中一条视频的背景音乐更是选用了雷军的经典“Areyouok?”,让人忍俊不禁。站长网2024-05-20 10:39:170000英伟达文本转3D AI工具Masterpiece X亮相
Nvidia与3D软件开发商MasterpieceStudio合作发布了MasterpieceX,旨在通过使3D建模像使用MidJourney或StableDiffusion创建二维图像一样简单,革新了3D建模领域。MasterpieceStudio在官方声明中表示,“多年来,我们一直在努力创建直观的尖端3D工具,同时也使越来越多的人能够开始创建3D。生成式AI实现了全新的可能性。”站长网2023-10-18 21:12:470000网信办整治自媒体制造信息陷阱问题 集中整治自媒体造热点蹭热点
据网信中国公众号消息,中央网信办宣布部署开展2024年“清朗”系列专项行动。网信办表示,近年来,中央网信办坚持以清朗网络空间为目标,以人民根本利益为出发点和落脚点,持续开展“清朗”系列专项行动,集中整治网上突出问题乱象,推动网络生态持续向好。2024年“清朗”系列专项行动将紧紧围绕人民群众的新期待新要求,全面覆盖网上重点领域环节,着力研究破解网络生态新问题新风险,重点开展10项整治任务。0000谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA
【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。最近,来自谷歌团队的研究人员提出了一种通用视频编码器——VideoPrism。它能够通过单一冻结模型,处理各种视频理解任务。站长网2024-02-26 14:05:590000雷军回应网友催更小米14:别着急 这次产品很很很强
高通即将在10月25日至26日举行2023年的骁龙峰会,届时将正式推出全新的移动平台骁龙8Gen3。按照以往的惯例,小米14很有可能成为这款新平台的首发机型。甚至有消息称,小米会在高通的发布会上之前就开始预热。网友们也纷纷在雷军的微博上留言,催促小米14的发布。对此,雷军今天在微博上做出了回应,表示大家不要着急,这次的新产品非常强大。这是雷军首次针对小米14的发布表态,给人留下了深刻的印象。站长网2023-10-16 15:05:210000