AI日报:阿里推新多模态大模型Ovis;Kyutai开源实时语音对话模型Moshi;Apple Intelligence测试版现已开放
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、阿里国际推出最新多模态大模型 Ovis,看菜品就能提供烹饪步骤
阿里国际AI团队发布了多模态大模型Ovis,为各行业带来新机遇。Ovis具备强大的图像理解和数据处理能力,可处理文本、图像等多种数据,表现出优秀综合实力。其在OpenCompass评测中获得综合排名第一,超越竞争者。Ovis采用Apache2.0开源协议,开发者可自由使用与改进。
【AiBase提要:】
🌟 Ovis是多模态大模型,处理文本和图像等多种数据,展现综合能力。
🚀 Ovis在OpenCompass评测中获得综合排名第一,超越竞争者。
🔓 Ovis采用Apache2.0开源协议,模型和代码在GitHub上公开,开发者可自由使用与改进。
2、革命性AI对话系统Moshi问世:机器也能说人话了?
在数字化时代,Kyutai实验室开发的全双工语音对话系统Moshi正在颠覆传统语音对话系统,实现更自然、更流畅的人机对话体验。Moshi结合文本语言模型、神经音频编解码器和多流音频语言模型,展现出卓越的性能表现。同时,Moshi注重安全性,确保系统不生成有害内容,保护用户隐私。这标志着人机互动方式的重大革新,展示了未来对话系统的无限可能。
【AiBase提要:】
🌟 Moshi是全双工语音对话系统,将对话视为语音到语音的生成过程,解决了传统语音对话系统的问题。
🔑 Moshi的核心技术包括Helium文本语言模型、Mimi神经音频编解码器和多流音频语言模型,实现了对话中的重叠、打断和插入语处理。
💡 Moshi具备内心独白功能,预测时间对齐文本令牌,提高语音生成质量,增强对话能力。
详情链接:https://huggingface.co/kyutai/moshiko-pytorch-bf16
3、Apple Intelligence测试版现已开放
苹果发布了 iOS18.1、iPadOS18.1和 macOS Sequoia15.1的公开测试版,其中包括即将推出的 Apple Intelligence 功能,如文本重写工具、闪亮的新 Siri 设计、用于从照片中删除对象的“清理”工具等等。用户可通过苹果的测试版软件计划网站注册以获得测试资格,并在设备设置中下载安装测试版更新。新功能仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。
【AiBase提要:】
🔧 文本重写工具、新 Siri 设计、照片清理工具等功能即将推出。
📱 仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。
📅 苹果计划于10月发布 iOS18.1、iPadOS18.1和 macOS Sequoia15.1的正式版本,用户可在正式版本发布后体验新功能。
4、机器人公司1X推出世界模型
1X Technologies推出的新生成模型在机器人系统训练中提高了效率,解决了学习"世界模型"的重要挑战。该模型能预测机器人动作对世界的影响,生成多种未来场景,预测复杂的物体互动。
【AiBase提要:】
🌟 世界模型是能够预测机器人行为与环境互动的虚拟模拟器。
🤖 通过真实数据学习,模型能够在数百万种场景中进行评估,增强了机器人智能。
💰 为推动研究,推出了1X 世界模型挑战赛,并提供奖金激励。
5、亚马逊推出一大波生成式 AI 工具,购物体验全面升级
亚马逊最近发布了一系列令人瞩目的生成式 AI 工具,旨在提升消费者和第三方卖家的购物体验。其中包括个性化产品推荐、免费 AI 视频生成工具以及聊天机器人“阿梅莉亚”,为用户和卖家带来更便捷的购物和营销体验。
【AiBase提要:】
🌟 个性化产品推荐,根据客户的搜索和购买历史提供个性化推荐。
🎥 免费 AI 视频生成工具助力卖家提升视频营销效果,满足消费者对品牌视频内容的需求。
🤖 聊天机器人“阿梅莉亚”提供个性化建议和业务分析,帮助卖家了解业务状况。
6、OpenAI将最新AI模型o1扩展到企业和教育领域
OpenAI推出最新AI模型o1-preview和o1-mini,专为处理复杂推理任务而设计,为企业和教育机构带来新的可能性。这些模型通过模拟人类思维过程,解决复杂问题,提供更严谨的思维方式。企业客户可获得巨大飞跃,将AI视为解决高风险问题的伙伴。教育领域也受益,学生和研究人员可以利用尖端AI工具解决难题。o1模型配备增强安全功能,保障客户数据安全。
【AiBase提要:】
🚀 o1-preview和o1-mini模型专为处理复杂推理任务而设计,模拟人类思维过程,解决难题。
💡 o1模型在回应之前花费更多时间处理信息,o1-preview在数学奥林匹克中解决83%问题。
💻 o1-mini模型专为编程任务设计,提供成本效益选择,适用于生成和调试复杂代码等任务。
7、OpenAI在新一轮融资据悉要求投资者至少出资2.5亿美元
OpenAI正在进行一轮巨额融资的后期谈判,其估值可能达到1500亿美元。据知情人士透露,该公司已要求投资者至少出资2.5亿美元。这表明该公司对这轮融资的需求非常迫切。
【AiBase提要:】
🔍 OpenAI估值或将达到1500亿美元
💰 投资者至少需出资2.5亿美元
🚀 新一轮融资将为OpenAI提供资金支持
8、Instagram宣布将用AI对新的青少年帐户进行年龄验证
Instagram最近宣布将通过人工智能技术对用户进行年龄验证,旨在更好地识别青少年用户,这一举措有望提升用户安全和隐私保护。
【AiBase提要:】
🌟 Instagram推出AI年龄验证,识别青少年用户。
🔒 Yoti合作验证年龄,96%虚报用户被阻止。
🚨 政府可能介入,实施强制措施如果AI效果不佳。
9、OpenAI招募机器学习工程师,开拓多智能体研究新领域
OpenAI最近宣布招募机器学习工程师,成立多智能体研究团队,旨在提升AI推理能力。新推出的o1模型需要用户适应时间,但在科学和数学领域表现出色。
【AiBase提要:】
🔍 OpenAI正在招募机器学习工程师,组建新的多智能体研究团队。
🚀 新推出的o1模型旨在提升AI的推理能力,用户需时间适应。
🏆 o1系列模型在科学和数学领域表现出色,解决复杂问题的能力显著增强。
10、英特尔AI加速器Gaudi3下周发布,挑战NVIDIA统治地位!
英特尔即将发布Gaudi3AI加速器,旨在挑战NVIDIA在AI芯片市场的统治地位。该加速器被称为AI英雄,具备高能效和快速运算能力,预计将超越NVIDIA的H100GPU。英特尔在2024年计划中稳步推进,展望2025年推出的Falcon Shores将进一步提升其在AI领域的竞争力。
【AiBase提要:】
🌟 Gaudi3加速器具备高能效和快速运算能力,预计超越NVIDIA H100GPU。
⚡️ 英特尔声称Gaudi3的能效是前代产品的两倍,将挑战NVIDIA的统治地位。
🚀 展望2025年,Falcon Shores将结合AI能力与强大GPU,增添英特尔在市场上的竞争优势。
最长处理2小时,开源视频字幕模型Video ReCap
随着抖音、快手等平台的火爆出圈,越来越多的用户开始制作大量的短视频内容。但对这些视频进行有效的理解和分析仍面临一些困难。尤其是视频时长超过几分钟、甚至几小时,传统的视频字幕生成技术往往无法满足需求。因此,北卡罗来纳大学和MetaAI的研究人员开源了,视频字幕模型VideoReCap。这是一种递归视频字幕生成模型,能够处理从1秒到2小时的视频,并在多个层级上输出视频字幕。站长网2024-02-28 09:10:590001高通腾讯音乐推出 “骁龙臻品音质” 利用AI丰富音乐细节
高通技术公司和腾讯音乐娱乐集团合作推出了业界首创的“骁龙臻品音质”。通过利用骁龙移动平台的强大AI计算性能,在终端侧高效运行QQ音乐臻品音质AI模型算法,为用户带来更丰富的音乐细节、更有层次的听感以及更持久的音乐享受时长。该技术将作为QQ音乐超级会员的音频聆听选项上线,并限时专享于使用搭载骁龙移动平台智能手机的用户。站长网2023-09-27 10:51:060002教育界的Apple?OpenAI发布AI教学指南
OpenAI刚刚发布了一份名为“人工智能教学(TeachingwithAI)”的官方指南,旨在帮助教师更有效地在课堂上使用ChatGPT。OpenAI的“人工智能教学”指南主要阐释了ChatGPT的工作原理、局限性,并提出了检测器的作用以及如何避免偏见。它还提供了实用的指令集,方便教师与学生良好互动。AI扮演四大教学角色A.学生:AI可模拟学生,让教师洞悉需求。0000阿里巴巴张勇谈人工智能:有旧行业将消失 新的行业也会涌现
在近日的2023阿里巴巴罗汉堂数字经济年会上,在谈到人工智能带来的挑战时,阿里巴巴张勇表示,“人工智能的发展可以类比移动互联网。目前所有行业,包括制造业、交通业、金融业等,都会在AI的加持下不断升级。虽然有一些行业和岗位可能会受到影响,但随着技术的不断落地,旧的行业将会消失,新的行业也会涌现。”站长网2023-06-21 15:13:150000苹果宣布与博通达成数十亿美元合作协议
日前,苹果宣布与美国领先的技术和先进制造公司博通达成一项新的多年期、价值数十亿美元的协议。通过此次合作,博通将在美国开发和生产一些关键的5G射频组件。根据这项合作协议,博通将在美国开发和生产一系列关键的5G射频组件,包括FBAR滤波器和尖端的无线连接组件。站长网2023-05-24 16:00:210000