AI日报:微软发布iPhone可运行AI模型;全国首例AI声音侵权案判了;Kimi创始人套现数千万美金;中文聊天模型Llama3发布
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、腾讯SaaS产品智能化升级 全面接入混元模型
腾讯宣布旗下协作SaaS产品全面接入混元模型,实现软件服务智能化。腾讯乐享、腾讯电子签、腾讯问卷等产品已实现智能化升级,为用户提供更智能、高效的服务。混元大模型已扩展至万亿级参数规模,在国内率先采用混合专家模型结构,性能表现优异。外部开发者和企业可以通过腾讯云上API直接调用腾讯混元能力,解决用户痛点。
【AiBase提要:】
🚀 腾讯SaaS产品实现智能化升级,提供更智能、高效的服务。
💡 混元大模型扩展至万亿级参数规模,性能在多方面表现优异。
🔗 外部开发者和企业可通过腾讯云API调用混元能力,解决不同场景下的痛点。
2、微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列 挑战OpenAI地位
微软最新推出的Phi-3系列小型AI模型在AI领域引起轰动,尤其是Phi-3-mini模型在多项基准测试中超越了参数更大的Llama3模型。该系列模型能在iPhone14Pro和iPhone15上实现每秒12token的运行速度,达到了ChatGPT水平。微软强调训练数据的重要性,通过精心设计数据和训练方法提升模型性能。
【AiBase提要:】
🚀 Phi-3-mini模型参数仅3.8B,性能超越8B参数的Llama3模型。
💡 Phi-3系列包括Phi-3-small和Phi-3-medium版本,性能优越。
🔍 微软团队通过精心设计训练数据和独特训练方法提升了Phi-3系列模型的性能。
详情链接:https://arxiv.org/pdf/2404.14219.pdf
3、全国首例AI声音侵权案一审宣判 自己声音被AI化出售获赔25万元
这篇文章报道了全国首例AI声音侵权案的一审判决结果,涉及配音师声音被AI技术滥用的案件引起社会广泛关注。法院裁定被告未经授权擅自使用配音师声音开发AI产品构成侵权,需赔偿25万元。判决强调声音作为人格权益应受法律保护,为声音创作者提供了重要法律保障。
【AiBase提要:】
🔍 首例AI声音侵权案一审判决结果:被告未经授权使用配音师声音开发AI产品,需赔偿25万元。
💡 法院强调声音作为独特人格权益应受法律保护,未经授权擅自使用声音构成侵权行为。
👩⚖️ 判决为声音创作者提供了重要法律保障,将坚决维护声音权益并打击侵权行为。
4、中文聊天模型Llama3-8B-Chinese-Chat发布
这篇文章介绍了基于Meta-Llama-3-8B-Instruct模型经过ORPO方法微调的中文聊天模型Llama3-8B-Chinese-Chat。该模型减少了中英混合回答和表情符号的使用,使得回答更正式和专业。它在理解中文问题意图、提供恰当回答、拒绝不当请求等方面表现出色。
【AiBase提要:】
🔑 Llama3-8B-Chinese-Chat是基于Meta-Llama-3-8B-Instruct模型通过ORPO方法微调的中文聊天模型,减少了中英混合回答和表情符号的使用。
🌟 ORPO方法利用赔率比概念调整模型偏好设置,优化模型在特定任务中的表现,Llama3-8B-Chinese-Chat模型使用ORPO优化中英文生成偏好。
💡 Llama3-8B-Chinese-Chat模型在安全、道德、数学问题解答、写作和编程示例等方面表现出色,提供更准确、专业的回答和示例代码。
详情链接:https://top.aibase.com/tool/llama3-8b-chinese-chat
5、Adobe发布视频超分辨率项目VideoGigaGAN
Adobe最近推出了视频超分辨率项目VideoGigaGAN,该项目在视频放大技术方面取得了显著进展,能将视频放大至原始分辨率的8倍,保持时间连贯性和高频细节清晰度。这一技术将视频处理带入新阶段,极大扩展了视频内容的应用范围和质量。
【AiBase提要:】
✨ VideoGigaGAN实现视频放大至8倍原始分辨率,保持时间连贯性和高频细节清晰度。
🔍 Adobe优化GigaGAN模型,增强视频稳定性,展示卓越性能。
💡 VideoGigaGAN提升视频视觉质量,适应不同风格视频内容,具有广泛的应用潜力。
详情链接:https://top.aibase.com/tool/videogigagan
6、Midjourney发布random功能 可基于提示词生成完全随机的图像风格
Midjourney发布了一个有趣的功能,可以基于提示词生成完全随机的图像风格。用户可以通过随机生成的图像风格来探索不同的创作方向,同时还可以与其他用户进行实时交流和分享,共同探讨创作过程中的灵感和想法。这一功能的推出将进一步丰富用户的图像生成体验,为他们提供更多的创作选择和交流平台。
【AiBase提要:】
⚙️ 可基于提示词生成完全随机的图像风格
💬 用户可以通过Room功能进行实时交流和分享
🎨 探索不同的创作方向,丰富用户的图像生成体验
7、AI独角兽月之暗面创始人杨植麟套现数千万美金 官方回应
杨植麟作为月之暗面创始人,通过个人股份销售套现数千万美元,引起广泛关注。公司成立仅一年便获得巨额融资,估值超过25亿美元。月之暗面的成功不仅在估值上体现,旗舰产品Kimi Chat的成功也备受瞩目。
【AiBase提要:】
🚀 月之暗面创始人杨植麟通过个人股份销售套现数千万美元,公司估值超过25亿美元。
💡 月之暗面创立仅一年便迅速崛起,成为中国大模型领域独角兽之一。
💬 月之暗面旗舰产品Kimi Chat凭借“长文本”功能在AI大模型领域脱颖而出,引发资本市场热潮。
8、毫不犹豫!小扎自曝愿开源100亿美元模型 直言2025年之前AGI不可能实现
在最新的播客访谈中,小扎展现了开源英雄形象,表示愿意开源价值100亿美元模型,强调开源降低成本促进创新,但也需综合考虑经济利弊。他对2025年之前AGI实现持悲观态度,认为能源短缺是瓶颈,解决可能需数十年。批评苹果和谷歌独占移动生态,希望通过开源改变局面,防范竞争对手威胁。对于人工智能发展瓶颈,担忧能源限制和数据中心挑战,持保留态度未来AI模型能力提升。
【AiBase提要:】
💡 小扎愿意开源价值100亿美元模型,认为开源降低成本促进创新,但需综合考虑经济利弊。
💡 对2025年之前AGI实现持悲观态度,认为能源短缺是瓶颈,解决可能需数十年。
💡 批评苹果和谷歌独占移动生态,希望通过开源改变局面,防范竞争对手威胁。
9、字节跳动发布图像模型蒸馏算法Hyper-SD
这篇文章介绍了字节跳动的Lightning团队发布的新图像模型蒸馏算法Hyper-SD,该算法在图像处理和机器学习领域取得重要进展。通过创新的方法提升了模型性能,在保持模型精简的同时提高了推理速度和效率。
【AiBase提要:】
⚙️ 分段轨迹一致性蒸馏:Hyper-SD技术确保了原始ODE轨迹的完整性。
🧠 人类反馈学习机制:引入人类反馈学习,提升模型表现,减少性能损失。
🔬 分数蒸馏技术:增强了模型在低步推理下的生成能力,进一步提升性能。
详情链接:https://top.aibase.com/tool/hyper-sd
10、AI音乐生成工具AI Jukebox 输入提示词选择曲风即可创作音乐
AI Jukebox是一款利用人工智能技术的音乐生成工具,通过Hugging Face平台提供服务。它简化音乐创作过程,智能化且用户友好。用户可以通过输入提示词指导AI生成特定风格音乐,实现智能化音乐创作。AI Jukebox鼓励人机合作模式,为音乐人和音乐爱好者提供灵感和创作工具,探索无限可能性。
【AiBase提要:】
🎵 本地化模型加载: 用户打开AI Jukebox的网页后,系统自动加载生成模型,无需复杂设置。
🎶 基于提示词的音乐生成: 用户通过输入特定提示词指导AI生成特定风格音乐,包括音乐类型、情感、乐器等描述。
🎼 人机合作模式: AI Jukebox鼓励用户与AI合作,探索新的音乐创作方式,提供灵感和创作工具。
详情链接:https://top.aibase.com/tool/ai-jukebox
11、虚拟人聊天系统Live2D
这篇文章介绍了基于Unity开发的Live2D虚拟人聊天系统项目,利用Live2D技术展现动态虚拟人形象,提供流畅的动画效果,增强用户交互体验。项目集成了Azure、OpenAI和APISpace等API支持自然语言处理和生成,实现实时文本交流。同时支持图像处理和人脸检测,高清分辨率显示,以及自定义扩展功能。
【AiBase提要:】
👩💻 Live2D虚拟人形象集成,提供流畅的动画效果,增强用户体验。
💬 实时聊天功能,虚拟人能理解并回应用户文本输入,实现实时交流。
🔍 图像处理和人脸检测,让虚拟人更好地响应用户视觉输入。
详情链接:https://top.aibase.com/tool/live2d-virtual-human-for-chatting-based-on-unity
12、港大与浙大联合研发SC-GS模型
本文介绍了香港大学CVMI实验室与3D大模型公司VAST以及浙江大学联合研究团队提出的SC-GS模型,该模型在数字资产创造和3D重建领域取得突破性成果。通过稀疏控制点实时交互编辑,实现了对动态场景的高效编辑和合成,展现了巨大潜力。
【AiBase提要:】
🌟 SC-GS模型在新视角合成领域掀起革命性浪潮,展现出对动态高斯的稀疏控制点进行实时交互编辑的能力。
🔑 用户可以通过简单的鼠标拖拽和键盘组合按键操作,轻松实现对重建动态场景的编辑。
💡 SC-GS模型通过神经网络预测控制点运动状态,驱动整个场景中的动态高斯进行变形,提升了动态新视角合成的性能。
详情链接:https://top.aibase.com/tool/sc-gs
13、新视频分割技术SAM 可高效识别移动物体
本文介绍了在视频分割领域,研究团队探索新的视频对象分割技术,通过结合SAM模型和光流技术,提高了视频分割性能。两种模型展示了潜力,实现了显著性能提升,并将分割技术扩展到整个视频序列,实现物体追踪。这些技术提升了视频分割精度和效率,降低了计算复杂度,对多个应用场景具有重要意义。
【AiBase提要:】
⚙️ SAM与光流结合的模型展示了提高视频分割性能的潜力。
🔍 SAM与RGB图像结合的模型增强了模型对视频中物体运动的识别和分割能力。
🚀 将基于帧的分割方法扩展到整个视频序列,实现了物体在视频连续帧中的身份追踪。
详情链接:https://www.robots.ox.ac.uk/~vgg/research/flowsam/
小米平板7系列官宣10月29日发布:搭载第三代骁龙8s
小米平板7系列宣布将在10月29日与大家见面。小米平板7系列将采用全金属机身设计,并且支持磁吸键盘和手写笔。小米平板7系列的一大亮点是其全新3.2K高清屏幕,该屏幕支持全程DC调光,更护眼。在性能方面,该系列平板搭载了第三代骁龙8s旗舰平台,这款芯片基于台积电4nm工艺制造,与第三代骁龙8旗舰平台拥有相同的架构,预示着强大的性能表现。0000一部手机平均寿命约2.2年!我国每年产生4亿部废旧手机
快科技10月21日消息,中国循环经济协会数据显示,目前一部手机的平均使用寿命为2.2年左右。过去5年间,我国每年产生超过4亿部废旧手机,废旧手机的存量已超过20亿部。然而,该协会的研究表明,在我国,约54.2%的废旧手机被消费者闲置留存,只有约5%能够进入专业的回收平台或通过以旧换新等新型渠道回收。中国物资再生协会秘书长于可利表示,旧手机的循环利用有三种途径:翻新售卖、拆解利用和材料回收。0000突发!视频号关停弹幕互动玩法,原因为何?
视频号关停弹幕玩法?“为营造良好的直播生态,自2023年11月1日起平台将限制直播弹幕互动玩法。针对仍在直播相关内容的主播,平台将采取限流、掐断等措施。”10月30日下午5点12分,微信视频号弹幕官方在微信群发了这么一则通知后,随即解散了官方群。这则消息言简意赅,释放的信号非常明确:明日起,平台将限制互动玩法,几乎相当于关停;主播需要更换直播内容,否则很可能直播间被限流甚至被掐断。站长网2023-11-01 14:07:040001高君雨事件MCN公司致歉:时间表述出现严重错误
3月12日,知名MCN机构@豁然开朗mcn就近期引起热议的“高君雨患病”视频事件发布了一则诚挚的致歉声明。该声明表示,公司原意是希望借助该视频展示高君雨勇敢面对疾病的态度,为更多人带去正能量和鼓舞。站长网2024-03-12 17:55:130000OpenAI首席执行官透露2024年ChatGPT最受欢迎的功能请求
划重点:🔍OpenAI首席执行官SamAltman在2024年列举了ChatGPT制造商最常被请求的功能,包括人工通用智能、GPT-5语言模型以及更个性化。📈文章提到了用户对OpenAI在2024年构建或修复的期望,涉及人工通用智能、GPT-5语言模型、更个性化的要求。0000