登陆注册
9945

AI视野:阿里妈妈上线AI直播;多家AI绘画网站集中关闭;Stability AI发布AI音乐生成工具Stable Audio

站长网2023-09-14 21:40:441

🤖📱💼AI应用

Stability AI发布AI音乐生成工具Stable Audio

伦敦初创公司Stability AI发布Stable Audio,使用AI从文本生成自定义音乐和音效。该系统使用基于扩散的模型,可以在几秒内生成长达90秒的专业音频。Stable Audio的优势在于生成多风格音乐,提供友好界面,面向需要快速背景音乐的创意专业人士。

要点:

1、Stable Audio使用扩散模型从文本生成自定义音乐和音效,支持多种风格。

2、提供浏览器界面,使用简单,可在几秒内生成长达90秒的高质量音频。

3、面向需要快速获取背景音乐的电影、游戏等创意行业专业人士。

Adobe 的 Firefly 生成式 AI 工具结束测试:现已向所有订阅用户提供

Adobe宣布其Firefly生成式AI工具正式结束测试,现已向所有Creative Cloud订阅用户开放,用户可以利用AI生成图像和内容。

要点:

1. Adobe Firefly生成式AI工具已正式开放给所有Creative Cloud订阅用户。

2. Firefly提供了多种AI功能,包括图像扩充、色彩校正、语音到图像等。

3. 每个用户每月将获得一定的“生成积分”限额用于AI内容生成。

Stable Diffusion发布WebUI1.6版本 对小显存用户更加友好

Stable Diffusion最近发布了1.6版本的WebUI,对小显存用户更加友好,可以直接跨入使用1.60版本的模型。

要点:

1.1.6版本WebUI性能优异,小显存用户不再容易爆显存。

2. 墙裂建议所有小显存用户都升级到1.6版本。

3.1.6版本增加了很多采样器,但对画面影响似乎不大,采用DPM 采样器即可。

微软Teams AI库来了! 可帮助公司创建消息机器人

微软Teams的AI库将于10月正式投入全球运行。AI库提供各种工具,帮助开发者在Teams中轻松集成大规模语言模型,构建会话式应用,提高企业工作效率。

要点:

1、 AI库包含用于创建机器人、消息扩展等工具,以及将现有应用迁移到大语言模型的工具。

2、AI库推出开发者预览版,10月面向全球发布,支持桌面和移动端。

3、AI库发布后,Teams工作协作将大规模应用AI技术,提升企业工作效率。

Trickle:利用GPT-4推理能力识别截图关键信息

Trickle是一个支持GPT-4人工智能的截图管理平台,能将杂乱截图转化为有价值的视觉备忘录。它通过AI文本生成功能为截图创建概要,深度分析内容,实现智能归类整理。用户可以用语音交互检索所需信息。

体验地址:https://www.trickle.so/

要点:

1. 智能生成截图文本概要,提高检索效率

2. 深度分析截图内容,洞察信息本质

3. 支持语音交互,快速检索所需截图

三星SDS推出Brity Copilot 、 FabriX两款生成式AI服务

三星 SDS 推出Brity Copilot和FabriX两项生成AI服务,解决RPA局限,提高企业生产力,支持多语言模型集成,可私有云或独立服务器构建。

要点:

1、三星 SDS 推出Brity Copilot和FabriX两项生成AI服务,旨在解决RPA局限,提高企业生产力。

2、Brity Copilot用于处理电子邮件、信息传递、视频会议和数据存储等业务流程中的智力工作,而FabriX是一个业务平台,集中公司数据和知识资产,为员工提供便利。

3、这些服务支持多种大型语言模型的集成,包括OpenAI的ChatGPT和Naver的HyperCLOVA X,可以构建在私有云或独立服务器上。

知网推出“AIGC检测服务系统” 可识别学术文本中AI生成内容

同方知网推出“AIGC检测服务系统”,可快速准确识别学术文本中的AI生成内容,系统支持多种检测场景,界面简洁易用,检准率较高。

要点:

1. 系统基于知网大数据资源,使用知识增强AIGC检测技术,可以识别不同程度疑似AI生成文本。

2. 支持上传各类格式文档进行检测,可实时查看检测进度和结果报告。

3. 支持论文、学位论文、科研报告等多种学术场景的生成内容检测。

Memo AI:一个小而美的AI音视频转译工具

Memo AI是一个小而强大的AI音视频转译工具,支持本地部署,提供多项实用功能,包括视频转文字、多语言支持、实时字幕等。

体验地址:https://memo.ac/

要点:

1. 支持多语言翻译,覆盖90多种语言

2. 提供实时字幕、笔记、内容摘要等辅助功能

3. 可利用GPU加速,支持本地部署使用

Whisper API平替?Whisper Turbo语音转录速度是前者的20倍

GitHub最近发布了一款名为Whisper Turbo的新产品,作为OpenAI Whisper API的替代品,用于提供语音转录服务。其最引人关注的就是转录速度是OpenAI API的20倍。Whisper Turbo采用Rust语言开发,拥有出色的性能。它易于安装使用,支持GPU加速,是提升语音应用性能的理想选择。

项目地址:https://github.com/FL33TW00D/whisper-turbo

要点:

1. GitHub发布Whisper Turbo作为OpenAI Whisper API的替代品,转录速度快20倍。

2. Whisper Turbo使用Rust语言开发,性能出色,支持GPU加速。

3. Whisper Turbo易于安装使用,可以提升语音应用性能。

📰🤖📢AI新鲜事

多家AI绘画网站集中关闭!技术升级还是合规整改?

近日,稿定设计、即时AI、无界AI、一览运营宝、吐司TusiArt、LiblibAI、VegaAI、DraftAI、4B3等多家AI绘画网站集中关闭或更换域名,据了解是进行技术升级或整改,具体原因不明。这可能与最近出台的算法备案管理制度有关。根据新规,提供AIGC服务需完成安全评估和算法备案。监管部门正在加快对AIGC领域的管理。

要点:

1、多家AI绘画网站集中关闭或更换域名,称技术升级,但具体原因不明。

2、这可能与最近出台的算法备案管理制度有关,提供AIGC服务需备案。

3、监管部门正在加快对AIGC领域的管理,加强审核和规范。

阿里妈妈上线「AI全时直播」能力

阿里妈妈推出了「AI全时直播」能力,通过阿里妈妈创意生态「AI直播间」和阿里妈妈万相台无界版「短直联动」两大能力,帮助商家实现24小时不停播,降低直播成本,增加直播效果。

要点:

1、阿里妈妈推出「AI全时直播」能力,实现24小时不停播

2、通过「AI直播间」和「短直联动」两大能力,降低直播成本

3、AI功能如智能脚本等,可增加直播效果

ChatGPT使用数据曝光 访问量和编程需求自5月开始持续下滑

SparkToro公布数据分析结果显示,ChatGPT的使用量和编程协助需求自5月份以来呈明显下降趋势。自5月份以来,ChatGPT官方网站OpenAI.com的月访问量已经下降了29%。更值得注意的是,使用ChatGPT进行编程协助的比例也下降了30%。

要点:

1、自5月份以来,ChatGPT官方网站访问量下降29%,编程协助使用下降30%,表明ChatGPT的热潮正在减退。

2、分析显示编程协助是ChatGPT的主要用途,占29%,其他用途包括教育、内容创作、知识查询、销售和营销等。

3、尽管ChatGPT在编程协助方面表现强劲,但随着用户了解其功能和局限性,长期吸引力存在不确定性,其持久性有待观察。

加州议员提议规范AI模型

加州议员Scott Wiener提出法案,要求AI模型开发商达到透明度标准。该提案计划建立加州AI研究所,在AI安全风险方面进行测试。Wiener的目标是启动关于如何监管AI的讨论。

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. 加州议员Scott Wiener提出法案,要求AI模型开发商达到透明度标准。

2. 该提案计划建立加州AI研究所,在AI安全风险方面进行测试。

3. Wiener的目标是启动关于如何监管AI的讨论。

马斯克呼吁成立人工智能联邦部门

特斯拉CEO埃隆·马斯克在国会山人工智能峰会后呼吁成立联邦人工智能部门,认为这次高调的技术领袖和研究人员峰会可能成为人类文明史上的重要会议。

要点:

1. 埃隆·马斯克在峰会后表示人工智能发展潜在危害人类,呼吁成立类似FAA的联邦人工智能部门。

2. 本次峰会云集包括OpenAI、谷歌等科技公司CEO,讨论AI监管问题。

3. 出席者认为需要加强AI安全监管,但监管细节还存在分歧。

欧盟将向人工智能初创公司开放超级计算机资源

欧盟计划向人工智能初创公司开放超级计算机资源,以帮助它们训练AI模型,但需要初创公司加入欧盟的AI治理框架。欧盟委员会主席警告AI发展速度太快,存在风险,呼吁建立机构评估AI风险。

要点:

1. 欧盟计划开放超级计算机资源,助力人工智能初创公司训练AI模型。

2. 欧盟要求初创公司加入AI治理框架,以获取使用权限。

3. 欧盟委员会主席警告AI发展过快,呼吁建立机构评估AI风险。

17名医生束手无策3年未诊断 ChatGPT准确诊断孩子的慢性疼痛

一名母亲带儿子见过17名医生但未能确诊慢性头痛原因,后将症状输入ChatGPT,ChatGPT正确诊断出罕见病脊髓栓系综合症。

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. 儿子头痛3年,母亲带儿子见过17名专家,但都无法确诊。

2. 母亲将症状输入ChatGPT,ChatGPT诊断出罕见病脊髓栓系综合症。

3. 医生验证ChatGPT诊断正确,为儿子进行了手术治疗。

👨‍💻💡🎯聚焦开发者

Floneum开源:适用于 LLM 工作流程的图形编辑器!

Floneum是一个面向本地AI和社区插件的图形化工作流编辑器,提供简单的图形界面,无需编程就可以组合运行插件和本地AI模型。

项目地址:https://github.com/floneum/floneum

要点:

1、Floneum具备图形化工作流界面,使用简单,无需编程即可组合运行插件和本地AI模型。

2、支持本地运行大型语言模型,保障用户隐私和数据安全。

3、开放的插件系统,可以自定义模型行为,提升性能和效果。

用 AI 打造有无穷变化的人生重开模拟器

日前,公众号南瓜博士介绍了一款名为"人生重开模拟器"的伪代码 prompt,旨在通过这个 prompt 来模拟玩家的人生经历,并让 GPT-3自动根据玩家的选择和属性值生成相关事件,最终生成玩家一生的故事。这个伪代码 prompt 的目的是使人们更容易创建具有逻辑的虚拟体验,同时探索了如何使用伪代码和自然语言混合编写。

要点:

1、作者介绍了名为"人生重开模拟器"的伪代码 prompt,目的是通过这个 prompt 模拟玩家的人生经历,生成玩家一生的故事,以及探索伪代码和自然语言混合编写的方法。

2、文章展示了模拟器的不同版本,从最初的纯伪代码到包含真实代码和伪代码的混合版本,讨论了属性分配、事件生成和属性更新等模拟器的不同部分。

3、作者提出了改进方向,如开局选择天赋卡、使用随机词汇生成事件、添加成就,并介绍了提高稳定性的方法,为构建具有逻辑和互动性的虚拟体验提供了有价值的思路和灵感。

Chupa:使用2D 扩散概率模型雕刻3D 穿衣人体

Chupa是一种新的3D人体生成方法,它将扩散模型与神经渲染相结合,可以生成逼真且多样化的3D人体。Chupa的创新之处在于它从SMPL-X网格生成高质量的人体网格。具体来说,它首先使用扩散模型生成人体法线贴图,然后基于法线贴图进行3D重建,还采用了扩散重采样以提升全身和面部的质量。Chupa可以轻松推广到各种姿势,并显示真实的质量。

项目地址:https://snuvclab.github.io/chupa/

要点:

1. Chupa使用扩散模型生成人体法线贴图,然后进行基于法线的3D重建。

2. Chupa采用扩散重采样提升身体和面部区域的质量。

3. Chupa可以轻松地推广到各种姿势,生成真实逼真的3D人体。

🤖📈💻💡大模型动态

腾讯 AI Lab联合多家学术机构发布大模型幻觉问题评估

腾讯AI Lab联合多家学术机构发布了面向大模型幻觉问题的综述文章。研究将大模型幻觉分为三类,当前研究重点是与事实知识冲突的幻觉。相比传统模型,大模型幻觉评估面临数据规模大、模型通用性强、幻觉不易察觉等新难题。为减少幻觉,可从多个方面进行干预,但仍存在可靠评估等挑战。

论文链接:https://arxiv.org/abs/2309.01219

Github 链接:https://github.com/HillZhang1999/llm-hallucination-survey

要点:

1、大模型幻觉主要分为与输入、上下文及事实冲突的三类,研究热点在第三类。

2、相比传统模型,大模型幻觉评估面临数据规模大、通用性强、不易察觉等新难题。

3、缓解幻觉可从预训练、微调、强化学习、推理等方面入手,但仍有可靠评估等挑战。

0001
评论列表
共(0)条