AI视野:ChatGPT语音旁白功能免费开放;文心一言率先实现收费;Claude2.1长下文长度扩展至200K;拼多多成立大模型团队
📰🤖📢AI新鲜事
ChatGPT语音旁白功能现已向所有免费用户开放
OpenAI宣布将ChatGPT with voice语音功能免费对所有用户开放,用户只需下载应用程序,点击耳机图标即可进行语音对话,此功能于今年9月推出,最初仅面向Plus和Enterprise用户。
【AiBase提要:】
🔊 语音功能全面免费: OpenAI宣布ChatGPT with voice语音功能向所有用户免费开放,用户可通过手机应用进行语音对话。
📅 推出历程: 该语音功能于今年9月首次推出,最初仅对Plus和Enterprise用户开放,现在正式对所有用户免费开放。
🚀 用户规模扩大: OpenAI在开发者大会上宣布,每周已有一亿用户使用ChatGPT,显示其在人工智能领域的广泛应用和用户接受度。
奥特曼回归OpenAI
OpenAI宣布原则上达成协议,创始人奥特曼回归公司担任CEO,同时新董事会由Bret Taylor、Larry Summers和Adam D'Angelo组成。
【AiBase提要:】
👨💼 奥特曼回归CEO职位: OpenAI宣布创始人奥特曼原则上回归担任首席执行官,解雇事件引发公司动荡。
🤝 新董事会组建: 由Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会将领导OpenAI,期望引入治理变革。
🔄 员工抗议与微软新动向: 员工威胁辞职,要求恢复奥特曼职位,而奥特曼在短时间内转投微软领导新的高级人工智能研究团队。
百度文心一言率先实现收费
在财报电话会议上,百度董事长兼CEO李彦宏表示,通过生成式人工智能技术推动广告增长,百度文心一言4.0版本率先实现收费,取得显著效果,预计在四季度收入将超过数亿元人民币。
【AiBase提要:】
🚀李彦宏指出,百度利用生成式人工智能技术推动广告增长,包括创意建设、精准投放、竞价优化等方面,这些努力预计将在四季度带来数亿元人民币的营收增长。
💬 百度文心一言4.0版本从11月1日起开始向企业和消费者收费。
🚀实现从按单次点击收取费用(CPC)到按实际销售产品数量收取费用(CPS)的转变。
Claude2.1长下文长度扩展至200K
Anthropic公司宣布Claude2.1升级,提升token处理能力至20万个,降低虚构率一半,新增API工具,为用户带来更强大的聊天机器人体验。
【AiBase提要:】
🔄 Token处理能力提升: Claude2.1可处理20万个token,是GPT-4最高版32,000-token上限的两倍,相当于解析500页材料。
🤥 虚构率降低: Anthropic表示Claude的虚构率降低一半,用户可更可靠地依赖聊天机器人的输出,接近ChatGPT水平。
🛠️ 新增API工具: 升级引入API工具,支持用户连接第三方API,用户可自然语言请求特定的API调用,提供更定制化的聊天机器人体验。
世界新闻摄影大赛AI禁止参赛
世界新闻摄影大赛在数天内取消了人工智能生成图像的投稿资格,经过反对声浪后,将AI生成图像排除于“开放格式”类别。基金会与新闻机构合作制定伦理标准,明确了图像编辑规则。
【AiBase提要:】
🔄 规则变更: 世界新闻摄影大赛迅速取消人工智能生成图像投稿资格,排除于“开放格式”类别。
📷 规则调整: 大赛明确了通过相机制作的照片编辑规则,拒绝使用某些生成式AI模型的工具。
🌐 伦理标准制定: 为了明确照片定义,基金会与机构合作制定伦理标准,确保照片真实准确。
B站UP主将ChatGPT接入《原神》游戏
B站UP主“Risd_锐小杜”成功将ChatGPT接入《原神》,使游戏中的角色和NPC具有更灵活智能的对话,突破了游戏原有设定,受到玩家热烈欢迎。
【AiBase提要】
🎮 创新玩法: B站UP主成功将ChatGPT整合到《原神》,使游戏中的角色对话更灵活,玩家可以通过语音输入改变剧情走向。
👍 玩家迎接: 新玩法在B站引起高度关注,视频播放超过67万次,表明玩家对这种创新体验充满兴趣。
🤖 AI限制: 尽管引入AI为游戏增色,但仍受游戏框架和角色动作自然性的限制,需要进一步优化。
AI用BLACKPINK声音翻唱aespa歌曲抖音获赞29万
一位网友使用BLACKPINK成员声音,成功AI翻唱了aespa的歌曲《Drama》,在抖音上引起轰动,获得超过29万点赞,突显了AI音乐翻唱的受欢迎程度。
【AiBase提要:】
🎤 声音辨识度惊人: 网友称BLACKPINK成员的声音像防盗水印,认为AI翻唱颠覆传统,受到欢迎。
🚫 版权争议引发关注: 随着AI翻唱现象兴起,音乐行业面临版权争议,一些公司要求下架未经授权的AI翻唱作品。
🔮 AI在音乐领域潜力: 尽管引发担忧,音乐产业却积极拥抱AI,展示了AI在音乐创作和生成方面的崭新可能性。
柯洁抖音直播暴打AI
柯洁在抖音进行直播,挑战人工智能《金铲铲之战》游戏,豪言暴打AI。尽管屡战屡败,但在直播最后10分钟,通过“抽象围棋”弹幕,成功取得胜利,引起广泛关注。
【AiBase提要:】
🔍 挑战AI游戏: 棋手柯洁在抖音直播中尝试击败人工智能,《金铲铲之战》成为焦点。
👾 屡战屡败: 柯洁在游戏中多次败北,粉丝在评论区调侃,但直播末尾发生戏剧性逆袭。
🏆 抽象围棋胜利: 在最后10分钟,柯洁通过“抽象围棋”弹幕成功获得胜利,直播获得300万点赞。
联发科发布AI芯片天玑8300
联发科发布的天玑8300芯片将为经济实惠的手机提供类似ChatGPT的本地生成式人工智能功能,与高通等厂商竞相探索移动领域生成式人工智能趋势。
【AiBase提要】
📱 联发科发布天玑8300芯片,为经济实惠手机提供本地生成式人工智能功能。
💡 与高通趋势相符,移动公司竞相在手机中推广生成式人工智能技术。
🔄 天玑8300相较前代芯片有多项改进,包括提高性能、电池续航和连接配件的优化。
OpenAI的GPT-4在文档摘要中幻觉率最低
Vectara排行榜显示,OpenAI的GPT-4在文档摘要中具有最低的3%幻觉率和出色的97%准确率,成为大型语言模型中表现最佳的模型。
【AiBase提要:】
👏 卓越表现: OpenAI的GPT-4在Vectara排行榜上凭借97%准确率和3%的幻觉率脱颖而出,成为文档摘要中幻觉率最低的大型语言模型。
🚀 排名亮眼: GPT-4和GPT-4Turbo在排行榜中表现最佳,而非OpenAI模型中,Meta Llama2以94.9%准确率和5.1%的幻觉率获得最高得分。
🌐 开源可信度: Vectara发布了开源模型,允许检查大型语言模型的幻觉率,以提高生成式AI系统的可信度,为企业提供更有信心地启用生成系统的信息。
生成式AI助推增长 英伟达收入创历史新高
NVIDIA在Q32024财报中宣布创下181.2亿美元历史性收入,主要由数据中心业务推动,涵盖GPU销售和用于生成AI工作负载的GPU/CPU系统。
【AiBase提要:】
🚀 历史新高收入: NVIDIA在最新财报中创下181.2亿美元的历史性收入,以数据中心业务为主导,包括GPU销售和用于生成AI工作负载的GPU/CPU系统。
💡 生成AI趋势: 全球范围内,生成AI成为软硬件市场几十年来最大的总地址市场扩张,反映了行业从通用计算向加速计算和生成AI的广泛过渡。
🌐 新兴市场和合作关系: 新兴市场包括政府建立主权人工智能基础设施,各地云服务提供商对AI云的投资,以及企业软件公司整合AI助手,NVIDIA预计将在这些领域取得增长。
🤖📈💻💡大模型动态
Stability AI推出视频生成模型Stable Video Diffusion
Stability AI最近发布了视频生成模型Stable Video Diffusion,基于其Stable Diffusion文本转图像模型,可通过动画化现有图像生成视频,但目前仍处于研究预览阶段。
【AiBase提要:】
🎥 Stability AI发布开源的视频生成模型Stable Video Diffusion,能通过动画化图像生成高质量视频。
⚠️ 模型目前在“研究预览”阶段,有特定使用条款,限制应用于“教育或创意工具”等领域,禁止用于“真实事件或人物的表现”。
💰 Stability AI计划商业化应用,已筹集超过1.25亿美元资金,但面临财务困境和高烧钱速度,公司前高管离职。
拼多多成立大模型团队
拼多多成立大模型团队,致力于在客服、搜索、推荐等业务场景中应用大模型,提升用户购物体验和运营效率。
【AiBase提要:】
🚀 大模型团队成立: 拼多多在上海组建大模型团队,重点研发大模型在客服、对话场景下的应用,并计划拓展至其旗下电商平台TEMU的多个业务场景。
💼 高薪招才启事: 拼多多开始在大模型领域招聘人才,提供年薪百万的职位,最高可达130万元,显示对大模型技术的重视。
🔍 业务拓展与效益提升: 大模型应用将帮助拼多多实现智能化推荐和虚拟客服,提高购物体验、销售转化率,同时支持供应链管理、库存预测和销售预测,提升运营效率。
快手:已开始研发超千亿规模大模型以及多模态大模型
快手首席执行官程一笑表示,公司已启动超过千亿规模的语言大模型和多模态大模型的研发,以确保在新技术突破中保持国内领先地位,其中包括130亿和660亿规模的大模型,并推出了文生图大模型“可图”。
【AiBase提要:】
🚀 快手启动新AI战略,研发超千亿规模的语言和多模态大模型,以保持国内领先地位。
🌐 公司推出文生图大模型“可图”,具备文本理解和多样风格转化能力,用于生成多种风格的绘画作品。
🔄 快手加速推进大模型场景应用,包括在短视频评论区推出“AI玩评”功能,利用大模型生成海量风格图片,促进用户互动。
🤖📱💼AI应用
Krea上线背景去除功能 简单拖拽即可自动抠图
Krea最新更新引入背景去除功能,用户只需简单拖拽图片到界面,系统自动抠图,省时省力,提供更灵活的创意空间。
官网地址:https://www.krea.ai/
【AiBase提要:】
🚀 创新功能登场: Krea推出背景去除功能,用户通过简单拖拽实现自动抠图,解决复杂背景限制创作的问题。
🎨 灵活创意空间: 用户能更灵活地编辑内容,确保生成画面干净、专业,提供更广阔的创意空间。
💻 AI驱动技术: Krea是一款AI创意工具,拥有2500多个AI模型,支持实时AI训练,满足用户的个性化审美需求。
研究人员开发人工智能模型“ALERTA-Net” 预测股市趋势
南达科他州大学研究人员成功研发深度神经网络模型“ALERTA-Net”,首次整合宏观经济、搜索引擎和社交媒体数据,为股市预测提供新思路。
论文地址:https://dx.doi.org/10.48550/arxiv.2310.18706
【AiBase提要:】
🧠 综合数据预测: ALERTA-Net整合宏观经济、搜索引擎和社交媒体数据,成功预测股市走势和波动。
🌐 全球股票分析: 研究团队选择41支“蓝筹”股票,结合深度学习和社交媒体信息检索,获得700万条推文数据。
📈 优异性能: 与DP-LSTM等基准模型相比,ALERTA-Net在准确性方面表现更出色,为股市预测领域带来创新。
👨💻💡🎯聚焦开发者
开源AI工具ChatAnything:用文本描述生成虚拟角色
南开大学与字节跳动合作推出ChatAnything,通过在线方式生成基于大型语言模型的拟人化角色,引入创新概念MoV和MoD,解决面部关键点检测难题。
项目地址:https://chatanything.github.io
【AiBase提要:】
🎭 ChatAnything框架创新: 南开大学与字节跳动合作推出ChatAnything,以在线方式生成基于大型语言模型的拟人化角色。
🗣️ MoV和MoD创新概念: 引入创新概念MoV和MoD,实现声音和外观的多样生成,充分利用语言模型技术为角色创造个性。
🧠 挑战与解决方案: 面临面部关键点检测困难,通过像素级引导解决,介绍ChatAnything框架的四个主要模块,提供全面的拟人化解决方案。
PyTorch团队重写Meta“分割一切”模型 性能提速8倍
PyTorch团队通过重写Meta的「分割一切」模型,在保持准确率的同时,成功提升了推理速度8倍,涉及多方面PyTorch原生特性和新功能的应用。
【AiBase提要】
🚀 性能提速8倍: PyTorch团队通过采用多种优化方法,包括Bfloat16、Torch.compile、GPU量化等,成功将Meta的「分割一切」模型性能提升8倍。
🔍 深入性能分析: 文章详细介绍了SAM模型的性能分析、瓶颈识别,以及采用Bfloat16、Torch.compile等优化手段,综合提高了GPU同步和性能。
🧠 多方面优化应用: PyTorch团队通过重写SAM模型、使用Nested Tensor、Triton自定义操作等手段,综合优化了生成式AI模型,为AI领域发展提供了重要方法和工具。
深度催眠引发的LLM越狱:香港浸会大学揭示大语言模型安全漏洞
研究团队通过深度催眠方法提出的新型大语言模型越狱攻击DeepInception揭示了LLM在应对人类指令时可能失去自我防御,强调改进大模型的防御机制的紧迫性。
项目地址:https://deepinception.github.io/
【AiBase提要:】
🔍 轻量级越狱攻击: DeepInception是一种轻量级Jailbreak方法,通过深度催眠LLM使其越狱,并规避内置安全防护。
🤖 利用人格化特性: 利用LLM的人格化特性构建新型指令Prompt,实现自适应的LLM越狱,揭示多个LLM的致命弱点。
⚠️ 安全性呼吁与改进: 实验证明DeepInception领先于先前Jailbreak方法,呼吁加强对LLM自我越狱的关注,通过心理学视角为改进大模型的防御机制提供启示。
Gemini背后,谷歌真正可怕之处并不在模型本身
谷歌的大语言模型Gemini1.0,一经问世就技惊四座。首先在性能方面,无论是从对文本、图像、音频的理解,还是对57种领域文本以及数学问题的推理,几乎都超过了自然语言界的霸主GPT-4。而且在谷歌Gemini的官网上还有这一段话,内容是“Gemini是第一个在MMLU(海量多任务语言理解)上超过人类专家的模型”。0000微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
Llama3发布刚几天,微软就出手截胡了?刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama38B。为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。站长网2024-04-23 16:31:230002OpenAI在中国申请GPT-6和GPT-7商标
**划重点:**1.🚀OpenAI积极在中国申请GPT-6和GPT-7商标,尽管目前未在中国提供服务。2.💡GPT-4参数超过1万亿,预计GPT-6和GPT-7将引领创新,目前商标申请仍在审查中。3.👥OpenAI首席执行官SamAltman强调推动GPT-5研发,寻求微软额外资金,并关注AI创新中的伦理问题。站长网2023-12-04 14:38:410000消息称蚂蚁集团正研发大模型 内部定名贞仪
据科创板日报报道,蚂蚁集团的技术研发团队正在自研语言和多模态大模型,内部命名为“贞仪”。今年4月,清华大学与蚂蚁集团签署合作协议。据悉,双方将开展“安全通用大模型”的技术路线和落地研究,以应对大模型技术爆发时代的安全科技生产力问题,及通用AI能力广泛应用带来的新型未知风险防控。站长网2023-06-21 16:57:560000AutoPrompt:一个提示词优化工具 还能自动避过敏感词
AutoPrompt是一个专为优化提示而设计的框架。通过不断的迭代过程,AutoPrompt构建了一个包含各种挑战性边缘案例的数据集,用于测试和优化提示。这个框架能够根据用户的具体意图自动生成定制化的提示,确保生成的提示能够精准地满足用户的需求。此外,AutoPrompt还有效地解决了提示中的常见问题,例如敏感性问题和固有的模糊性问题,通过精确调整,生成更加健壮和清晰的提示。站长网2024-02-29 11:22:360001