首页站长资讯AI视野：ChatGPT语音旁白功能免费开放；文心一言率先实现收费；Claude2.1长下文长度扩展至200K；拼多多成立大模型团队

AI视野：ChatGPT语音旁白功能免费开放；文心一言率先实现收费；Claude2.1长下文长度扩展至200K；拼多多成立大模型团队

站长网2023-11-22 15:32:250阅

📰🤖📢AI新鲜事

ChatGPT语音旁白功能现已向所有免费用户开放

OpenAI宣布将ChatGPT with voice语音功能免费对所有用户开放，用户只需下载应用程序，点击耳机图标即可进行语音对话，此功能于今年9月推出，最初仅面向Plus和Enterprise用户。

【AiBase提要:】

🔊 语音功能全面免费: OpenAI宣布ChatGPT with voice语音功能向所有用户免费开放，用户可通过手机应用进行语音对话。

📅 推出历程: 该语音功能于今年9月首次推出，最初仅对Plus和Enterprise用户开放，现在正式对所有用户免费开放。

🚀 用户规模扩大: OpenAI在开发者大会上宣布，每周已有一亿用户使用ChatGPT，显示其在人工智能领域的广泛应用和用户接受度。

奥特曼回归OpenAI

OpenAI宣布原则上达成协议，创始人奥特曼回归公司担任CEO，同时新董事会由Bret Taylor、Larry Summers和Adam D'Angelo组成。

【AiBase提要:】

👨‍💼 奥特曼回归CEO职位: OpenAI宣布创始人奥特曼原则上回归担任首席执行官，解雇事件引发公司动荡。

🤝 新董事会组建: 由Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会将领导OpenAI，期望引入治理变革。

🔄 员工抗议与微软新动向: 员工威胁辞职，要求恢复奥特曼职位，而奥特曼在短时间内转投微软领导新的高级人工智能研究团队。

百度文心一言率先实现收费

在财报电话会议上，百度董事长兼CEO李彦宏表示，通过生成式人工智能技术推动广告增长，百度文心一言4.0版本率先实现收费，取得显著效果，预计在四季度收入将超过数亿元人民币。

【AiBase提要:】

🚀李彦宏指出，百度利用生成式人工智能技术推动广告增长，包括创意建设、精准投放、竞价优化等方面，这些努力预计将在四季度带来数亿元人民币的营收增长。

💬 百度文心一言4.0版本从11月1日起开始向企业和消费者收费。

🚀实现从按单次点击收取费用（CPC）到按实际销售产品数量收取费用(CPS)的转变。

Claude2.1长下文长度扩展至200K

Anthropic公司宣布Claude2.1升级，提升token处理能力至20万个，降低虚构率一半，新增API工具，为用户带来更强大的聊天机器人体验。

【AiBase提要:】

🔄 Token处理能力提升: Claude2.1可处理20万个token，是GPT-4最高版32，000-token上限的两倍，相当于解析500页材料。

🤥 虚构率降低: Anthropic表示Claude的虚构率降低一半，用户可更可靠地依赖聊天机器人的输出，接近ChatGPT水平。

🛠️ 新增API工具: 升级引入API工具，支持用户连接第三方API，用户可自然语言请求特定的API调用，提供更定制化的聊天机器人体验。

世界新闻摄影大赛AI禁止参赛

世界新闻摄影大赛在数天内取消了人工智能生成图像的投稿资格，经过反对声浪后，将AI生成图像排除于“开放格式”类别。基金会与新闻机构合作制定伦理标准，明确了图像编辑规则。

【AiBase提要:】

🔄 规则变更: 世界新闻摄影大赛迅速取消人工智能生成图像投稿资格，排除于“开放格式”类别。

📷 规则调整: 大赛明确了通过相机制作的照片编辑规则，拒绝使用某些生成式AI模型的工具。

🌐 伦理标准制定: 为了明确照片定义，基金会与机构合作制定伦理标准，确保照片真实准确。

B站UP主将ChatGPT接入《原神》游戏

B站UP主“Risd_锐小杜”成功将ChatGPT接入《原神》，使游戏中的角色和NPC具有更灵活智能的对话，突破了游戏原有设定，受到玩家热烈欢迎。

【AiBase提要】

🎮 创新玩法: B站UP主成功将ChatGPT整合到《原神》，使游戏中的角色对话更灵活，玩家可以通过语音输入改变剧情走向。

👍 玩家迎接: 新玩法在B站引起高度关注，视频播放超过67万次，表明玩家对这种创新体验充满兴趣。

🤖 AI限制: 尽管引入AI为游戏增色，但仍受游戏框架和角色动作自然性的限制，需要进一步优化。

AI用BLACKPINK声音翻唱aespa歌曲抖音获赞29万

一位网友使用BLACKPINK成员声音，成功AI翻唱了aespa的歌曲《Drama》，在抖音上引起轰动，获得超过29万点赞，突显了AI音乐翻唱的受欢迎程度。

【AiBase提要:】

🎤 声音辨识度惊人: 网友称BLACKPINK成员的声音像防盗水印，认为AI翻唱颠覆传统，受到欢迎。

🚫 版权争议引发关注: 随着AI翻唱现象兴起，音乐行业面临版权争议，一些公司要求下架未经授权的AI翻唱作品。

🔮 AI在音乐领域潜力: 尽管引发担忧，音乐产业却积极拥抱AI，展示了AI在音乐创作和生成方面的崭新可能性。

柯洁抖音直播暴打AI

柯洁在抖音进行直播，挑战人工智能《金铲铲之战》游戏，豪言暴打AI。尽管屡战屡败，但在直播最后10分钟，通过“抽象围棋”弹幕，成功取得胜利，引起广泛关注。

【AiBase提要:】

🔍 挑战AI游戏: 棋手柯洁在抖音直播中尝试击败人工智能，《金铲铲之战》成为焦点。

👾 屡战屡败: 柯洁在游戏中多次败北，粉丝在评论区调侃，但直播末尾发生戏剧性逆袭。

🏆 抽象围棋胜利: 在最后10分钟，柯洁通过“抽象围棋”弹幕成功获得胜利，直播获得300万点赞。

联发科发布AI芯片天玑8300

联发科发布的天玑8300芯片将为经济实惠的手机提供类似ChatGPT的本地生成式人工智能功能，与高通等厂商竞相探索移动领域生成式人工智能趋势。

【AiBase提要】

📱 联发科发布天玑8300芯片，为经济实惠手机提供本地生成式人工智能功能。

💡 与高通趋势相符，移动公司竞相在手机中推广生成式人工智能技术。

🔄 天玑8300相较前代芯片有多项改进，包括提高性能、电池续航和连接配件的优化。

OpenAI的GPT-4在文档摘要中幻觉率最低

Vectara排行榜显示，OpenAI的GPT-4在文档摘要中具有最低的3%幻觉率和出色的97%准确率，成为大型语言模型中表现最佳的模型。

【AiBase提要:】

👏 卓越表现: OpenAI的GPT-4在Vectara排行榜上凭借97%准确率和3%的幻觉率脱颖而出，成为文档摘要中幻觉率最低的大型语言模型。

🚀 排名亮眼: GPT-4和GPT-4Turbo在排行榜中表现最佳，而非OpenAI模型中，Meta Llama2以94.9%准确率和5.1%的幻觉率获得最高得分。

🌐 开源可信度: Vectara发布了开源模型，允许检查大型语言模型的幻觉率，以提高生成式AI系统的可信度，为企业提供更有信心地启用生成系统的信息。

生成式AI助推增长英伟达收入创历史新高

NVIDIA在Q32024财报中宣布创下181.2亿美元历史性收入，主要由数据中心业务推动，涵盖GPU销售和用于生成AI工作负载的GPU/CPU系统。

【AiBase提要:】

🚀 历史新高收入: NVIDIA在最新财报中创下181.2亿美元的历史性收入，以数据中心业务为主导，包括GPU销售和用于生成AI工作负载的GPU/CPU系统。

💡 生成AI趋势: 全球范围内，生成AI成为软硬件市场几十年来最大的总地址市场扩张，反映了行业从通用计算向加速计算和生成AI的广泛过渡。

🌐 新兴市场和合作关系: 新兴市场包括政府建立主权人工智能基础设施，各地云服务提供商对AI云的投资，以及企业软件公司整合AI助手，NVIDIA预计将在这些领域取得增长。

🤖📈💻💡大模型动态

Stability AI推出视频生成模型Stable Video Diffusion

Stability AI最近发布了视频生成模型Stable Video Diffusion，基于其Stable Diffusion文本转图像模型，可通过动画化现有图像生成视频，但目前仍处于研究预览阶段。

【AiBase提要:】

🎥 Stability AI发布开源的视频生成模型Stable Video Diffusion，能通过动画化图像生成高质量视频。

⚠️ 模型目前在“研究预览”阶段，有特定使用条款，限制应用于“教育或创意工具”等领域，禁止用于“真实事件或人物的表现”。

💰 Stability AI计划商业化应用，已筹集超过1.25亿美元资金，但面临财务困境和高烧钱速度，公司前高管离职。

拼多多成立大模型团队

拼多多成立大模型团队，致力于在客服、搜索、推荐等业务场景中应用大模型，提升用户购物体验和运营效率。

【AiBase提要:】

🚀 大模型团队成立: 拼多多在上海组建大模型团队，重点研发大模型在客服、对话场景下的应用，并计划拓展至其旗下电商平台TEMU的多个业务场景。

💼 高薪招才启事: 拼多多开始在大模型领域招聘人才，提供年薪百万的职位，最高可达130万元，显示对大模型技术的重视。

🔍 业务拓展与效益提升: 大模型应用将帮助拼多多实现智能化推荐和虚拟客服，提高购物体验、销售转化率，同时支持供应链管理、库存预测和销售预测，提升运营效率。

快手:已开始研发超千亿规模大模型以及多模态大模型

快手首席执行官程一笑表示，公司已启动超过千亿规模的语言大模型和多模态大模型的研发，以确保在新技术突破中保持国内领先地位，其中包括130亿和660亿规模的大模型，并推出了文生图大模型“可图”。

【AiBase提要:】

🚀 快手启动新AI战略，研发超千亿规模的语言和多模态大模型，以保持国内领先地位。

🌐 公司推出文生图大模型“可图”，具备文本理解和多样风格转化能力，用于生成多种风格的绘画作品。

🔄 快手加速推进大模型场景应用，包括在短视频评论区推出“AI玩评”功能，利用大模型生成海量风格图片，促进用户互动。

🤖📱💼AI应用

Krea上线背景去除功能简单拖拽即可自动抠图

Krea最新更新引入背景去除功能，用户只需简单拖拽图片到界面，系统自动抠图，省时省力，提供更灵活的创意空间。

官网地址:https://www.krea.ai/

【AiBase提要:】

🚀 创新功能登场: Krea推出背景去除功能，用户通过简单拖拽实现自动抠图，解决复杂背景限制创作的问题。

🎨 灵活创意空间: 用户能更灵活地编辑内容，确保生成画面干净、专业，提供更广阔的创意空间。

💻 AI驱动技术: Krea是一款AI创意工具，拥有2500多个AI模型，支持实时AI训练，满足用户的个性化审美需求。

研究人员开发人工智能模型“ALERTA-Net” 预测股市趋势

南达科他州大学研究人员成功研发深度神经网络模型“ALERTA-Net”，首次整合宏观经济、搜索引擎和社交媒体数据，为股市预测提供新思路。

论文地址:https://dx.doi.org/10.48550/arxiv.2310.18706

【AiBase提要:】

🧠 综合数据预测: ALERTA-Net整合宏观经济、搜索引擎和社交媒体数据，成功预测股市走势和波动。

🌐 全球股票分析: 研究团队选择41支“蓝筹”股票，结合深度学习和社交媒体信息检索，获得700万条推文数据。

📈 优异性能: 与DP-LSTM等基准模型相比，ALERTA-Net在准确性方面表现更出色，为股市预测领域带来创新。

👨‍💻💡🎯聚焦开发者

开源AI工具ChatAnything:用文本描述生成虚拟角色

南开大学与字节跳动合作推出ChatAnything，通过在线方式生成基于大型语言模型的拟人化角色，引入创新概念MoV和MoD，解决面部关键点检测难题。

项目地址:https://chatanything.github.io

【AiBase提要:】

🎭 ChatAnything框架创新: 南开大学与字节跳动合作推出ChatAnything，以在线方式生成基于大型语言模型的拟人化角色。

🗣️ MoV和MoD创新概念: 引入创新概念MoV和MoD，实现声音和外观的多样生成，充分利用语言模型技术为角色创造个性。

🧠 挑战与解决方案: 面临面部关键点检测困难，通过像素级引导解决，介绍ChatAnything框架的四个主要模块，提供全面的拟人化解决方案。

PyTorch团队重写Meta“分割一切”模型性能提速8倍

PyTorch团队通过重写Meta的「分割一切」模型，在保持准确率的同时，成功提升了推理速度8倍，涉及多方面PyTorch原生特性和新功能的应用。

【AiBase提要】

🚀 性能提速8倍: PyTorch团队通过采用多种优化方法，包括Bfloat16、Torch.compile、GPU量化等，成功将Meta的「分割一切」模型性能提升8倍。

🔍 深入性能分析: 文章详细介绍了SAM模型的性能分析、瓶颈识别，以及采用Bfloat16、Torch.compile等优化手段，综合提高了GPU同步和性能。

🧠 多方面优化应用: PyTorch团队通过重写SAM模型、使用Nested Tensor、Triton自定义操作等手段，综合优化了生成式AI模型，为AI领域发展提供了重要方法和工具。

深度催眠引发的LLM越狱:香港浸会大学揭示大语言模型安全漏洞

研究团队通过深度催眠方法提出的新型大语言模型越狱攻击DeepInception揭示了LLM在应对人类指令时可能失去自我防御，强调改进大模型的防御机制的紧迫性。

项目地址:https://deepinception.github.io/

【AiBase提要:】

🔍 轻量级越狱攻击: DeepInception是一种轻量级Jailbreak方法，通过深度催眠LLM使其越狱，并规避内置安全防护。

🤖 利用人格化特性: 利用LLM的人格化特性构建新型指令Prompt，实现自适应的LLM越狱，揭示多个LLM的致命弱点。

⚠️ 安全性呼吁与改进: 实验证明DeepInception领先于先前Jailbreak方法，呼吁加强对LLM自我越狱的关注，通过心理学视角为改进大模型的防御机制提供启示。

AI视野ChatGPT语音旁白功能免费开放文心一言率先实现收费Claude21长下文长度扩展至200K拼多多成立大模型团队

0000

评论列表

共(0)条

相关推荐

这位上海医生带头搞的AI，要让癌症诊断进入好时代了。
不知道大伙们还记得，那名用50张1080TI显卡对抗癌症的“业余”程序员不。他曾自掏腰包训练了个AI，还整了个免费的网站，让人工智帮你“看片子”，能快速诊断出乳腺癌。当时差评君就在畅想，未来，AI技术在医学领域，铁定能溅起不小的水花儿。但谁也没想到，这未来来得实在有些快，而且比起水花，AI掀起的更像是大浪。
站长网站长资讯2023-12-05 17:50:33
0000
站长资讯
苹果Vision Pro有望助力外科手术为医生手术提供关键信息
6月19日消息，据外媒报道，苹果公司已如外界预期的那样，在6月6日凌晨开始的2023年度全球开发者大会上，推出了他们的首款混合现实头显VisionPro，起售价3499美元，将于明年初在苹果官网和美国的AppleStore零售店开卖，稍晚在更多国家和地区上市。
站长网2023-06-20 11:54:25
0000
站长资讯
Google DeepMind 发布 CoDoC，提升医疗 AI 诊断的可靠性和准确性
据国外媒体报道，GoogleDeepMind与多个机构合作，发布了一种名为CoDoC（Complementarity-DrivenDeferraltoClinicalWorkflow）的AI系统，旨在提升医疗AI诊断的可靠性和准确性。
站长网2023-07-19 19:53:48
0000
站长资讯
画个圈就能搜索，谷歌Gemini Pro植入旗舰，开启手机AI大战
近日，三星在加利福尼亚州圣何塞隆重发布了最新的GalaxyS24系列手机，AI要素拉满!网友一片热情，纷纷实测AI要素满满三星新旗舰，竟被抱怨一半功能都不太好用!近日，在加利福尼亚州圣何塞举行的GalaxyUnpacked活动中，三星推出了最新的GalaxyS24系列手机。在生成式AI的时代，三星这次也是甩出了满满的AI概念。
站长网2024-01-23 14:11:26
0001
站长资讯
vivo X90s发布搭载天玑9200+售价3999元起
今天下午，vivoX90s正式发布，8GB256GB售价3999元、12GB256GB售价4299元、12GB512GB售价4699元。与上一代X90相比，X90s升级为联发科天玑9200旗舰平台，安兔兔综合成绩突破了165万分。
站长网2023-06-27 16:03:59
0000