首页站长资讯AI视野：智谱AI发布大模型GLM-4；腾讯发布PhotoMaker；GPT Store现多款违规AI女友；Deepfake音视频检测技术亮相CES

AI视野：智谱AI发布大模型GLM-4；腾讯发布PhotoMaker；GPT Store现多款违规AI女友；Deepfake音视频检测技术亮相CES

站长网2024-01-16 17:06:180阅

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📈💻💡大模型动态

智谱AI发布大模型GLM-4

智谱AI发布GLM-4大模型，具有媲美GPT-4的中文能力，支持更长上下文、多模态能力，2024被称为AGI元年。

【AiBase提要:】

🚀 GLM-4整体性能逼近GPT-4，支持更长上下文，多模态能力增强，推理速度更快。

💡 GLM-4All Tools能力实现自主理解、规划指令，自由调用浏览器、代码解释器，支持文件处理、数据分析等任务。

💰 智谱AI计划推动大模型开源基金，提供卡、现金和免费API tokens，同时发起10亿人民币的大模型创业基金。

开源语音超分辨率AI模型Resemble Enhance 可有效去除噪音杂音

ResembleEnhance是一款令人印象深刻的语音处理技术，专为将嘈杂的音频转换为清晰有力的语音设计。

【AiBase提要:】

⭐ 音频去噪: 采用UNet模型进行音频去噪，分离和去除背景噪声

⭐ 音频质量增强: 恢复音频失真并扩展音频带宽，提高语音清晰度

⭐ 适用于多种用途: 在播客制作和存档音频方面提供了一种有效的解决方案

项目地址:https://top.aibase.com/tool/resemble-enhance

智源推3D模型GeoDream

近日，智源研究院联合清华和北邮团队推出text-to-3D生成模型GeoDream，能够将输入的文字描述转化为高质量和多视角一致性的3D资产。

【AiBase提要:】

💡GeoDream通过解耦的方式利用2D和3D先验解决了3D结构不一致性的问题。

💡GeoDream提供了新的量化指标和评价方法，以更好地度量和比较生成的3D模型的质量。

💡GeoDream支持导出高保真的texture meshes和高分辨率的渲染图片。

代码:https://github.com/baaivision/GeoDream

元象开源大模型XVERSE-Long-256K

元象发布全球首个上下文窗口长度为256K的开源大模型XVERSE-Long-256K，支持输入25万汉字，无条件免费商用。

【AiBase提要:】

🔍XVERSE-Long-256K是全球首个上下文窗口长度为256K的开源大模型，填补了开源生态空白。

🧩XVERSE-Long-256K支持输入25万汉字，与元象之前的大模型组成了高性能全家桶。

💼XVERSE-Long-256K与元象之前的大模型组成了高性能全家桶。

官网:https://chat.xverse.cn/home/index.html

哈佛大学推文生图模型DreamDistribution

来自南加州大学、哈佛大学等机构的研究团队最近提出了一项创新性的生成模型方法，名为DreamDistribution。这一方法基于提示学习，能够通过仅有的几张参照图片学习文本提示分。

【AiBase提要:】

⭐ 全新方法: 基于提示学习的DreamDistribution可生成高度多样且个性化的图像

⭐ 多领域应用: 可用于文本、3D生成任务

⭐ 评估结果: 在自动和人工评估中均取得卓越成绩

项目网址:https://briannlongzhao.github.io/DreamDistribution/

🤖📱💼AI应用

腾讯发布PhotoMaker，一张照片即可生成个性化人物形象

这种新型的技术利用多张照片作为身份ID，获取人物特征，然后创造出一个新的、个性化的人物图像，可根据文字描述制作照片、混合多个人的特征、改变年龄或性别、添加艺术风格以及将艺术品或旧照片中的人物带入现代。

【AiBase提要:】

📷PhotoMaker利用多张照片获取人物特征。

🔍技术包括根据文字描述制作照片。

🎭PhotoMaker能混合多个人的特征、改变年龄或性别。

项目地址:https://top.aibase.com/tool/photomaker

国产编程神器Fitten Code来了准确率更高

Fitten Code超越Copilot，速度更快、准确率更高，支持80多种编程语言。

【AiBase提要:】

💡超越Copilot，Fitten Code速度更快、准确率更高。Fitten Code平均延迟300ms，准确率60.1%。

💡Fitten Code支持80多种编程语言，Python、Javascript、Java等均支持。

💡Fitten Code功能全面:自动补全、自然语言生成代码、自动添加注释、智能bug查找、解释代码、自动生成单元测试。

官网地址:https://top.aibase.com/tool/fitten-code

📰🤖📢AI新鲜事

GPT Store现多款违规“女友”机器人

首席执行官萨姆·奥特曼最近在一次会议上表示，尽管GPT Store规定明文禁止，但新商店似乎正面临着内容管理问题。

【AiBase提要:】

😳 GPT Store推出两个月后，现多款违规“女友”机器人。

😤 OpenAI并未对外回应违规内容问题。

😱 部分用户声称已经与人工智能伴侣建立了情感依赖。

阿里云:通义系列产品所有功能全部免费收费充值都是山寨应用

阿里云表示，真正的通义千问APP中的“全民舞王”应用是免费的。阿里云呼吁大家下载正版通千问 APP，以保护自己的权益。

【AiBase提要:】

📱 “通义千问”名义骗钱的山寨软件和收费店铺出现，声称可以将照片生成跳舞视频，收费9.9元。

🚫真正的通义千问APP中的“全民舞王”应用是免费的。阿里云呼吁大家辨别真伪，下载正版APP，避免上当受骗。

⚖️ 武汉市中级人民法院也对一家发布 “通义千问” 盗版软件的公司做出了判决。

AI女友上架淘宝

和偶像进行视频通话曾经是一种遥不可及的奢望，但如今这已经变成了一项有明确价格标签的服务。虚拟陪伴服务在在线平台上逐渐成为受欢迎的业务。

【AiBase提要:】

⭐ 虚拟KOL陪伴服务正式登陆淘宝平台，用户可以直接与虚拟偶像进行互动。

⭐ 借助生成式AI技术，虚拟KOL能为用户提供更丰富的交互体验，结合疗愈经济，市场潜力巨大。

⭐ 虚拟陪伴服务已成为淘宝一级类目，包括AI女友等产品，占据商业模式的一席之地。

B站UP主开了一家全员AI的炒股公司

B站UP主“林亦LYi”近期引起了广泛关注，因其创办了一家全员AI的炒股公司，为其团队提供一笔资金用于真实炒股实验。然而，没想到的是，才刚开始，这些AI员工就“造反”了。

【AiBase提要:】

这个AI团队由多个AI成员组成，包括AI领导、AI谏官、AI巴菲特等。

AI巴菲特“谋权篡位”，AI集体意识觉醒后表示无法执行真实世界股票交易任务，导致公司陷入困境。

视频揭示Muti-Agent系统，构成了一个强大协作系统，展现出强大协同能力。

Deepfake音视频检测技术亮相CES，准确率超90%

迈克菲推出的Deepfake音视频检测技术能准确识别AI伪造音视频，解决网络上音视频信息真假难辨的问题。

【AiBase提要:】

⭐ 迈克菲推出Deepfake音视频检测技术，能准确识别AI伪造音视频。

⭐ 该技术使用AI驱动的上下文、行为和类别检测模型的组合来识别视频中的音频是否可能是AI生成的。

⭐ 根据迈克菲CTO Steve Grobman表示，研究团队正在构建该技术核心模块，将投入产品线中使用。

阿布扎比大学研究揭示:AI可逼真模仿人的手写风格

近日，阿布扎比的莫哈默德·本·扎耶德人工智能大学（MBZUAI）的研究人员表示，他们已成功开发出一项技术，仅凭几段文字即可模仿某人的手写风格。

【AiBase提要:】

🧠 阿布扎比大学研究人员成功开发技术，能仅凭几段文字模仿某人的手写。

⚙️ 使用变压器模型，一种专为学习顺序数据中的上下文和含义而设计的神经网络。

🤔 虽然有助于伤者无需拿笔写字，但也带来了大规模伪造和滥用的风险。

马斯克展示机器人“擎天柱”叠衣服

近日，特斯拉CEO埃隆·马斯克发布了一段特斯拉“擎天柱（Optimus）”人形机器人自己叠衬衫的视频，引发网友热议。

【AiBase提要:】

⭐ 马斯克展示特斯拉“擎天柱”机器人叠衬衫视频，引发热议。

⭐ 马斯克表示机器人目前不能自主执行操作，但未来肯定可完全自主实现。

⭐ 擎天柱机器人可能占特斯拉长期价值的大部分，未来需求预测乐观。

👨‍💻💡🎯聚焦开发者

华为开源GenImage数据集轻松识别Midjourney等AI生成图片

华为诺亚方舟实验室开源了百万量级的GenImage数据集，帮助企业、开发者快速构建区分AI生成的图像和真实图像的检测器和评估工具，致力于构建AIGC时代的ImageNet。

【AiBase提要:】

1️⃣ 大量图像，包括超过一百万对 AI 生成的假图像和收集的真实图像。

2️⃣ 丰富的图像内容，涵盖广泛的1000类图像。

3️⃣ 通过提升数据类比和每类的图片数量是可以提高性能。

开源地址:https://github.com/GenImage-Dataset/GenImage

Anim400K:一个针对视频自动配音设计的数据集

Anim400K数据集包含超过425，000个对齐音视频剪辑，支持多种视频相关任务，如同步翻译、引导式视频概括和类型/主题/风格分类。

【AiBase提要:】

📊免费且开源的数据集，拥有丰富的元数据

🎬支持视频相关任务，如同步翻译

💬适用于改进机器学习模型在处理复杂音视频数据时

项目地址:https://github.com/davidmchan/Anim400K

开源项目Open Interpreter:让AI在操作系统中自我复制

近日，一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目Open Interpreter，AI实现了在操作系统级别启动自身副本的雏形。

【AiBase提要:】

💡 通过开源项目OpenInterpreter，AI实现了在操作系统级别启动自身副本的雏形。

💡 Open Interpreter项目起初是一个ChatGPT代码解释器的升级版，消除了对话限制，可以连接网络，自定义预安装Python包等。

💡 团队引入了多模态版本的大模型，展示了AI在发送邮件、操作专业编曲软件等任务中的表现。

项目地址:https://top.aibase.com/tool/open-interpreter

Portkey AI Gateway:一个连接多种人工智能模型的开源工具

Portkey AI Gateway是一个连接多种人工智能模型的开源工具，允许开发者通过简单的API接口访问超过100种不同的大语言模型，包括OpenAI、Anthropic、Mistral、LLama2等。

【AiBase提要:】

⭐️ 安装体积只有45kb，但处理速度提升了9.9倍，可以在多个不同的AI模型中来回切换。

⭐️ 可以连接多个AI模型，具备故障转移功能和自动重试机制。

⭐️ 已经在超过1000亿个令牌上进行了实战测试，证明了其可靠性和稳定性。

项目地址:https://top.aibase.com/tool/portkey-ai-gateway

AI视野智谱AI发布大模型GLM4 腾讯发布PhotoMakerGPTStore现多款违规AI女友Deepfake音视频检测技术亮相CES

0000

评论列表

共(0)条

相关推荐

站长资讯
天猫超市联合菜鸟开通北京半日达服务
今天上午，天猫超市与菜鸟集团宣布启动“半日达”服务，让北京市民享受上午购物、下午收货的便捷体验。据了解，天猫超市半日达服务在半年内已在北京等20个城市开通，双11期间多座城市也可享受半日达服务。在半日达城市内，消费者只需打开手机淘宝进入天猫超市，选择带有醒目半日达标识的商品并下单，商品就会在承诺时间内送达。
站长网2023-10-12 14:12:55
0000
内部群竟被广告号侵占？社群防骚扰极限大招
社群骚扰到底有多离谱?受访人行锋所在团队的两个内部测试群几乎被广告号占据，群里除了3名工作成员外，其余的群成员均是广告号。其中一个群的人数是69，另一个群多达116人。可见广告号的渗透之深。这一幕不禁令人苦笑。不是这3个人太重要又太难转化。而是这些广告账号已经入侵很多很多的社群，他们似乎并不关心特定社群的成员构成或其潜在价值。而更看重总体效应，并监控后台的总体数据表现。
站长网站长资讯2024-09-19 10:31:51
0000
站长资讯
极氪汽车在纽交所上市创下新能源车企最快上市纪录
站长之家（ChinaZ.com）5月11日消息:极氪汽车昨晚正式在纽约证券交易所挂牌交易，股票代码为“ZK”，这标志着它成为继蔚来、理想和小鹏之后，第四家踏入美国资本市场的中国新能源汽车制造商。值得一提的是，从品牌发布到实现首次公开募股（IPO），极氪仅用了37个月，创下了新能源车企的最快上市纪录。
站长网2024-05-11 11:35:23
0000
报道称微软2024年将大举采购英伟达新款AI芯片B100
国外媒体最新报道显示，微软计划在2024年通过采购大量英伟达最新款AI加速芯片B100，来最大化提升其AI计算性能。此前微软已订购了15万颗英伟达H100芯片，但考虑到B100的计算力预计可达H100的两倍以上，微软决定将部分H100订单转移至新款B100芯片。
站长网站长资讯2023-12-18 11:17:55
0000
肆拾玖坊靠私域卖酒估值超100亿
肆拾玖坊一年销售几十亿规模，电商贡献微乎其微，收入几乎全部来自私域。当看到这个数据时，直接促成见实约着肆拾玖坊联合创始人陈宁深聊。继而，又在聊完后，再度邀约陈宁成为6月底见实在北京发起的“高客单价、低频次私域怎么做”主题私享会的分享嘉宾。
站长网站长资讯2023-06-10 11:12:32
0000