AI视野:Azure AI新增40种大模型;Yi-34B-Chat微调模型开源;GPT-4在图灵测试中成功率超过41%;微软谷歌推出AI入门课程
📰🤖📢AI新鲜事
微软Azure AI新增40种大模型
微软宣布在Azure AI云开发平台中新增40个大模型,包括Whisper V3、Stable Diffusion、Phi、Falcon、SAM、CLIP、Code Llama等,支持文本生成、图像处理、代码编写、语音识别等多种功能。
【AiBase提要:】
🗣 Whisper V3: OpenAI最新语音模型,使用百万小时数据,支持语音翻译和转录。
🎨 Stable Diffusion: 由Stability AI开发,强大的图像生成模型,包括多种类型的图片生成。
🤖 Phi:13亿参数的Transformer架构,成为参数较少但卓越的模型之一。
三星确认Galaxy S24是AI手机
三星确认其即将推出的 Galaxy S24系列将聚焦于人工智能,申请了与 AI 相关的商标,预计在1月17日发布,并计划推出多项 AI 功能。
【AiBase提要:】
🔍 AI聚焦: 三星计划在 Galaxy S24系列中引入人工智能,通过申请商标如 AI Phone 和 AI Smartphone 突显其对 AI 的重视。
📅 发布日期确认: 预计 Galaxy S24将于2024年1月17日发布,展示多项 AI 功能,成为人工智能手机的代表。
🌐 全球申请: 三星不仅在智能手机领域,还在其他类别产品如智能戒指和 AR 眼镜上提交商标申请,展示全球范围内的人工智能布局。
微软谷歌DeepMind推出AI入门课程
谷歌和微软合作发布面向11-14岁初学者的AI入门课程,旨在培养下一代对人工智能的兴趣和理解,强调教育在推动科技领域发展中的重要性。
【AiBase提要:】
🚀 谷歌与Raspberry Pi基金会合作推出「Experience AI」课程,教11-14岁学生基本AI知识。
🌐 微软发布「Generative AI for beginners」课程,重点介绍生成式AI,提供详细教程和GitHub代码库。
🎓 谷歌和微软共同传达AI教育重要性,致力于培养多样化思想家和未来AI领袖。
GPT-4在图灵测试中成功率超过41%,人类保持在63%
最新研究表明,GPT-4在图灵测试中的成功率达到41%,超过传统人工智能模型,但仍低于人类63%的水平,突显了人工智能发展的潜在局限性。
【AiBase提要:】
🧪 图灵测试研究中,GPT-4成功率达到41%,人类有63%。
🤯 对比GPT-3.5和GPT-4,显示付费版本在测试中表现更出色。
🧠 图灵预测的计算能力要求未实现,人工智能仍有进步空间。
OpenAI开发者日干货笔记
本文揭示了OpenAI在ChatGPT产品发展中的团队合作、技术优化以及为创业者提供的工程实践经验,涵盖了产品与研究团队的密切协作、非线性策略优化大模型性能,以及应用从原型到成熟产品的实际指导。
【AiBase提要:】
👥 团队合作创新: OpenAI展示了研究团队和产品团队紧密合作的模式,使ChatGPT从原型到成熟产品的发展更为顺畅,为通用人工智能的目标打下基础。
🔄 非线性策略优化: 在GPT-4的开发中,OpenAI采用了非线性优化框架,包括提示工程、搜索增强生成(RAG)和微调,以更灵活地提升大模型的性能,解决实际问题。
🚀 创业者指南: OpenAI分享了将基于其模型的应用从原型走向完整产品的工程实践经验,强调以人为本的用户体验,减少模型不确定性,提高安全性和可控性。
亚马逊推出全新一代ASR系统
亚马逊的新一代语音基础模型驱动的ASR系统,覆盖100多种语言,提升20%至50%的准确度,支持自动标点、自定义词汇等多种功能,为语音转文本提供更全面、准确的服务。
【AiBase提要:】
🎙️ 多语言支持: 新一代语音基础模型涵盖100多种语言,提供全面的自动语音识别服务。
🚀 性能提升: 利用先进的自监督算法,提高20%至50%的准确度,尤其在电话语音等挑战性领域提高了30%至70%的准确度。
🌐 全面功能: 新ASR系统支持自动标点、自定义词汇、自动语言识别、说话人分离等特性,提供更准确的输出并有效嵌入语音技术。
LeCun:超级AI不会主宰人类,但必须开源
LeCun认为未来可能出现超越人类智能的情景,但这些人工智能不会主宰人类,而是成为与数字世界互动的中介,并强调其必须是开源的,以确保广泛参与学习和优化。
【AiBase提要:】
🌐 LeCun强调超级AI将充当人类智能助手,而非主宰者,成为与数字世界互动的中介。
🤖 他呼吁人工智能系统建立能够预测动作序列后果的世界模型,实现更通用的规划能力。
🌍 LeCun强调人工智能的开源,以避免少数公司垄断,确保多元参与和避免左右个体观点和文化。
Girolamo AI 聊天机器人 Beta 版发布
CardanoGPT推出Girolamo AI聊天机器人Beta版,以Girolamo Cardano命名,标志着Cardano在区块链领域探索人工智能的新阶段,具备实时、语境感知的响应和图像生成解读能力。
【AiBase提要】
🚀 技术融合创新: CardanoGPT发布Girolamo AI聊天机器人Beta版,标志着人工智能与区块链技术的深度融合,为交互性和多功能性的AI应用在区块链框架内开辟新可能。
🤖 功能丰富聊天机器人: Girolamo聊天机器人在Beta测试阶段承诺成为AI集成区块链解决方案中的新成员,提供实时、语境感知的响应,并具备生成和解读图像的能力,增强用户体验。
🔗 参与门槛设定: 参与Girolamo beta测试的用户需持有至少5000CGI代币,通过CardanoGPT Discord服务器验证钱包后,可与聊天机器人直接互动,尽管Girolamo仍处于Beta阶段,信息准确性无法百分之百保证。
斯坦福大学研究NOIR系统:实现用意念控制AI机器人
斯坦福大学研发的NOIR系统通过解码大脑信号,使人类能够用意念来操控机器人,为残障人士和老年人提供支持,同时在危险环境中执行任务,为智能机器人的发展提供新思路。
【AiBase提要:】
🌐 NOIR系统:通过脑电信号实现人类对机器人的指令,涉及解码目标物体、互动方式和位置三个关键阶段。
🤯 应用广泛:不仅支持残障人士和老年人,还可在危险环境中执行任务,为未来智能机器人的发展提供新思路。
👥 技术突破:NOIR的突破性技术使得通过大脑信号操控机器人成为可能,为身体受损的人们提供独立控制环境的新可能性。
维基百科创始人表示,ChatGPT 的维基百科写作“糟糕”且“混乱”
维基百科创始人吉米·威尔士批评ChatGPT的维基百科写作糟糕且混乱,指出存在错误和虚构信息,但对AI在支持维基百科的潜在作用持开放态度。
【AiBase提要:】
🧐 吉米·威尔士批评ChatGPT在维基百科上的写作存在错误和虚构信息,形成混乱。
🌐 尽管批评,威尔士对AI在支持维基百科方面的潜在作用持开放态度,考虑与开源AI公司合作,以识别不准确信息。
🤝 Meta公司展示了PEER和Side等AI模型,但目前尚未与维基媒体建立合作,维基百科领域对AI潜在作用的探索仍在继续。
索尼推出相机内真实性认证技术,应对 AI 合成图像挑战
索尼推出相机内真实性认证技术,通过在拍摄时为图像文件添加基于机器的数字签名,以应对人工智能合成图像的挑战。
【AiBase提要:】
📷 技术原理: 索尼相机内真实性认证技术通过在拍摄时为图像添加数字签名,消除了在拍摄和传输过程中操纵图像的可能性。
🔄 硬件优势: 与莱卡技术不同,索尼的方案基于现有硬件,使得未来相机更易实现,并通过固件更新使旧型号相机向后兼容。
🤝 与美联社合作: 在与美联社的测试中,确保数字签名在新闻摄影工作流程中保持完整,为应对假冒和操纵图像提供更可靠的解决方案。
🤖📈💻💡大模型动态
零一万物Yi-34B-Chat微调模型及量化版开源
零一万物发布了Yi-34B-Chat微调模型,并提供4bit/8bit量化版,在评测中取得优异成绩,可在消费级显卡上使用,已开源并可免费商用。
【AiBase提要:】
🚀 模型开源与微调发布: 零一万物发布Yi-34B-Chat微调模型,同时提供4bit/8bit量化版,在评测中表现优异,已开源并可免费商用。
⚙️ 量化版适用性:4bit量化版模型可在消费级显卡上使用,如RTX3090,提供更高的计算效率。
🏆 评测成绩突出: Yi-34B-Chat在英文知识水平、中文综合考试以及数学推理能力评测中表现出色,为开发者提供强大的语言理解和处理能力。
Inflection推全球计算级别最佳AI模型Inflection-2
Inflection-2是由Inflection AI推出的全球计算级别最佳的语言模型,号称仅次于OpenAI最新模型,在语言理解、生成、事实知识、推理和风格控制等方面表现卓越,通过大规模GPU训练,并强调负责任的模型扩展。
项目网址:https://inflection.ai/inflection-2
【AiBase提要:】
🌟 Inflection-2致力于提升语言理解和生成能力,在科学问答等任务上超越了谷歌和Meta的语言模型。
🤖 通过深度增强事实知识、推理和风格控制,Inflection-2展现出在常识和数学推理方面的出色性能。
💡 公司计划通过扩展GPU集群,大规模培训更大型的模型,同时强调在AI开发中的道德和伦理考虑。
🤖📱💼AI应用
Xboard:一款基于ChatGPT的智能键盘
Xboard是一款基于人工智能技术的先进键盘,旨在提高用户在消息、电子邮件、内容和搜索生成上的智能、迅速和高效体验。该键盘利用ChatGPT技术,能够自动生成多种类型的消息、电子邮件、内容和搜索,并在输入过程中主动纠正拼写和语法错误。
地址:https://play.google.com/store/apps/details?id=com.xboard.keyboard.gpt
【AiBase提要:】
🚀 智能生成: Xboard利用ChatGPT技术,智能生成多种类型的消息、电子邮件、内容和搜索,提升用户生产力。
🔄 上下文学习: 键盘能够学习用户输入习惯和上下文,提供更为精准的建议和预测,使输入体验更高效。
🔐 纠错功能: Xboard不仅生成内容,还主动纠正拼写和语法错误,提供准确的建议和预测,增强用户输入准确性。
爆款短视频利器!Klap可一键生成适用于多平台的短视频
Klap是一款基于人工智能技术的工具,专为内容创作者和社交媒体推广设计。它能将YouTube视频一键转换为适用于多个社交媒体平台的短视频,包括TikTok、Shorts和Reels。Klap支持YouTube视频链接,而文件上传功能即将推出,提供更多选择。
体验地址:https://top.aibase.com/tool/klap
【AiBase提要:】
🚀 Klap可将YouTube视频转换为适用于多平台的短视频。
💡 一键生成视频,具备主题检测和多语言自动字幕功能,支持微调。
🎥 面部聚焦功能使人脸成为焦点,提高视频吸引力。
Janitor AI:一个动漫风格的角色聊天机器人网站
Janitor AI是由janitorai.com开发的AI互动平台,用户可轻松打造具有各种个性的NSFW虚构聊天机器人角色,采用OpenAI的GPT模型提供高质量自然语言交互体验。
体验地址:https://top.aibase.com/tool/janitorai-ai
【AiBase提要:】
🤖 角色创作平台: 用户可在janitorai.com注册账号,通过选择模板和设定性格、语言风格,打造个性化聊天机器人角色。
🔄 API和SDK支持: Janitor AI提供丰富的API和SDK,方便开发者将虚构聊天机器人体验整合到自己的应用程序中。
🌈 个性化交互体验: 平台独特之处在于为用户和开发者提供一站式虚构聊天机器人体验,打开了无限可能。
👨💻💡🎯聚焦开发者
Adobe发布创新的DMV3D方法 单个A100生成3D图像只需30秒
Adobe与斯坦福大学合作推出DMV3D方法,利用基于Transformer的单阶段全类别扩散模型,在单个A100GPU上只需30秒生成高保真3D图像,通过稀疏的多视图投影解决传统3D生成方法中的模糊和难以去噪的问题。
论文地址:https://arxiv.org/pdf/2311.09217.pdf
官网地址:https://justimyhxu.github.io/projects/dmv3d/
【AiBase提要】
🚀 创新方法: Adobe与斯坦福大学研究者合作推出DMV3D方法,利用Transformer模型在30秒内生成高保真3D图像。
🔄 全类别扩散模型: DMV3D采用新型单阶段全类别扩散模型,通过2D多视图图像扩散、3D NeRF重建和渲染的端到端训练,避免传统方法问题。
🌐 稀疏多视图投影: 利用稀疏的多视图投影作为训练数据,DMV3D在单个图像或文本输入情况下实现3D生成,超越先前方法,为AI视觉领域带来新可能性。
IDEA提出ToG思维图谱 大模型性能提升214%!
由IDEA研究院等多方合作推出的Think-on-Graph技术,通过深度融合大模型与知识图谱,在多领域取得214%性能提升,解决大模型在金融、法律、医疗等领域的幻觉问题。
论文地址:https://arxiv.org/pdf/2307.07697.pdf
代码链接:https://github.com/IDEA-FinAI/ToG
【AiBase提要:】
😮 创新技术: Think-on-Graph技术通过紧耦合大模型与知识图谱,成功弥补了大模型在各领域幻觉问题的能力短板。
😎 推理链条优化: 采用紧耦合范式,将大模型作为“跑腿”与知识图谱相互协作,提供更清晰、可追溯的推理链条。
🚀 性能突破: 在多个基准数据集上实现巨大性能提升,刷新深度推理领域的性能榜单,为大模型在各领域应用中提供可靠、可解释的推理能力。
腾讯披露最新大模型训练方法:Angel框架升级 效率提升2.6倍
腾讯通过升级自研机器学习框架Angel,成功提升大模型训练效率,千亿级大模型训练成本降低50%,并推出大模型推理框架AngelHCF,提高推理速度1.3倍。
【AiBase提要】
😇 框架升级:腾讯使用Angel框架,通过多维度并行优化存储和软硬件结合解决通讯问题,使大模型训练效率提升2.6倍。
😈 推理框架创新:推出AngelHCF,通过扩展并行和关键能力优化,相较主流框架提高了推理速度1.3倍。
🚀 全面支持:提供一站式训练精调,已有超过300项业务接入,标志着整个生产链路的全面升级,进一步推动大模型应用的发展。
马毅团队5年心血提出白盒Transformer结构CRATE
马毅团队通过提出的CRATE结构,将数据从高维度分布压缩到低维结构,揭示了智能的本质可能是数据压缩,打开了深度学习黑盒。
论文地址:https://arxiv.org/abs/2311.13110
【AiBase提要:】
🧠 智能本质解析: 马毅团队提出的CRATE结构通过将数据压缩到低维结构,揭示了智能可能是数据压缩的结果,从而增强模型可解释性。
💻 黑盒问题突破: CRATE结构作为「白盒」Transformer,解决了大模型的黑盒问题,提升了模型的可解释性,为安全性问题提供了新的解决途径。
🚀 新学习范式: 研究指出「压缩就是一切」,弥合了深度学习理论和实践之间的鸿沟,为构建更智能系统提供了新的学习范式。
芝加哥大学研究人员推出3D画笔:使用文本生成局部风格化纹理的AI方法
3D画笔是一种由芝加哥大学研究人员与SnapResearch合作推出的人工智能方法,通过文本描述能够自动生成网格上的局部语义区域的纹理,为纹理编辑领域带来新的可能性。
【AiBase提要:】
🌐 直观编辑纹理:3D画笔通过文本描述实现在网格上进行纹理编辑,使用户能够直观、自由地控制纹理。
🤖 细节与分辨率提升: 采用级联分数蒸馏和神经场,提高局部纹理区域的细节和分辨率,实现清晰的定位和高分辨率的纹理。
🚀 多层感知器创建神经纹理: 使用多层感知器在3D表面上创建神经纹理,实现平滑变化、减少噪点,并具备超分辨率能力。
小米汽车 SU7 宣布 3 月 28 日正式发布 售价即将公布
小米创始人雷军宣布,小米SU7将在3月28日正式发布。雷军表示,如果你想拥有一台车,要有最先进的智能科技,还要有出色的驾驶质感,小米SU7将会是首选。站长网2024-03-12 09:28:040000华盛顿大学推高效大模型调优方法“代理调优”
要点:1、代理调优方法无需接触模型的内部权重。2、通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测。3、代理调优方法能够在解码时更好地保留训练知识。华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。站长网2024-01-24 09:26:500000微软承认 Bing Chat 全面开放后需要添加更多的 GPU 以加快必应聊天的响应时间
微软现在允许任何人无需加入等待列表即可使用其BingChat聊天机器人。当然,这意味着很多人现在都在首次尝试使用该服务。然而,一些BingChat用户现在表示,聊天机器人的响应速度正在变慢。微软的广告和网络服务主管MikhailParakhin在Twitter上回应道,「使用量正在增长,我们的GPU增加速度跟不上。」站长网2023-05-09 11:03:090000苹果最强标准版!iPhone 16摄像头布局敲定
快科技2月8日消息,爆料人在社交平台上曝光了iPhone16设计图,该机采用类似iPhoneX的竖排双摄设计语言。爆料人指出,iPhone16标准版之所以采用这样的设计,是为了能实现空间视频录制。众所周知,iPhone15Pro和iPhone15ProMax能够录制空间视频,用户能在VisionPro上以3D视频的形式观看iPhone15Pro系列录制的内容。站长网2024-02-08 15:20:480000wps崩了上热搜 客服回应:正在逐步恢复相关服务
站长之家(ChinaZ.com)1月5日消息:今日午间,“wps崩了”登上微博热搜。有部分用户反馈称,WPS在线文档和稻壳儿等服务无法正常使用。客服人员对此表示歉意,并表示正在逐步恢复相关服务。据悉,此前金山办公在2023年12月20日起推出了个人版关闭第三方商业广告的功能。公司声称将秉持“简单创作、轻松表达、实现价值的连接”的公司使命,为广大用户提供优质的产品服务体验。0000