AI视野:ChatGPT用户可以访问互联网了;Photoshop网页版正式推出;微调多模态大模型会灾难性遗忘
📰🤖📢AI新鲜事
ChatGPT用户可以访问互联网了!
OpenAI 宣布 ChatGPT 用户现在可以浏览互联网,不再受限于2021年9月之前的数据。这一更新允许用户访问最新信息,拓展了 ChatGPT 的应用领域。
🚀 AiBase提要:
1. 💡 ChatGPT现在支持浏览互联网,不再受限于2021年9月前的数据。
2. 💡 这一更新扩大了ChatGPT的功能,用户可以访问最新信息和链接。
3. 💡 OpenAI计划将这一功能扩展给所有用户,提供更广泛的数据范围。
Adobe Photoshop网页版正式推出
Adobe正式推出了Photoshop网页版,包含Firefly AI生成式填充等功能,用户界面简化,但暂无免费版本计划。

AIBase提要:
🔶 Photoshop网页版正式推出,含AI功能
🔷 用户界面简化,适合新用户
🔶 暂无计划推出免费版本
微软在Windows11画图软件中测试由DALL-E驱动的文字转图像工具
微软宣布在Windows11自带的画图软件Paint中测试一个由DALL-E驱动的文字转图像创作工具PaintCocreator,用户可以通过输入文本描述来生成艺术创作图像。PaintCocreator允许用户输入文本描述后自动生成相关图像,也可以选择艺术风格后生成3个图像样例供用户选择。当前以预览版面向Windows Insider用户推出,未来可能会对所有Windows11用户开放。

AiBase提要:
1. 微软在Windows11的Paint中测试DALL-E驱动的文字转图像工具,允许用户通过文本描述生成艺术图像。
2. PaintCocreator可自动生成相关图像,提供艺术风格选择和图像编辑功能。
3. 目前为预览版,仅面向Windows Insider用户,未来可能收费或对所有Windows11用户开放。
决策类AI公司第四范式在港交所上市
决策类人工智能公司第四范式在香港联合交易所主板挂牌上市,发行价55.60港元,开盘价上涨13.49%。
AiBase提要:
📈 发行价上涨:决策类AI公司第四范式在香港联合交易所主板挂牌上市,每股价格55.60港元,开盘价上涨13.49%。
💼 财务表现:招股书显示,第四范式2020-2022年营收逐年增长,2023年第一季度营收为6.44亿港元。
🤖 AI转型计划:第四范式是中国最大的决策类AI公司,计划利用募集资金加强基础研究、技术能力和解决方案开发,扩展产品和进入新行业领域。
👨💻💡🎯聚焦开发者
智源研究院开源 AI 硬件评测引擎FlagPerf v1.0
FlagPerf v1.0是由智源研究院发布的开源AI硬件评测引擎,评测包括功能正确性、性能、资源使用和生态适配等指标。该项目已涵盖多领域模型,支持多框架和测试环境,确保评测公平并开源测试代码。
AiBase提要:
📊 功能评测:验证芯片支持模型运行
🚀 性能评测:评估训练时间和计算吞吐量
💾 资源使用:衡量芯片和服务器其他零部件的使用情况
修复视频新神器BSCV工具集 为视频修复技术开辟新可能
在过去十年中,视频修复技术取得了显著进展,但对于常见问题如直播视频的修复效果不尽理想。为了更好地应对这些问题,研究人员开发了BSCV数据集,一个专为解决视频修复问题而设计的全新工具和视频集合。

论文地址:https://arxiv.org/pdf/2309.13890v1.pdf
AiBase提要:
1. 📊 数据集介绍: BSCV数据集包含超过28,000个视频剪辑,用于模拟真实世界的比特流损坏视频恢复,具有多种复杂和不可预测的错误模式。
2. 🛠️ 损坏模型创新: 研究人员提出了一个三参数损坏模型,模拟视频比特流的损坏,增加数据集的挑战性和现实性。
3. 🖼️ 视频恢复框架: 论文介绍了一种视频恢复框架,包括插件式特征增强模块,用于提取和融合受损和无损区域的局部特征,以提高视频恢复性能。这一框架灵活且适用于多种比特流相关的视频恢复任务。
多模态大模型KOSMOS-2.5擅长处理文本密集图像
KOSMOS-2.5是一款多模态模型,专注于处理文本密集图像,采用了统一的Transformer框架,具备卓越的文本图像理解能力。

论文地址:https://arxiv.org/abs/2309.11419
AiBase提要:
1️⃣ KOSMOS-2.5基于Transformer框架,支持端到端文本图像理解,包含视觉编码器和文本解码器,可生成Markdown格式文本。
2️⃣ 预训练使用大规模数据集,达到3.24亿条,增强多模态理解力。
3️⃣ KOSMOS-2.5在文档文本识别、Markdown生成等任务上表现卓越,具备潜力应用于更广泛领域。
马毅团队新研究:微调多模态大模型会灾难性遗忘
随着GPT-4的发布,多模态大模型(MLLM)成为热点。业界常将视觉编码器与语言模型集成构建MLLM。尽管微调后的MLLM在视觉语言任务上表现强劲,但仍面临灾难性遗忘的问题,即过拟合微调数据集后,在其他任务上的性能下降。

论文地址:https://arxiv.org/pdf/2309.10313.pdf
AiBase提要:
1. 马毅团队提出了EMT框架,评估微调后的多模态大模型(MLLM)的灾难性遗忘。
2. 实验表明,微调MLLM在提升微调数据集性能的同时,也导致其他数据集性能下降。
3. 微调过程中,MLLM会产生与微调数据集相关的幻觉文本,忽略原始问题。
Vizro:一个创建模块化数据可视化应用的工具包
Vizro是一款强大的工具包,无需深入编程或设计经验,可快速自助组装自定义仪表板,使用Python创建灵活可扩展的数据可视化应用。

项目地址:https://github.com/mckinsey/vizro
AiBase提要:
📦 快速自助组装仪表板: Vizro让您以分钟级速度创建自定义仪表板,无需编程经验。
🔧 简单配置代码: 只需几行配置代码,即可创建复杂仪表板,内置Plotly和Dash等库。
🧩 模块化扩展: 可选高代码扩展功能,结合低代码和高代码优点,创建可扩展Python数据可视化应用。
OpenLM:一个专为中等规模语言模型设计的模型训练库
OpenLM是一个PyTorch代码库,旨在训练中等规模语言模型,通过训练OpenLM-1B和OpenLM-7B两个语言模型,分别在1.6T和1.25T文本标记上进行验证,取得了出色的成果,包括在零样本文本分类和多项选择任务上的表现。

AiBase提要:
🚀设计重点:OpenLM旨在最大化GPU利用率和训练速度,适用于新的语言模型研究和应用。
🧠模型验证:OpenLM-1B和OpenLM-7B在1.6T和1.25T文本标记上进行验证,在零样本文本分类和多项选择任务上表现卓越。
🌟未来展望:OpenLM计划支持多模态模型、专家混合和数据集组合,以及扩大规模以支持更大的语言模型。
🤖📱💼AI应用
Meta 推出新的人工智能工具和名人代言的数字助手
Meta推出新的人工智能工具和名人代言的数字助手,CEO马克·扎克伯格希望这些工具可以帮助启动元宇宙。
AiBase提要:
🚀 数字助手与智能眼镜: Meta在开发者大会上展示了AI软件、新款虚拟现实头戴设备,以及智能眼镜。
📱 聊天应用整合AI: 用户可以在Facebook旗下应用中分享通过AI技术生成的数字贴纸,如滑稽卡通风格的数字贴纸。
🌐 合作与元宇宙愿景: Meta与名人合作,打造数字代言人,计划让用户创建自己的数字助手,以推动元宇宙构建。
Instagram 即将推出生成式 AI 图像编辑功能
Instagram将推出名为“restyle”的图片编辑工具,用户可以通过文字描述改变图片的外观。此外,还将推出名为“backdrop”的工具,可以为图片添加生成式AI生成的背景。Meta公司还展示了基于AI的贴纸功能,允许用户通过文本提示快速为聊天和故事创建自定义贴纸。

📷 AiBase提要:
Instagram将推出名为“restyle”的图片编辑工具,通过文字描述改变外观。
新工具“backdrop”可为图片添加生成式AI生成的背景。
基于AI的贴纸功能允许用户为聊天和故事创建自定义贴纸。
🤖📈💻💡大模型动态
法国初创公司 Mistral AI 免费发布高性能语言模型 Mistral7B
Mistral AI,一家法国人工智能初创公司,最近发布了一款性能优越的语言模型 Mistral7B,并免费向所有人提供使用。该模型性能出色,免费下载无限制。
AiBase提要:
🔍 Mistral7B模型免费发布
🚀 高性能语言模型
💡 提供多种下载方式
格莱美主席澄清新的人工智能规则:包含 AI 创作元素的音乐完全有资格参与和争夺提名
上个月,美国录音艺术科学学院宣布了一系列的改革,以更好地反映不断演变的音乐行业。其中新设立的指导方针中,涉及到机器学习技术的协议引起了媒体的关注:决定只有「人类创作者」才能获得音乐行业最高荣誉——格莱美奖,旨在限制人工智能在流行音乐中的应用。站长网2023-07-06 14:58:370002互联网医院医联推出AI医生medGPT 计划5月份发布
互联网医院医联Medlinker于今日正式发布国内首款大模型驱动的AI医生——medGPT,该产品目前已进入内部测试阶段,并计划于今年5月份正式发布。医联medGPT目前已经拥有近3000种疾病的首诊能力,覆盖80%以上的成年人疾病和90%以上的0-12岁儿科疾病。站长网2023-05-12 20:31:200000谷歌解雇整个Python团队!PyTorch创始人直呼“WTF”
快科技4月28日消息,据媒体报道,日前谷歌Python工程师、Python指导委员会成员ThomasWouters在社交媒体上发布了一条消息,称谷歌解雇了Python团队。此消息一出就惊动了领域内的很多开发者,PyTorch创始人、Meta杰出工程师SoumithChintala表示:“显然谷歌解雇了整个Python基础团队,WTF!”0000新型多模态表示学习方法FACTORCL
要点:FACTORCL是一种新的多模态表示学习方法,旨在解决对比学习在低共享或高独特信息情境中无法收集任务相关信息的问题。该方法通过因子化任务相关信息为共享和独特信息,并通过最大化互信息下界获取任务相关信息,最小化互信息上界提取任务不相关信息,实现了对任务相关信息的优化学习。FACTORCL采用多模态增强来评估任务相关信息,使得在自监督情景中实现了任务相关性的建立,无需显式标记。站长网2023-11-21 15:51:230000亚马逊 AWS 首席执行官:模型选择和灵活性、企业级安全和隐私保护以及数据策略是生成式人工智能的三大基石
站长之家(ChinaZ.com)7月21日消息:亚马逊AWS首席执行官AdamSelipsky日前在接受采访时表示,生成式人工智能仍处于早期阶段,相当于在十公里赛跑中跑几步。现在确定结果还为时过早。他将其比作互联网的早期,当时很难预测领先的互联网公司。生成式人工智能需要实验、多种选择和归纳。站长网2023-07-21 15:17:290000