2023 年最重要的 3 项人工智能创新:多模态 AI、宪法 AI 和文本转视频技术
站长之家(ChinaZ.com) 12 月 22 日消息:2023 年,人工智能(AI)领域见证了重大进展,不仅公众对 AI 有了更深的理解,政府也开始认真对待 AI 风险。本年度的发展不仅是新技术和理念的出现,更是长期孕育后的集中爆发。
以下是过去一年中人工智能领域最重要的三项创新:
多模态 AI(Multimodality)多模态 AI 指的是 AI 系统处理各种不同类型数据的能力,不仅包括文本,还包括图像、视频、音频等。今年,公众首次获得了强大的多模态 AI 模型的访问权限。OpenAI 的 GPT-4 是其中的先锋,允许用户上传图像以及文本输入。例如,用户可以基于冰箱内容的照片询问 GPT-4 晚餐应该做什么。9 月,OpenAI 推出了用户通过语音以及文本与 ChatGPT 互动的功能。
宪法 AI(Constitutional AI)宪法 AI 尝试解决如何使 AI 符合人类价值观的难题。2022 年 12 月,顶尖 AI 实验室 Anthropic 的研究人员首次描述了宪法 AI,并在其 2023 年推出的聊天机器人 Claude 中使用了这一技术。该技术的核心是先撰写一份表达期望 AI 遵循的价值观的「宪法」,然后训练 AI 根据宪法评分响应,并激励模型输出得分更高的响应。这是一种 AI 反馈的强化学习方法,与人类反馈的强化学习相比,更精确控制 AI 行为,且需更少的人类标签。
文本转视频技术文本转视频工具的迅速崛起是今年投入 AI 领域的数十亿美元资金的显著成果。布鲁克林的 AI 视频初创公司 Runway 的最新模型 Gen-2 允许用户不仅根据文本生成视频,还能根据文本提示改变现有视频的风格。此外,另一家初创公司 Pika AI 正在使用其技术每周创建数百万新视频。这些免费工具试图改变用户生成内容的格局,可能在 2024 年发生,但由于文本转视频工具计算成本高,一旦风险资本用尽,它们可能开始收费。
北大推出首个多轮多模态PPT任务完成基准PPTC GPT-4完成正确率仅6%
要点:1.北大和微软亚洲研究院的研究人员提出了首个多轮多模态PPT任务完成基准PPTC,以评估大型语言模型在复杂多模态环境中的性能。2.评估表明,GPT-4是在创建新PPT文档任务中表现最强的模型,但仍然存在挑战,如错误累积、处理长PPT模板的能力差,以及多模态指令的复杂性。站长网2023-11-07 22:05:350000好莱坞编剧持续罢工,Netflix等电影公司坚持百万美元招聘AI岗位
文章概要:1.电影电视公司发布了提供年薪20万至100万美元的人工智能职位广告,而好莱坞编剧罢工已持续3个月。2.Netflix、迪士尼、索尼等公司招聘人工智能相关职位,年薪在20万至100万美元之间。3.好莱坞编剧不仅为争取更高报酬而罢工,也在抗议人工智能抢走他们的工作。最近,尽管好莱坞的编剧和演员继续抗议使用人工智能,但电影和电视制作公司还是针对人工智能相关职位发布了招聘广告。站长网2023-08-29 11:03:420000抖音推出全新AI社交产品“话炉” 能陪你闲扯还能讲故事、猜谜语
据Tech星球的报道,抖音再次推出了全新的社交产品“话炉”,这次加入了AI的元素。继多闪、飞聊之后,抖音再次在社交领域发力。“话炉”是一款基于字节旗下云雀大模型驱动的角色聊天产品。用户可以通过与个性鲜明、背景各异的AI角色实时聊天互动,满足闲谈生活日常、进行深入交流或演绎剧情故事等需求。这一创新的社交方式,无疑为用户提供了全新的互动体验。站长网2024-03-06 15:37:570001周鸿祎回应拍卖迈巴赫600:起拍价600元 将全额捐赠
周鸿祎于4月28日发文,就即将举行的迈巴赫600拍卖活动进行回应,并宣布起拍价为600元。他在文中提到,他计划通过直播拍卖这辆二手迈巴赫,旨在倡导更多企业家转向使用国产新能源车与智联车,并坚信这些车辆将重新定义“豪车”概念,成为消费者的首选。站长网2024-04-28 20:40:430000「计算机基础」CPU历史之Intel系列
在之前《「计算机基础」计算机是怎么认识代码的》这篇文章的末尾,我们提到了世界上第一款微处理器4004是Intel公司的,本篇文章我们来看看Intel系列的产品。Cpu历史之intel系列4004站长网2023-05-24 19:13:520000