李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席
「这是自 Karpathy 和我2015年启动这门课程以来的第9个年头,这是人工智能和计算机视觉令人难以置信的十年!」
知名 AI 科学家李飞飞的计算机视觉「神课」CS231n,又一次开课了。
总共600多位学生报名,第一堂课的现场座无虚席:
从2015年到如今,CS231n 已经走到九个年头,也成为了一代计算机视觉专业学生心中的「必修课」:
虽然课程代码不变,但可以猜到,2024年的课程相比2021年版本的课程有不少新增内容,这还要归因于视觉生成技术三年来的巨大飞跃。
在今年初的国际消费类电子产品展览会(CES)对话中,李飞飞还给出了对今年计算机视觉领域发展的预测:
「从计算机视觉和所谓的以像素为中心的 AI 领域来说,我确实认为我们正处于非常激动人心的技术进步的边缘。我们一直在关注生成式 AI,我们一直在研究扩散模型,有人可能听说过高斯泼溅(Gaussian Splatting)或这方面的内容。我认为目前的技术浪潮中,有许多成果几乎就要实现突破了。我不确定它是否会像一年多以前的大型语言模型那样成熟,但我越来越多地看到这一点。我对此非常兴奋。」
2024年的 CS231n 仍由李飞飞主讲:
课程主页:https://cs231n.stanford.edu/
参与本年度 CS231n 的另一位讲师是来自斯坦福医学院的教员 Ehsan Adeli,他与斯坦福人工智能实验室(SAIL)、斯坦福大学人工智能研究所 (Stanford HAI) 均有合作:
课程简介如下:
计算机视觉在我们的社会中已无处不在,在搜索、图像理解、应用程序、制图、医疗、无人机和自动驾驶汽车中都有应用。其中许多应用的核心是视觉识别任务,如图像分类、定位和检测。神经网络(又称深度学习)方法的最新发展大大提高了这些最先进的视觉识别系统的性能。本课程深入探讨深度学习架构的细节,重点是学习这些任务的端到端模型,尤其是图像分类。在为期10周的课程中,学生将学习实现和训练自己的神经网络,并详细了解计算机视觉领域的前沿研究。此外,期末作业将让他们有机会在自己选择的真实世界视觉问题上训练和应用数百万参数的网络。通过多个实践作业和期末课程项目,学生将掌握设置深度学习任务的工具集,以及训练和微调深度神经网络的实用工程技巧。
据介绍,2024CS231n 课程的每个讲座视频都会发布在 Canvas 上。坏消息是,这些视频资料只有在斯坦福大学就读的学生才能获得。
CS231n 课程的迭代,可以说是见证了计算机视觉技术十年来的演进,曾带领许多人完成对这一领域理论的入门。
即使是几年前的 CS231n 课程录像,至今也有很多人在学习、怀念:
众所周知,斯坦福大学的 CS 课程覆盖范围很广。与此同时,斯坦福的另外一个热门课程「CS25:Transformers United V4」的更新,也引起了大家的高度关注:
课程主页:https://web.stanford.edu/class/cs25/
自2017年推出以来,Transformer 彻底改变了自然语言处理 (NLP) 领域。现在,Transformer 在深度学习中被广泛使用,无论是计算机视觉 (CV)、强化学习 (RL)、生成对抗网络 (GAN)、语音甚至是生物学。除此之外,Transformer 还能够创建强大的语言模型(如 GPT-3),并在 AlphaFold2中发挥了重要作用,该算法解决了蛋白质折叠问题。
这就是斯坦福 CS25课程诞生的背景。这门课邀请过不同领域 Transformer 研究的前沿人士进行客座讲座,比如 AI 教父 Geoff Hinton 就曾做过讲座,还有 OpenAI 的研究科学家 Mark Chen,主要介绍基于 Transformers 的 GPT-3、Codex;Google Brain 的科学家 Lucas Beyer,主要介绍 Transformer 在视觉领域的应用;Meta FAIR 科学家 Aditya Grover,主要介绍 RL 中的 Transformer 以及计算引擎等。
此前,CS25会在 Youtube 平台同步课程视频,已经累积了百万播放量。但这一次,CS25决定把影响力再提升一下:
第一,CS25会向所有人开放,任何人都可以通过 Zoom 接入直播参与课程。
第二,CS25每次都会邀请 Transformer 研究前沿的专家分享最新突破 —— 从 GPT 和 Gemini 等 LLM 架构到生成艺术(例如 DALL-E 和 Sora)、生物学和神经科学应用、机器人、复杂游戏的创意用例。
目前已经确定的嘉宾有:OpenAI 的 Jason Wei / Hyung Won Chung、Edward Hu,艾伦人工智能研究所 (AI2) 的 Nathan Lambert,Mistral AI / 剑桥大学的 Albert Jiang 和来自中国公司智谱 AI 的丁铭博士。
第三,参加这门课程的学生唯一的作业是每周参加讲座。
值得注意的是,在 CS25课程中,除了基于自然语言处理(NLP)的演讲内容之外,也覆盖了视觉 Transformer 的相关内容。
在这个生成式 AI 技术不断更新的时代,如果你也想「紧跟时代潮流」,不妨收藏、学习一番?
沃尔玛宣布负责任的 AI 承诺:为采用道德人工智能设定标准
站长之家(ChinaZ.com)10月18日消息:沃尔玛(Walmart)于官网发布新闻稿,宣布了其负责任的人工智能承诺。沃尔玛表示,人工智能(AI)已经深入到其业务各个方面,从如何个性化和改善顾客、会员和员工的体验,到如何通过供应链获取库存等等。站长网2023-10-18 21:18:050000iPhone、Mac 直接体验 Windows?微软重磅推出 Windows App
在Mac上运行Windows系统上的程序有什么便捷的办法?在今年的微软ignite2023大会上,微软给出了答案,其推出了一款全新的WindowsApp,这款App用于在各个设备上远程访问Windows操作系统相关应用或者其他设备。站长网2023-11-17 16:03:420000英伟达CEO黄仁勋:AI意味着每个人都可以成为程序员
日前,英伟达CEO黄仁勋表示,人工智能将使得每个人现在都可以成为计算机程序员,因为人们所需要做的就是与计算机对话,“数字鸿沟”将被填平。黄仁勋称,人工智能正在引领一场计算革命。每一个计算时代,你都可以从事之前无法做到的事情,人工智能时代显然也能为我们赋予这样的能力。站长网2023-05-30 11:03:330000比DOMOAI还原能力更强!GoEnhance AI视频转绘更稳定更流畅
GoEnhanceAI是一家提供先进图像和视频编辑解决方案的公司,通过其AI技术,用户可以将视频转换成多种不同风格的视频,实现更丰富多样的视觉效果。同时,GoEnhanceAI还能利用其先进的技术增强和提升图像至极致细节,帮助用户实现高分辨率的图像效果。官网地址:https://top.aibase.com/tool/goenhance-ai站长网2024-02-22 10:35:120004Meta又给OpenAI一记重击,视频生成Movie Gen震撼登场,甚至可以配音、编辑
视频生成领域真是越来越卷且越来越迈向实用性!在OpenAISora难产的时候,Meta首次公开展示了自家的「用于媒体的突破性生成式AI研究」:MetaMovieGen。Meta在相应博客中使用了「premiere」一词,也就是初次展示,因此手痒的用户可能还得再等上一段时间。站长网2024-10-07 02:21:480000