计算机视觉与多模态计算

开启机器之眼,看穿真实与虚拟的界线。
计算机视觉与多模态计算

课程简介

+

计算机视觉这个眼下人工智能最热门的领域之一,正在经历一场前所未有的变革。相关算法和软件的开发,如 Stable Diffusion 和 Midjourney 等工具的出现,标志着我们能以全新的方式处理和理解图像数据。这些技术不仅在艺术创作和娱乐产业中引起了巨大的兴趣,也为科学研究、医疗诊断、自动驾驶车辆,甚至是安全监控等众多领域打开了新的应用前景。

「TechX 计算机视觉与多模态计算」将带你深入探讨计算机视觉的基本概念、关键技术、以及最前沿的应用。我们将从包括图像的获取、表示和预处理的图像处理基础开始,继而学习和实践如何利用算法进行特征检测、图像分类、模式识别以及场景理解。在课程的后半段我们将聚焦于预训练模型和多模态学习,来帮助大家更好的认知当前计算机视觉的前沿技术。

当前学费:19,270 元

常规申请学费:20,410 元

课程预计成果

+

你将运用学到的知识对计算机视觉最新技术进行讨论,研究,并最终以科研海报或综述写作的形式展出;或完成一个属于你的结合计算机视觉技术的应用,包括但不限于简易版图片生成器,多模态数据处理

课程内容

+

图像处理基础;特征检测与图像分类;深度学习在计算机视觉中的应用;Text-to-image models: Stable Diffusion;多模态学习

前置要求

+

线性代数,微积分,统计基础,熟悉 Python 语法,有机器学习基础

(注:预习阶段导师与学术领袖将帮助你完成前置要求的学习)

往届导师

加州大学伯克利分校攻读计算机博士学位,从师于光场相机 Lytro 的创始人 Ren Ng。研究领域涉及计算摄影、计算机视觉和图像处理。她曾在 SIGGRAPH, CVPR 等视觉和图形学顶级会议发表文章,也担任 CVPR, ICCV 等会议的审稿人。

她利用暑假在 Facebook 和 Google 的相关科研组做研究,希望能把科研技术投入应用,希望能通过计算机和算法突破当下图片和视频的拍摄局限,让人们能更有效得通过视觉化媒介记录下身边的世界。

此外,她是伯克利 Women in Computer Science 的一员,也是伯克利人工智能实验室 BAIR 的志愿导师,她渴望更多的女性和其他少数人群可以积极自信得投入到计算机领域的学习和研究,渴望科技领域达到真正的平等。

学术助教

蒋峻涛

2023

纽约大学电子工程专业硕士

MICCAI2022 青光眼 OCT 图像分析与层分割挑战赛奖项获得者,「Vision Meets Algae」藻类图像目标检测系列赛事负责人

周成扬

2021

杜克大学 电子工程/计算机双专业

新加坡科技研究局任研究助理、新加坡科学与工程大赛金奖、国际青少年人工智能大赛一等奖、HiMCM O奖

程天越

2021

加州大学伯克利分校电子工程与计算机专业

曾获 USACO Gold。Kaggle 数据科学平台竞赛排名全球前 1%。在强化学习游戏 Halite 和康奈尔大学鸟类叫声识别比赛分别获全球前 3% 和 5%

陈境远

2022、2021

罗切斯特大学 认知与计算机科学专业

北大智能科学系英才计划研究员、MIT UV 智慧交通(ITS)研究组长、FTC世锦赛中国区第一、Tencent AI Lab实习经历

相关课程