计算机视觉领域中检索增强生成(RAG)技术的精选资源库

涵盖图像理解、视频理解、视觉生成等多领域应用;提供丰富的研究论文和教程资源,助力学术研究与实践;持续更新,紧跟RAG技术前沿动态

Awesome-RAG-Vision | #计算机视觉
Roboflow Notebooks:一站式的计算机视觉教程宝库,从基础架构到前沿模型,轻松入门。| #计算机视觉

涵盖47个前沿模型教程,如YOLO11、SAM 2等;提供20种计算机视觉技能实战,如车辆速度估计、自动化标注;每周更新视频教程,紧跟技术前沿
一种面向语义字体设计的技术,可以在保持词的可读性的同时,在视觉上传达词的意思,可以用大型预训练的语言-视觉模型实现自动化。

图文合一(Word-as-image) | #计算机科学
斯坦福《CS231A计算机视觉:从3D重建到识别》课程资料

介绍计算机视觉中的概念和应用,主要涉及几何和3D理解。主题包括:相机和投影模型,低级图像处理方法,如滤波和边缘检测;中级视觉主题,如分割和聚类;从立体进行形状重建;高级视觉主题,例如学习的低级视觉表示;深度估计和光学/场景流;6D姿势估计和对象跟踪。先决条件:线性代数,基本概率和统计。

Index | Course Notes | #计算机视觉
康奈尔大学《计算机视觉导论》课程

课程地址 | #计算机视觉
一种开源工具,可轻松快速构建和部署计算机视觉工作流。你可以将喜欢的框架(如OpenCV,Detectron2,OpenMMLab或YOLO)与来自各个存储库的最佳先进算法混合在一起。

毫不费力,只需选择想要的内容,Ikomia 就会下载,安装需求并在几行代码中运行所有内容。

Ikomia API |Docs | #计算机视觉 #工具
计算机视觉,自然语言处理和机器学习运维学习资源库

项目地址 | #计算机视觉 #机器学习
EasyCV是一个涵盖多个领域的基于Pytorch的计算机视觉工具箱,聚焦自监督学习和视觉transformer关键技术,覆盖主流的视觉建模任务例如图像分类,度量学习,目标检测,关键点检测等。

核心特性:

📌SOTA 自监督算法

EasyCV提供了state-of-the-art的自监督算法,有基于对比学习的算法例如 SimCLR,MoCO V2,Swav, Moby,DINO,也有基于掩码图像建模的MAE算法,除此之外我们还提供了标准的benchmark工具用来进行自监督算法模型的效果评估。

📌视觉Transformers

EasyCV聚焦视觉transformer技术,希望通过一种简洁的方式让用户方便地使用各种SOTA的、基于自监督预训练和imagenet预训练的视觉transformer模型,例如ViT,Swin-Transformer,Shuffle Transformer,未来也会加入更多相关模型。此外,我们还支持所有timm仓库中的预训练模型.

📌易用性和可扩展性

除了自监督学习,EasyCV还支持图像分类、目标检测,度量学习,关键点检测等领域,同时未来也会支持更多任务领域。 尽管横跨多个任务领域,EasyCV保持了统一的架构,整体框架划分为数据集、模型、回调模块,非常容易增加新的算法、功能,以及基于现有模块进行扩展。

推理方面,EasyCV提供了端到端的简单易用的推理接口,支持上述多个领域。 此外所有的模型都支持使用PAI-EAS进行在线部署,支持自动伸缩和服务监控。

📌高性能

EasyCV支持多机多卡训练,同时支持TorchAccelerator和fp16进行训练加速。在数据读取和预处理方面,EasyCV使用DALI进行加速。对于模型推理优化,EasyCV支持使用jit script导出模型,使用PAI-Blade进行模型优化。

项目地址 | #计算机视觉 #工具
哥伦比亚大学《计算机视觉第一原理》课程

这个关于计算机视觉的系列讲座由哥伦比亚工程学院的 TC Chang 计算机科学教授Shree Nayar主持。它专为没有计算机视觉知识的学生、从业者和爱好者而设计。

官网地址 | YouTube频道 | #教程 #计算机视觉
面向计算机视觉的Transformer:架构、技巧与提升

传送门 | #计算机视觉
约克大学《面向计算机视觉的深度学习》课程资料

本课程将涵盖深度学习和计算机视觉交叉领域的一系列基础主题。

主页 | #计算机视觉
计算机视觉最佳实践、代码示例和相关文档

该存储库提供了用于构建计算机视觉系统的示例和最佳实践指南。该存储库的目标是构建一套全面的工具和示例,以利用计算机视觉算法、神经架构和操作此类系统的最新进展。我们不是从头开始创建实现,而是从现有的最先进的库中汲取灵感,并围绕加载图像数据、优化和评估模型以及扩展到云端构建额外的实用程序。

这些示例和实用程序希望通过将从定义业务问题到开发解决方案的经验简化几个数量级,从而显着缩短“上市时间”。此外,示例笔记本将用作指南,并以多种语言展示工具的最佳实践和使用情况。

示例以Jupyter 笔记本常用实用程序功能的形式提供。所有示例都使用 PyTorch 作为底层深度学习库。

computervision-recipes | #计算机视觉
新加坡国立大学《3D计算机视觉》课程

YouTube | #计算机视觉
面向3D计算机视觉的Web版3D可视化工具。可以直接从Python代码导入3D边界框、点云、网格和特征对应关系,并在本地浏览器中查看它们

在线演示| 安装 | 教程 | 文档 |Github | #可视化 #工具 #计算机视觉
CVAT 是一种用于计算机视觉的交互式视频和图像注释的开源工具。它被全球数以万计的用户和公司使用。

CVAT 核心团队将该工具的积极开发转移到这个新存储库。目的是帮助世界各地的开发人员、公司和组织使用以数据为中心的 AI 方法解决实际问题。

在线使用 | 自托管解决方案 | Github | #计算机视觉 #工具
机器学习&深度学习纲要(2017-2020),内容包括统计学、机器学习、深度学习、计算机科学、数据科学、深度视觉、NLP、云计算等领域的话题、链接和总结

GitBook | GitHub | Google Docs | #机器学习 #计算机科学
 
 
Back to Top