Цель задачи создания компьютерного зрения (КЗ) – проложить мостик между тем, что видит компьютер, и, что видим мы.
Для компьютера изображение — это набор пикселей, у каждого из которых есть своё значение цвета.
Что в действительности зрение обозначает? Зрение – это источник метрической и семантической информации о трехмерном мире. Т.е., с помощью зрения мы определяем размеры объектов, расстояния до них и между ними, а также можем словесно описать, к какой категории они относятся и как взаимодействуют между собой.
Люди, начинающие работать в нашей области, часто не могут понять разницу между обработкой изображений и компьютерным зрением. Вот простое правило.
При обработке изображений входом является изображение или видео, а выходом обычно является другое изображение или видео. Выходное изображение иногда является улучшенной (например, улучшенной яркостью и контрастностью) версией входного изображения. Иногда это обработанная версия входного изображения, так что на выходе получается упрощенная версия входного изображения (например, бинаризация, обнаружение краев и т. Д.). В других случаях это сжатая (например, JPEG) версия изображения или видео. Важно то, что на выходе получается изображение или видео.
В компьютерном зрении входом является изображение или видео, а выходом — информация, содержащаяся в них. Например, в стереофоническом алгоритме входом является пара изображений, а выходом — карта глубины (внутренне рассчитанная OpenCV AI Kit (OAK) ). Результатом также может быть метка класса, как мы видим в классификации изображений, или набор ограничивающих рамок и меток классов, как мы видим при обнаружении объектов.
Компьютерное зрение – результат обработки изображений, полученных от цифровой камеры, для принятия соответствующих решений. Например, мы хотим сконструировать систему помощи водителю, которая автоматически детектирует пешеходов, и если пешеход оказался достаточно близко перед машиной, то она начинает автоматически тормозить (см. Where are Self-Driving Cars?).
Для решения подобных задач нужно прежде всего понять, что из себя представляет изображение, какие физические и геометрические закономерности используются для его получения, а потом рассмотреть алгоритмы и подходы к решению задач КЗ, которые известны на сегодняшнее время.
Ниже рассматриваются ряд основополагающих задач, имеющих отношение к обработке изображений и компьютерному зрению:
- Best Computer Vision projects With Source Code And Dataset
- Introduction to Computer Vision with OpenCV
- Computer Vision — Making the machines see
- Формирование изображения в цифровой камере.
- Модели цвета.
- Алгоритмы cжатия изображений.
- Предварительная обработка изображений.
- Выделение, отслеживание и описание контуров.
- Сегментация.
- Алгоритмы вычитания фона.
- Выделение особенностей на изображении.
- Поиск похожего изображения.
- Поиск объектов на изображении.
- 3D реконструкция по изображениям
- Image Processing and Filtering Techniques
- Draw Contours on an Image using OpenCV
- Practical Computer Vision using OpenCV and Python (Basics)
Полезные ссылки:
- What is Computer Vision?
- What is Objects Tracking in Computer Vision?
- Basics of Computer Vision: 1. Interpolation and Resizing
- Color Theory in Computer Vision
- Computer Vision and Deep Learning- Part 1
- Computer Vision
- LearnOpenCV (Satya Mallick)
- Open CV, Computer Vision, AI, How does it work?
- Important Python Snippets for Image Processing
- Number Plate Detection of car
- Fetching Car Details using Computer Vision and OCR
- Application of Computer Vision in different Industries
- Applications of Computer Vision in AI for Various Key Industries
- Creating a Vehicle Detection and Classification ML pipeline using YOLO and MobileNet transfer learning
- How crucial is Image Annotation for Agriculture to Adapt AI?
- Detecting Unwanted & Hazardous Objects with Vision AI
- 3 Under-The-Radar Sectors That Will Be Revolutionized By AI
- Making A Low-Cost Stereo Camera Using OpenCV
- Driverless Cars
- Когда компьютеры научатся видеть?
- Computer Vision Tools And Libraries
- Биометрическая идентификация и аутентификация
- Fully Convolutional Network (Semantic Segmentation)
- AI : The Future of Photography
- Recent Advances in Modern Computer Vision
- Machine Learning for Vehicle Detection
- Document Scanner using Computer Vision
- Text Recognition
- Introduction to Video Classification and Human Activity Recognition
- Athlete Pose Detection Using OpenCV in Deep Learning
- Image Zoom using Computer Vision using OpenCv and Python
- Seamless Cloning using OpenCV ( Python , C++ )
- Invisibility Cloak using simple CV techniques in OpenCV
- Sign Language Detection Using OpenPose in Colab
- Advanced Techniques for Lane Finding (Self Driving Cars)
- How to Repair Damaged Images using Inpainting methods in Python using OpenCV
- All you need to know about Computer Vision
Автор: Николай Свирневский