计算机视觉领域主流的算法和方向有哪些?

如题所述

人工智能是当下很火热的话题,其与大数据的完美结合应用于多个场景,极大的方便了人类的生活。而人工智能又包含深度学习和机器学习两方面的内容。深度学习又以计算机视觉和自然语言处理两个方向发展的最好,最火热。大家对于自然语言处理的接触可能不是很多,但是说起计算机视觉,一定能够马上明白,因为我们每天接触的刷脸支付等手段就会和计算机视觉挂钩。可以说计算机视觉的应用最为广泛。

计算机视觉的定义是:基于感知对象做出对客观对象和场景有用的决策。目前发展较为主流的几个方面分别是:图像分类、对象检测、目标跟踪、语义分割和实例分割。具体到实际应用上有人脸识别、图像检索、监控监测、生物识别以及汽车的自动驾驶等。

图像分类,就是对给定的测试对象类别进行预测,比如在一堆猫和狗的图片中区分出狗。目前用于图像分类的算法较为流行的框架是卷积神经网络,该算法在GPU上有良好的表现,通常在一周内就能完成训练。对象检测,就是在给定图片中把要检测的内容框选并标注出。若将卷积神经网络用在对象检测上,需要很大的计算量,因此,常用的算法是基于区域的卷积神经网络,将图片分为很多个区域,并在这些区域中使用卷积神经网络的算法。

目标跟踪,就是在某种场景下跟踪特定对象的过程,在无人驾驶领域中有很重要的应用。目前较为流行的目标跟踪算法是基于堆叠自动编码器的DLT。语义分割,则是将图像分为像素组,再进行标记和分类。目前的主流算法都使用完全卷积网络的框架。实例分割,是指将不同类型的实例分类,比如用4种不同颜色来标记4只猫。目前用于实例分割的主流算法是Mask R-CNN。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2020-10-26
一是人脸图像,应用于人脸识别,用于虚拟支付,安全识别等,二是深度神经网络算法,对于照片特征点进行捕捉,三是车牌识别,用于交通管理。