ABOUT RELY-MEASURE
您的当前位置:主页 > 使用说明 >

图像处理应用中深度学习的重要性分析

发布时间:2020-12-15 05:56 作者:老哥论坛

  应用凭借其在识别应用中超高的预测准确率,在图像处理领域获得了极大关注,这势必将提升现有图像处理系统的性能并开创新的应用领域。

  利用卷积神经网络(Convolutional Neural Network, CNN) 等深层神经网络的解决方案,可以逐渐取代基于算法说明的传统图像处理工作。尽管图像预处理、后期处理和信号处理仍采用现有方法进行,但在图像分类应用中(缺陷、对象以及特征分类),深度学习变得愈加重要。

  利用深度学习处理某些任务更简单,效果更好,甚至某些任务只能用深度学习方法来解决。深度学习正在逐渐威胁传统图像处理方法的地位——特别是处理任务中包含有复杂变量时(如反射面、光照不佳的环境、光照变化或移动的对象)。

  深度学习具有平移不变性的优点,这部分使用传统处理方式需要大量的投入。但如果需要对图像中的对象或错误进行定位、标定、代码读取或后期处理,则传统算法更具有优势。

  深度学习包括神经网络的训练和学习、网络的实现和推断运算、网络的CNN 算法在图像上的执行与分类结果的输出。用于训练的数据越多,分类的预测精度就会越高。由于数据量庞大,训练神经网络时通常选用GPU。

  基于各种不同技术的处理器,是否都能满足工业图像处理中的特殊需求呢?CNN应用必须执行快速(推断)同时满足极低的时延。在满足处理速度的同时,还要满足高带宽、低发热、实时性以及供货周期长这些需求,仅仅使用传统CPU或GPU 是难以实现的,它们通常可以为非工业领域的图像处理任务提供更合适的解决方案,在这些领域的识别任务尽管同样复杂,但相对较低的数据吞吐性能即可满足需求。各个平台之间区别很大,仅从技术指标方面就能看出,它们无法应用于高要求的任务。尽管GPU 的推断耗时比CPU 或特殊芯片短得多(如TPU -TensorFlowProcessing Units、TensorFlow 处理单元以及IntelMovidius处理器),但是其数据吞吐量这项指标只能达到大约每秒50MB这样一个较低的水平。

  在通常的图像处理应用中,只需要对少数几个特性进行分类,因此选择小型或中型网络通常就足以应对,AlexNet、SqueezeNet 或MobileNet 都是这类网络的典型代表。这几种网络类型在机器视觉领域,预测精度、网络大小和计算速度以及带宽这几方面有着良好的平衡。这里可以很明显地看到,通过选择合适的网络,可以在牺牲小部分检测精度的同时,获得数据吞吐量方面的极大提高,同时也为优化资源和提高分类质量提供了可能性。

  在很多图像处理任务的需求中,特别是机器视觉领域,FPGA可以作为独立处理单元或与ARM处理器一起构成SoC。FPGA 具有高度并行处理能力、稳定的图像采集能力以及相对于CPU 和GPU更高的运算性能、图像帧率和带宽。基于FPGA的CNN应用可完成高带宽的分类工作,这尤其适用于高速在线检测。

  FPGA支持直接在图像采集卡或在嵌入式视觉设备上处理图像数据——从采集到输出以及外围设备控制——且无任何CPU占用,这个特点让FPGA特别适用于高强度运算的应用,如CNN。因此未配备GPU 的小型PC 也能使用,从而可降低整体系统成本。在工业环境温度下,FPGA的能效比GPU高十倍,是嵌入式设备的理想之选,这显著扩大了深度学习在工业4.0 以及无人机自动驾驶领域的应用。

  GPU拥有更高的计算精度和更高的预测精度,但这些是以更短的供货周期、更高的功耗以及更低的数据吞吐量为代价的。在一个示范性的对比中,基于FPGA的解决方案的数据处理性能是使用GPU的类似解决方案的7.3倍左右。

  在深度学习领域,存在各种不用降低分类质量就能节省资源的方法。其中之一是通过图像缩放来降低数据吞吐量,或者改变数据位深:我们的项目经验表明,数据的位深对后来的预测精度影响甚微。将数据位深32位浮点数降为8位定点数或整数,可以让FPGA将节省下来的资源用于更大的网络架构,或实现更高的数据吞吐量,从而实现处理速度的提升,这对例如焊缝检测或机器人技术这类应用非常有意义。通过类似的预处理降低数据量,让更适合FPGA的小型网络的使用成为可能,这样的网络通常足以处理缺陷特征较少的简单分类任务。

  32 位浮点GPU 虽然拥有更高的计算精度,但这一点对深度学习的推断而言无关紧要,在FPGA中使用8位定点运算的网络,能为大多数深度学习应用提供足够精确的预测精度,误差几乎可以忽略不计。如果需要特别高的计算精度,可以采取一种资源折中策略,在更大的FPGA 上使用16位定点运算。

  现在已经有了能完美满足工业生产的高速处理需求的解决方案,通常使用高性能图像采集卡或者嵌入式视觉设备,例如使用大型FPGA和高分辨率传感器的智能相机。利用多种多样的FPGA 资源,可以处理更复杂的架构以及应用。有了更高的数据带宽,能够在FPGA上对整幅图像进行处理,或进行额外的图像预处理以及后期处理,例如对GigE Vision相机的最大数据输出带宽的深度学习运算也完全能够满足。

  与传统图像处理相比,深度学习应用需要在训练方面投入较多时间,但是相较其带来的可靠性和处理速度,这些投入是值得的。图像采集卡和(嵌入式)视觉设备上所使用的FPGA技术,令神经网络应用于工业级应用成为可能,这需要强大的实时处理能力、低延迟(实时在线检测)、高数据吞吐量、高带宽和低功耗低发热(嵌入式视觉应用),以及高分辨率。FPGA 及图像采集卡较长的供货周期保障了投资安全性,同时由于系统可快速的整合且整体系统成本较低,用户可以节省长期支出。

  在落地AI场景的同时,客户也希望对建立GPU资源池做一个评估。针对客户需求,做了一些功课。对于AI,....

  使用单片机非常常用。但是在FPGA中,由于浮点运算问题。使用PID就优点麻烦。 下面是我设计的一个PID的Verilog程序。...

  传统的数字电压表设计通常以大规模ASIC(专用集成电路)为核心器件,并辅以少量中规模集成电路及显示器....

  目前的安卓手机尽管已经做到了非常高的易用性,但是和 Windows 设备比起来,其驱动更新的方式还比....

  三星发布Samsung GameDriver App可以单独更新 GPU 驱动

  12月13日消息 目前的安卓手机尽管已经做到了非常高的易用性,但是和 Windows 设备比起来,其....

  随着近期美国持续打压我国通信企业中兴与华为,对其禁运芯片、罚款、禁止代工。国人的注意力开始转向芯片行....

  凭着“可编程性”和“灵活性”等特性,FPGA近几年在5G通信、人工智能等具有较频繁的迭代升级周期、较....

  从上一代Turing图灵显卡开始,NVIDIA在GPU单元中引入RT Core,专门负责光线

  光纤-wifi备份型-4百兆电口+1路百兆光口工业轨式光端机采用工业轨式设计,设备为点对点结构设计,....

  多少年来,让不知疲倦的机器人代替人类干活,把人类从简单重复的劳动中解放出来,一直是科技发展的终极目标....

  工业轨式环网型1路Profibus-DP光端机采用大规模FPGA设计,采用独创技术,可同时支持 1路....

  根据外媒 VideoCardz 的消息,用于笔记本的移动版 RTX 3070 显卡已经现身 V-Ra....

  功耗是需要考虑的重要因素之一,对于功耗,我们应当给予一定的关注。在往期功耗相关文章中,小编对FPGA....

  对于研发人员而言,大家总是在追求低功耗设计。采用低功耗设计,无疑是能够带来诸多好处。为帮助大家了解如....

  该计数器从0 计数到4294967295,然后回滚到0 并重新开始计数。它只需要FPGA 上一点点的....

  VGA 连接器的13 和14 引脚(HS 和VS)为数字信号,所以可以直接由FPGA的两个引脚驱动(....

  FPGA 可以轻松实现二进制计数器。例如,在回滚之前,16 位计数器将从0 到65535(65536....

  CPLD/FPGA是目前应用最为广泛的两种可编程专用集成电路(ASIC),特别适合于产品的样品开发与....

  最为理想的LED 控制源是电流电源,FPGA 的引脚都是电压控制的,所以最简单的解决方法就是加一个电....

  Docker Desktop 的 3.0.0 版本提供了对 Apple Silicon 的支持

  本周四,我们迎来了 Docker Desktop 的 3.0.0 版本。其最大的变化,就是提供了对 ....

  英特尔于12月09号发布了英特尔® oneAPI工具包的正式版本(即11月宣布将推出的英特尔oneA....

  人工智能的兴起触发了市场对 GPU 的大量需求,但 GPU 在 AI 场景中的应用面临使用寿命短、使....

  英特尔于 12 月 9 日发布了 oneAPI 工具包正式版,即 11 月宣布将推出的英特尔 one....

  人们在日常生活中经常需要识别不同的面孔,其中既包括我们所熟悉的亲属、朋友、同事及知名人士等的面孔,也....

  在超过 85% 的 FPGA 中发现在前端工作中就可能可以清除的BUG , 但是 BUG 却流入了后....

  本文档的主要内容详细介绍的是FPGA仿真的学习课件和工程文件免费下载包括了:1、testbench编....

  Xilinx7系列FPGA包括四个FPGA系列,它们都是为最低功耗而设计的,以使一个通用设计能够跨系....

  本文档的主要内容详细介绍的是FPGA硬件基础之FPGA的RAM存储课件和工程文件。

  国微集团EDA硬件仿线年EDA行业领军企业国微集团大动作频频,继自动化布局布线工具之后,又一款重量级产品已经蓄势待....

  随着全可编程SoC产品的推出,Xilinx为设计人员提供了一种快速、有效、可靠地构建更智能系统的强大....

  主要内容:设计一个一位的全加器,从真值表开始,介绍门级实现,然后形成电路图,对功能进行仿真验证,最后....

  本文档的主要内容详细介绍的是FPGA硬件基础知识FPGA的逻辑单元工程文件免费下载。

  本文档的主要内容详细介绍的是FPGA硬件基础之FPGA时钟资源的工程文件免费下载。

  本文档的主要内容详细介绍的是FPGA硬件基础之FPGA的逻辑单元的工程文件免费下载。

  AMD 内部似乎正在测试基于 RDNA2 的 Radeon RX 6000M 移动 GPU,针对于笔....

  Deepfake是一种换脸技术,可以将图片或视频中A的脸换到B的头上。其名字由深度机器学习(deep....

  本章介绍了高云半导体FPGA 产品的时钟资源,包括专用的时钟输入、缓冲区和布线资源。时钟的基础设施提....

  本文档的主要内容详细介绍的是FPGA硬件基础之理解FPGA时钟资源的工程文件免费下载。

  Xilinx7系列FPGA包括四个FPGA系列,它们都是为最低功耗而设计的,以使一个通用设计能够跨系....

  高云半导体FPGA 产品具有丰富的高速时钟资源,具有低抖动和低偏差性能,可以支持I/O 完成高性能数....

  亚马逊云服务(AWS)利用Gaudi AI处理器,来降低深度学习模型成本

  12月10日消息,据国外媒体报道,亚马逊云服务(AWS)利用Gaudi AI处理器,来降低深度学习模....

  随着技术的进步和智能工厂的发展,过去十年中机器视觉设备发生了翻天覆地的变化。亚太地区将继续成为全球最....

  瑞萨前期用户套件使开发人员可以对存算一体化(PIM)AI加速器IP(注1)进行早期评估,该IP可实现....

  双11刚过去,转眼间双12又悄然来到。为了应对即将到来的购物节,很多商家都在店铺首页对热销产品进行了....

  2020年12月10日,“中国集成电路设计业2020年会暨集成电路产业创新发展高峰论坛” (ICCA....

  Graphcore IPU-M2000在首个benchmark测试中显著优于GPU

  Benchmark中包括了BERT-Large(基于Transformer的自然语言处理模型)在IP....

  随着全可编程SoC产品的推出,Xilinx为设计人员提供了一种快速、有效、可靠地构建更智能系统的强大....

  IC验证UVM验证平台加入factory机制(六)

  加入factory机制 上一节《IC验证一个简单的UVM验证平台是如何搭建的(五)》给出了一个只有driver、使用UVM搭建的...

  module VGA(CLK,HS,VS,R,G,B); CLK; &...

  求救! 我有项目需要使用以前的Xilinx老项目工程(99年)。 我一直打...

  TMP411 ±1°C Programmable Remote/Local Digital Out Temperature Sensor

  TMP411设备是一个带有内置本地温度传感器的远程温度传感器监视器。远程温度传感器,二极管连接的晶体管通常是低成本,NPN或PNP型晶体管或二极管,是微控制器,微处理器或FPGA的组成部分。 远程精度为1 C适用于多个设备制造商,无需校准。双线串行接口接受SMBus写字节,读字节,发送字节和接收字节命令,以设置报警阈值和读取温度数据。 TMP411器件中包含的功能包括:串联电阻取消,可编程非理想因子,可编程分辨率,可编程阈值限制,用户定义的偏移寄存器,用于最大精度,最小和最大温度监视器,宽远程温度测量范围(高达150C),二极管故障检测和温度警报功能。 TMP411器件采用VSSOP-8和SOIC-8封装。 特性 1C远程二极管传感器 1C本地温度传感器 可编程非理想因素 串联电阻取消 警报功能 系统校准的偏移寄存器 与ADT7461和ADM1032兼容的引脚和寄存器 可编程分辨率:9至12位 可编程阈值限...

  TMP468器件是一款使用双线 C兼容接口的多区域高精度低功耗温度传感器。除了本地温度外,还可以同时监控多达八个连接远程二极管的温度区域。聚合系统中的温度测量可通过缩小保护频带提升性能,并且可以降低电路板复杂程度。典型用例为监测服务器和电信设备等复杂系统中不同处理器(如MCU,GPU和FPGA)的温度。该器件将诸如串联电阻抵消,可编程非理想性因子,可编程偏移和可编程温度限值等高级特性完美结合,提供了一套精度和抗扰度更高且稳健耐用的温度监控解决方案。 八个远程通道(以及本地通道)均可独立编程,设定两个在测量位置的相应温度超出对应值时触发的阈值。此外,还可通过可编程迟滞设置避免阈值持续切换。 TMP468器件可提供高测量精度(0.75C)和测量分辨率(0.0 625C)。该器件还支持低电压轨(1.7V至3.6V)和通用双线制接口,采用高空间利用率的小型封装(3mm×3mm或1.6mm×1.6mm),可在计算系统中轻松集成。远程结支持-55C至+ 150C的温度范围。 特性 8通道远程二极管温度传感器精度:0.75&...


老哥论坛
Copyright © 2018 老哥论坛 All Rights Reservrd 版权所有 技术支持:捷搜网络
网站部分图片来自互联网,如有侵权,请及时通知,我们会及时更换!