百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

深度学习(计算机视觉方向)入门的一些建议

moboyou 2025-05-04 15:20 6 浏览


来自:知乎,作者:阿小博Dennis

链接:
https://zhuanlan.zhihu.com/p/43312693


从研一入学到现在刚好一年了,刚入学的时候对这方面是一点也不懂,那时实验室的没有GPU的电脑还以为很强,哈哈。即使现在,我也不敢说有多懂,只是把我这将近一年学到的过程分享一下,如果有需要的朋友们可以参考看一下,也可能有许多错误的地方,希望大家帮我指正出来一起提高。

我记得最开始的时候老师让我使用matlab,然后去学校的二手书店买了冈萨雷斯的数字图像处理和数字图像处理(matlab)版,简单读了一下,里面有很多公式和理论的东西。然后我用matlab简单实现了一下里面的一些基本操作,比如说图片的输入输出,边缘检测,二值化,腐蚀膨胀等一些传统的处理手段,虽然现在深度学习用的不是很多,但是有时候一些情况还是需要使用的,而且对于处理图像的我们来说,多多少少还是需要知道一些的,以后写论文的时候也会用到去画图。

在这之后我还研究了一段时间的追踪,看了一些帧差法,光流法,背景差分法什么的,已经记不住了,就剩个大概意思了,然后就去研究目标检测了。

后来10月份的时候我们报名了一个京东的猪脸识别大赛,可是发现什么都不会,感觉好心塞,慢慢的开始知道机器学习了,我在网上找了一些博客看了一些那种概述,大致知道了什么意思。随后我在自己原来那台没有GPU的电脑上装了ubuntu,这也是我第一次真正意义上用linux,之前在windows上装过虚拟机的centos,我也没怎么用。在我大概知道了这些以后,我发现我需要学习一门语言——python

然后我就加了各种QQ群,问大家该如何学习,之后我选了一本python教材,名字我忘了就是什么零基础入门什么的,后来我发现直接去菜鸟教程网站看就可以了,把基础的看一下,如果你是计算机专业的或者之前编过程序,那应该很快就看完了,建议直接学python3,网站地址:Python 基础教程 | 菜鸟教程
https://www.runoob.com/python/python-tutorial.html
。我之后又找了一个打飞机的游戏(别想多了)跟着教程编完了一个小项目,大致知道了这门语言的使用。

对于linux的学习,如果之前没用过ubuntu,建议去了解一下基本的系统操作和命令就好,比如cd,sudo,rm,clone,git什么的,因为之后的一些命令也是别人告诉你或者上网查,不用一下全记住,如果你要深入学的话,那就自己去找找教程吧。

我还忘了说,python,Linux,还有之后的各种深度学习框架什么的,我有很多都去看了莫烦的视频,那个我觉得入门真的挺有用的,即使现在看也有很多要学的,而且有很多系列,真的对于这种自己录的要支持一下!不容易。地址:莫烦Python
https://morvanzhou.github.io/

opencv也要学一下,有c++和python版的,原理基本一样,只是实现的语言不同,很猛的开源视觉库,可以买一本opencv3教程看一下,这个书网上比较统一,大部分都是这本。

在学完这些,我就要开始了解深度学习和卷积神经网络了,这时,一位大神的视频映入眼帘,他就是——吴恩达!这个的基本原理和过程我都是看的他的视频,真的非常棒,我看了好几遍,对神经网络的解读比较透彻,反向传播和梯度下降讲的都比较细,废话不多说了,网站:深度学习工程师微专业 - 一线人工智能大师吴恩达亲研-网易云课堂 - 网易云课堂
https://mooc.study.163.com/smartSpec/detail/1001319001.htm
,而且网易云课堂上还有很多其他的课,根据你喜欢的也可以去学一下。

看完这个之后,我就去学习了pytorch和tensorflow了,但比较遗憾的说,到现在我也没有好好掌握他俩,只是能简单的编一些东西。可能也是我学的比较杂,你可以选择一个框架好好学学,对于这两个框架,莫烦的还有他们的官方文档都很详细,你可以选择去看。我当时是买的书,pytorch 的我买的博文的:深度学习入门之——pytorch,tensorflow的我买的机械工业出版社的深度学习之tensorflow入门,原理与进阶实战。这两本都很适合入门。而且现在已经出了很多什么卷积神经网络进阶实战啊,有很多,我看了目录,都很不错。可以自己挑一挑。caffe我没有学,这三种caffe比较学术,pytorch比较容易入门,tensorflow普及比较多,(松明同学指出我此处表述有误,修改如下,谢谢提醒:keras是基于tf的一个高级神经网络API)可以自己选择一下。

关于深度学习环境的配置,可以参考我的另一篇文章,那里有详细的配置,环境有点老,但是换汤不换药,基本过程都那样,现在比较忙我还没有更新,配环境对于新手来说挺痛苦的,一定要坚持下去,我说我当时配了1个月你敢信?

我目前研究的是目标检测,很多方法在github上都有公开的代码,可以下载运行慢慢研究,有的时候配完了不好用慢慢调,要有耐心,最后一定会解决的,我已经试了很多次了。而且QQ群有的时候还是挺有用的,虚心请教。

暂时先写这么多吧,如果你的学习道路上也有什么好的方法可以发一下,我们一起学习!还有我现在在实习,公司的同事们也很照顾我,给我讲一些学术道路上的方法啊,工作上的计划啊,帮助我修改论文,很开心遇到他们!所以,如果你是研一的小伙伴们,这一年抓紧时间学学,研二就可以出来实习一波了(前提你的论文怎么也得有个方向吧,并且老板要同意)!


声明


来源:知乎,人工智能产业链联盟推荐阅读,不代表人工智能产业链联盟立场,转载请注明,如涉及作品版权问题,请联系我们删除或做相关处理!

相关推荐

声学EI要完稿?十步速写法

【推荐会议】国际声学与振动会议(ICAV)会议号:CFP23112A截稿时间:2025年4月20日召开时间/地点:2025年8月15-17日·新加坡论文集上线:会后3个月提交EiComp...

结构力学!EI会议图表规范秘籍

推荐会议:国际结构与材料工程进展大会(ISME2026)会议编号:EI#73521截稿时间:2026年3月10日召开时间/地点:2026年8月15-17日·德国柏林论文集上线:会后4...

傅里叶级数物理意义的直观理解:利用傅里叶级数逼近方波信号

上篇文章将向大家介绍频谱的概念,对傅里叶级数、傅里叶积分、傅里叶变换进行了数学的推导,并解释了它们各自的物理意义。推导过程见我的上一篇文章:频谱分析——频谱概念(傅里叶变换、级数、积分及物理意义)如下...

通过对航空发动机整机振动进行分析,有何控制方法?

前言针对航空发动机整机振动问题的复杂性和多样性,以整机振动的振源分析为出发点,总结国内外关于转子系统故障、气流激振、轴承故障、齿轮故障和结构局部共振等引起的整机振动的研究情况。结合航空发动机整机结构动...

MATLIB中使用PCA

主成分分析PCA(PrincipalComponentsAnalysis),奇异值分解SVD(Singularvaluedecomposition)是两种常用的降维方法降维致力于解决三类问题:降维...

数据处理|软件:让科研更简单2

书接上回,继续介绍免费的数据处理软件。eGPS一款热图绘制专用软件,热图就是用颜色代表数字,让数据呈现更直观,对比更明显。优点:小巧方便,基本功能齐全,包括数据转换、聚类分析、颜色调整等等缺点:常见的...

电力系统常用的通讯协议及其在Speedgoat系统中的实现

在电力系统中,IEC61850协议、DNP3协议、ModbusTCP广泛应用于远程终端设备(RTU)、智能电子设备(IED)交互以及监控和数据采集(SCADA)系统。一、IEC61850协议IE...

电子工程师的常用仿真软件

不知道从事电子行业的工程师,有没有使用模拟仿真工具,仿真软件网上又有很多,初学者,可能只知道Multisim和Proteus。一般Multisim适合在学习模拟电路和电路分析原理课程时使用,便于理解电...

技术论文|异结构混沌系统的组合同步控制及电路实现

欢迎引用[1]李贤丽,马赛,樊争先,王壮,马文峥,于婷婷.异结构混沌系统的组合同步控制及电路实现[J].自动化与仪器仪表,2022,No.276(10):80-84.DOI:10.14016/j.cn...

现场︱某110KV主变事故过程仿真分析

三峡电力职业学院、河南省电力公司洛阳供电公司的研究人员李莉、任幼逢、徐金雄、王磊,在2016年第6期《电气技术》杂志上撰文,针对某110KV变电站主变差动保护跳闸事故,结合事故相关检测数据,通过MAT...

光伏发电系统篇:单级式并网系统实时仿真

在全球积极推动清洁能源转型的大背景下,光伏发电作为重要的可再生能源利用方式,得到了广泛关注和迅猛发展。目前常用的光伏并网及光伏电站主要拓扑结构有单级式和双级式。相较于传统的多级式系统,单级式光伏发电并...

光伏发电系统篇:三电平并网逆变器实时仿真

一、三电平并网逆变器在能源转型加速的当下,分布式能源接入电网需求大增。三电平并网逆变器凭借低谐波、高功率密度等优势,有效提升电能转换效率,于新能源并网发电中担当关键角色。常见的三电平电路拓扑结构包括二...

自制3.5KW大功率逆变器,很简单,看过这个电路原理就懂了

前言拿下8000元奖金的项目,是什么水平?本项目经过联合湖南科技大学光伏逆变以及电力电子研究生团队共同探讨方案。项目成本:1200元,获得奖金:8000元!参加赛事:立创开源硬件平台_星火计划·外包赛...

圈内分享:电容式加速度计接口电路非线性建模与仿真设计

摘要:非线性是Sigma-Delta(ΣΔ)加速度计系统的关键指标之一。基于一个五阶ΣΔ加速度计结构,分析了其主要的非线性模块,在MATLAB中建立了整体结构的行为级模型,并利用根轨迹法进行了稳...

基于Matlab/Simulink建立一种Thevenin/RC电池模块仿真模型

本文以锂电池数学模型为基础,在Matlab/Simulink的仿真系统中,建立了一种Thevenin/RC电池模块仿真模型,通过实际工况试验,测试精度在允许误差范围内,为电池SOC/SOH研究提供了极...