您现在的位置是:首页 >学无止境 >[论文阅读] (29)李沐老师视频学习——2.研究的艺术·找问题和明白问题的重要性网站首页学无止境
[论文阅读] (29)李沐老师视频学习——2.研究的艺术·找问题和明白问题的重要性
《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学术路上期待与您前行,加油。
前一篇带来李沐老师对论文写作和科学研究的分享,介绍如何跟读者建立联系(Research,Researchers,and Readers),更好地让读者信服我们的论文及创新。这篇文章将详细讲解找问题和明白问题的重要性(Asking Questions, Finding Answers),其核心是说先找到大小合适的话题,然后问一些问题,再把一个读者认为值得去了解答案的问题抽出来,做成一个研究问题并找到问题对读者的影响,以及怎么样找到对应的资源并读懂别人的工作。核心为Topic、Question和So What三点,希望这篇文章对您有所帮助。一方面自己英文太差,只能通过最土的办法慢慢提升,另一方面是自己的个人学习笔记,并分享出来希望大家批评和指正。这些大佬是真的值得我们去学习,献上小弟的膝盖~fighting!
参考李沐老师github和原视频地址,感谢、感恩和推荐大家阅读:
- https://github.com/mli/paper-reading/
- https://www.bilibili.com/video/BV11S4y1v7S2
- “爱喝水的崩奔”老师的笔记:https://www.bilibili.com/h5/note-app/view?cvid=17357477
文章目录
前文赏析:
- [论文阅读] (01)拿什么来拯救我的拖延症?初学者如何提升编程兴趣及LATEX入门详解
- [论文阅读] (02)SP2019-Neural Cleanse: Identifying and Mitigating Backdoor Attacks in DNN
- [论文阅读] (03)清华张超老师 - GreyOne: Discover Vulnerabilities with Data Flow Sensitive Fuzzing
- [论文阅读] (04)人工智能真的安全吗?浙大团队外滩大会分享AI对抗样本技术
- [论文阅读] (05)NLP知识总结及NLP论文撰写之道——Pvop老师
- [论文阅读] (06)万字详解什么是生成对抗网络GAN?经典论文及案例普及
- [论文阅读] (07)RAID2020 Cyber Threat Intelligence Modeling Based on Heterogeneous GCN
- [论文阅读] (08)NDSS2020 UNICORN: Runtime Provenance-Based Detector for Advanced Persistent Threats
- [论文阅读] (09)S&P2019 HOLMES Real-time APT Detection through Correlation of Suspicious Information Flow
- [论文阅读] (10)基于溯源图的APT攻击检测安全顶会总结
- [论文阅读] (11)ACE算法和暗通道先验图像去雾算法(Rizzi | 何恺明老师)
- [论文阅读] (12)英文论文引言introduction如何撰写及精句摘抄——以入侵检测系统(IDS)为例
- [论文阅读] (13)英文论文模型设计(Model Design)如何撰写及精句摘抄——以入侵检测系统(IDS)为例
- [论文阅读] (14)英文论文实验评估(Evaluation)如何撰写及精句摘抄(上)——以入侵检测系统(IDS)为例
- [论文阅读] (15)英文SCI论文审稿意见及应对策略学习笔记总结
- [论文阅读] (16)Powershell恶意代码检测论文总结及抽象语法树(AST)提取
- [论文阅读] (17)CCS2019 针对PowerShell脚本的轻量级去混淆和语义感知攻击检测
- [论文阅读] (18)英文论文Model Design和Overview如何撰写及精句摘抄——以系统AI安全顶会为例
- [论文阅读] (19)英文论文Evaluation(实验数据集、指标和环境)如何描述及精句摘抄——以系统AI安全顶会为例
- [论文阅读] (20)USENIXSec21 DeepReflect:通过二进制重构发现恶意功能(恶意代码ROI分析经典)
- [论文阅读] (21)S&P21 Survivalism: Systematic Analysis of Windows Malware Living-Off-The-Land (经典离地攻击)
- [论文阅读] (22)图神经网络及认知推理总结和普及-清华唐杰老师
- [论文阅读] (23)恶意代码作者溯源(去匿名化)经典论文阅读:二进制和源代码对比
- [论文阅读] (24)向量表征:从Word2vec和Doc2vec到Deepwalk和Graph2vec,再到Asm2vec和Log2vec(一)
- [论文阅读] (25)向量表征经典之DeepWalk:从Word2vec到DeepWalk,再到Asm2vec和Log2vec(二)
- [论文阅读] (26)基于Excel可视化分析的论文实验图表绘制总结——以电影市场为例
- [论文阅读] (27)AAAI20 Order Matters: 二进制代码相似性检测(腾讯科恩实验室)
- [论文阅读] (28)李沐老师视频学习——研究的艺术·跟读者建立联系
- [论文阅读] (29)李沐老师视频学习——2.研究的艺术·明白问题的重要性
前言(Asking Questions, Finding Answers)
本书第2部分的核心是:
- 怎么样去找到你研究的问题
- 想清楚自己研究问题的重要性是什么
找问题去解决是研究领域一个独有的事情,但是在做一件事情之前,想清楚这件事情的意义是非常重要的,它具有一定的普适性。在生活或工作中,做任何事情之前,都可以想想如果把它做了,那么它的意义在什么地方,如果每次去想这个事情,既会让你把一些事情做得更好,又会让你发现很多事情其实没必要做,从而节省时间。
第3章 从话题到问题
From Topics to Questions。本章将讨论怎么样找到一个感兴趣的话题,然后在话题上做研究,并提出一些问题来指导你做研究。
In this chapter, we discuss how to find a topic among your interests, refine it to a manageable scope, then question it to find the makings of a problem that can guide your research.
正文开始时,作者提到自由(freedom),即做研究的时候,大家可以自由地选择话题。其中,学术界自由度相对更高,工业界会低一些。同时,自由也会带来选择困难症,或者说大家可能就在那边东逛西逛,也不知道到底要做什么,最后定不下来具体要做什么事情。这是每个人进入一个新的行业或刚开始做研究都会遇到的问题。是不是想到了我们自己,哈哈!
首先定义一些术语。
- subject:学术领域(比如气候变换、人工智能、计算机视觉、系统安全等)
- topic:话题,领域内特别的兴趣点(比如研究气候变换对鸟的迁移带来的影响、怎么样高效的设计卷积神经网络使得图片的分类精度更高)
问题:你为什么要选择话题呢?
因为你很难有一个研究是针对整个研究领域来做的,当然存在某篇论文开创了某个研究领域,但就算是这样的论文,它其实最开始的出发点,也是比较小的,所以你一定要在自己的领域中找到一个话题,再继续深挖。
话题并不是把这个领域的范围变小,而是一个使得你可以在里面问一些问题的途径,如果这个问题你回答得比较好,整个领域的研究人员都会对它感兴趣,而且好的答案能够在一定程度上推进整个领域往前发展。
话题本身,也可能比较大也可能比较小。大就是说,在整个研究领域中很常见的一个话题(比如心理学中害羞或愿意冒险是人类学来的还是天生的);小众一点的也可以,但只有某些特定的研究人员感兴趣(比如把咖啡放在桌上之后留下的印子为什么一定是个圆形)。当然,大家都感兴趣的话题,肯定会有更多人参与研究,所以竞争更加激烈一点;比较小众的话题在里面做出比别人更好的工作的概率更高一点,但是会导致你就算做出来受众没那么广,最后你要做一个权衡。
不管你的话题大还是小,最关心还是对这个话题问一些问题,然后是你问题的答案,别人可能会觉得比较重要,甚至这个答案在一定程度上能改变整个研究领域。
知识点:区分Question和Problem?
- Question:疑问,通常指问一个问题,然后需要来做答案
- Problem:困难,通常指存在一个问题,如果不去解决,可能会带来一些危害
往细地说,一个疑问不一定会带来一个问题,一些问题回答与否,并不都会带来什么后果,但有些问题的回答可以解决很大的问题。
- a problem或者一个困难/问题,就是研究界觉得是值得去解决的一件事情
- a question或者一个疑问,是找到一个问题的途径,针对话题问一些问题使得我们可以找到一些方法来解决某个problem
两者是可以区分开的,也就是针对一个话题,要问很多问题,然后找出里面到底谁值得去回答,最终解决Problem。
3.1 From an Interest to a Topic
该部分主要讲解怎么样从兴趣找到一个话题。核心思想是说你可能会有一些兴趣,或者通过读一些文章去发现你的兴趣,然后在你的兴趣中找到一个话题。
由于本书写作针对很多本科生,比如本科课程教大家如何做研究再做一个报告,但里面的问题是没有人告诉你要找什么样的话题,你可以随便找,却会导致你每次要花很多时间去想到底要干什么事情。因此,话题就来自你的兴趣,通过阅读深挖。当然大部分做研究的时候,你还是有一个大概的方向,比如你的导师做某一块的研究,或者你师兄师姐做哪一块研究。很有可能,你还是只给定了一个领域,需要在里面找到一个话题。
总之,话题主要取决于自己的兴趣。比如李沐老师喜欢怎么样将一个算法做得比较快或比较大,他在读文章时通常会思考这个算法会不会跑得很快,会不会做不大,如果我们要改进的话怎么样去做,这样才能发现一些话题。
对于技术领域而言,需要考虑的就几件事。
- (1)怎么样把一个东西的效果做出来。 就是针对一个问题我们提出算法,使得之前的算法都不是很行,用了这个算法之后行了。
- (2)怎么样把它做大,数据更大,规模更大。
- (3)怎么把它做便宜一点。
- (4)怎么样把它做安全一些。
大家看到一个技术点或话题,通常会考虑上述四个点。然后,你看看自己对什么东西感兴趣,并针对这些兴趣去找到对应的话题。这本书介绍了很多东西可以去看一看,但主要还是偏文科的,跟我们理工科还是有不一样的地方。
3.2 From a Broad Topic to a Focused One
该部分介绍如何将大话题变小,变到一个真的可以做研究的东西。 首先给出例子:
- 反例:话题太广、太笼统,比如托尔斯泰的自由意志、商业航空的历史。
- 修正:将范围变窄,能够更专注,比如自由意志和宿命论在《战争与和平》书中的一个冲突、DC-3早期商业的贡献。
接着作者给出怎么样促使一个话题可能会导致一个比较好的研究工作,其采用的方法是能不能把这个话题换算成一个论点,该论点看上去有一定价值值得去讨论。先看两个泛化的话题:
- 话题换成一个完整的句子:示例中的论点比较简单
3.3 From a Focused Topic to Questions
当找到合适话题的时候,就要问一些问题了。
- 常见错误:当你找到一个合适的话题时,就会迫不及待的把这个所有话题相关的文章、资料都找起来读一读。这样子的效率是比较低的。因为你去读的时候,如果没有带着问题出发的话,你可能读起来就不那么专注。
- 老师感受:平心而论,如果你是真的新进入一个领域或者一个话题的时候,不一定能问出什么样的问题,可能干的事情就是把那些文章都找出来读一读然后总结一下。因为很多第1-2年的硕士生或博士生,他干的事情就是找到一个话题之后,就把整个话题的文章拿出来写一个综述文章,这样子能够对整个话题有一个比较全面的认识,当比较熟悉之后就知道哪一些东西是可以问合适的问题。
综述文章思考: 同时,反过来讲,当你打算去写综述的时候,你其实已经问了一个问题,即:
- 这个话题上有没有很好的综述文章,如果答案是有的话,那么就不要干这个事情了,就读一下综述的文章,在里面有一个比较全面认识,就可以开始想自己的问题;如果没有的话,就变成了一个实际的Problem(缺乏综述文章为后面的新人了解领域),可以给大家写一个综述的文章,给大家带来价值。在这个时候很有可能就可以问了一个很好的问题。
- 当开始真正写综述的时候,再去读文章就会去想这篇文章提出的东西怎么样放进我的综述文章里面,也就是综述里面需要对整个话题、整个子领域给画一个比较大的图,然后把所有的工作放进图里面把它们联系起来。更好的是,在读论文的时候,能带着一些具体的一些问题,能够真的成为最后研究的一些问题来去读,整个专注度会更好一点。
作者接着给出一些方法去提出这样问题,整个方法比较偏文,对技术而言,需要考虑的是3.1小节的四个问题。
- 怎么样把一个东西做得更好、更大、更便宜、更安全。所以,你在读一个东西的时候,你可能会思考如何把它做得更好、更快一点,哪些地方做得不够好,哪些东西可能成为瓶颈,或者哪些地方不安全。
因此,你可以从这四个大的方向去找出一些合适的问题,然后带着这些问题再去读你的文章。
3.4 The Most Significant Question: So What?
1.动机在哪
当然,你可以提出很多问题,其核心是说怎么样评估你的问题。李老师认为本节是讲得最有用的,即你最后的最后要问自己一个问题——So What?
- 本书说当你对某个问题感兴趣的时候,你应该问自己一个更难的问题,叫做So What。换句话说,我如果解决了这个问题,又怎么样呢?别人会不会关心,他能给别人带来什么样的好处,是不是能够推动整个领域的发展,或者推动领域在一个小地方的发展,能不能启发别人做更多的工作。
- 你也可以反过来问,假设我不去回答这样个问题,会不会有什么样损失,别人会不会觉得错过了一个亿,是不是整个领域可能会停止向前发展很多年。如果你的答案是说没有,就是说是因为兴趣而做的也没有关系,这可以使得我们持续往深里面走,但是还得不断的去问SO WHAT这个问题,去想我现在的东西so what,别人care不care。
上一章我们讲过,最后需要写一个文章出来,让别人去读并且觉得值得去读。所以,你一开始得想清楚,别人为什么觉得它值得读,也就是So What这件事情。
-
此外,这件事不仅对研究有用,对日常生活和工作也有用,如果我想要让这件事情变得更有价值,我应该怎么样往前做。或者说,这件事我看不清楚对自己或别人有什么样的价值,这时候可以选择不做这件事情,把时间空出来做一点别的更有意义的事情。
-
就像作者说的一样,要对自己tougher(狠一点),这样子才能比较客观。因为你总是会为自己辩护,做事总会下意识找理由来支撑你这件事的意义,但很多时候有些事情是没有太多意义的,如果你能及时认识到这件事,把时间放到更有意义的事情上,你的时间利用率会更好。或者今天你失去什么觉得特别难过,做什么事情觉得特别尴尬,你也可以问一下So What,我做这么傻的事情别人Care吗?别人可能不Care,或者我失去这个东西十年后我也不Care。
因此,时不时很tougher的问一问自己So What这个问题,能够帮助你的生活变得更加简单,你会发现很多事情其实没必要做,也会发现一些更有意义的事情。大家应该坚持做有意义的事情,把所有的精力和时间都投入进去。
2.具体方法
后续作者提供包含三小步的方法来帮助大家理解:怎么样找到你的问题,以及怎么样去问so what。
- Step 1:Name Your Topic
先把话题给列出来(把topic的名字你找出来),句式:我想去 学习/做/研究 _______。 - Step 2:Add an Indirect Question
有了话题之后再其后加间接的问题,就是加个w词(who、what、when、where、whether、why、how),然后在前面话题之后加上我为什么研究这个事情,是因为我要去找出谁,什么时候,在哪里,是不是,为什么,以及怎么样去找什么事情。比如,猛犸灭绝的原因。 - Step 3:Answer So What? by Motivating Your Question
当你问出问题后,第三步要说明清楚问题的重要性。如果问题是开放性的,那么问题的重要性很有可能就是为了帮助读者更好的了解how、why和whether等问题。
继续回到So What问题。
- 在一开始找问题的时候,很有可能找到这个领域关心的一些问题。那么这时候就不那么需要去关心这个东西的意义在什么地方。
- 在技术领域,通常我们去找一个方法来解决某一个痛点,只要你的方法真的能够比较好的解决这个痛点,一般都是有意义的,意义的大小取决你这个痛点到底是有多痛以及是多少人觉得痛。
但是,很多时候其实你并不知道这个东西为什么重要(Why does this matter?),特别是偏理论点的研究或者是很开放性的问题(如文学),你并不知道这个东西到底有没有用。在这个情况下一开始是OK的,就是说一开始并不知道为什么要做这个事情,随着研究慢慢深入,我们不断的去问自己说,找出或发现的这个东西到底有没有用,别人到底在不在意。
所以,当你不断的去想这个事情,也会指导你的研究方向。当我们没有想清楚这个事情的时候,很有可能这个研究是不能停的。只有当我们大概是知道为什么别人觉得这东西有用的时候,我们才可以把研究停下来,开始写论文。如果你没有想清楚这个问题,那么你写的论文很有可能是别人不Care的。
最后总结下3个步骤:
- 我们的话题是什么;在这个话题里面的问题是什么;写清楚为什么别人会在意这个事情(So What)
3.怎么找话题
本章给出一些小技巧来帮大家找话题(Finding Topics),具体给了两块:
(1)如果你去参加一个科研实践课程,在你的兴趣点里面找到一些话题来研究。
(2)如果已经有了一个研究领域的话要去怎么样找话题。
- 去读一些教科书或者去上节课(书和课要比现在学的要再往上一层,因为了解自己懂得东西,可能也没什么新的想法)。
- 参加这个领域的一些学术报告,参加一下研讨会,跟大家讨论、问一些问题,看看大家在讨论什么东西。
- 问问老师(如果你的老师是一线研究员的话,他肯定在心中是有一些想法的)。
- 去网上找一找谈论(reddit、知乎、B站、Github)。
- 阅读顶会顶刊论文大佬的limitation、未来工作或者前瞻。
人工智能领域:
当然,如果具体到人工智能领域的话,网上会有很多讨论以及各种报告、博客,大佬也会谈一谈什么东西比较重要,未来五年、十年人工智能的走向。你还是能够找到比较大的话题,李老师个人看法如下:
-
除非你在一个比较大的团队中,有很多人一起做一个事情,以及有大的数据或者有比较多的计算资源,否则一般来说尽量不要去碰那种大家都在谈的特别大的领域。因为这里面的人特别多,比如图片分类问题、目标检测问题,以及现在大家都在做的那些特别大的transformer模型。因为就算有一个很好的想法,但是要把文章写出来的话,需要大量的实验以及大量的精力去调这种东西,要做出效果的话,不是一个人很短时间就能做出来的。
-
反过来讲,可以去关注一些稍微小一点的问题,从小的地方开始,也许可以往大的方向靠。那么怎么样找小的问题,可以在网上找一找(reddit上面很多这样的讨论,大家会分享一下自己的一些经验)。
-
可能比较好的一个办法是说:如果有时间的话,可以去公司里实习,去看一下整个工业界中在应用人工智能的时候,遇到的一些痛点。很多时候工业界的人,他自己可能没这个想法,反正就这么痛,用过去就已经习惯了。但是你作为一个刚进去的实习生,是个外来者,可以去仔细的观察大家是怎么样用的,遇到了什么问题,去把这些小的事情抽象出来,总结出来就变成了一个研究的问题。然后只要观察仔细的话,其实是会发现很多这样子的问题,这里面的小问题很有可能是能支撑我们几年的研究的。
本章小结
写到这里,本节内容讲解结束。本节核心思想如下:
- 怎么样从你的兴趣点开始去找到一个话题,然后把这个话题缩小到足够小的范围,使得你能够去驾驭它,也使得它足够大到支撑一个比较好的研究。
- 接着在这个话题里面去问很多问题,因为你的研究都是用来解决问题的,所以一定要有问题。
- 有了问题之后,你要去问最重要的so what问题,就是说解决这个问题要怎么样。在真的动手去解决问题之前,真的就要去想一想,假设半年之后,1年之后我解决了这个问题,那么别人关不关心这个事情。
- 在做任何项目之前,都应该去想想这个东西做出来它的意义在于什么,不要去想说能不能做出来。 就假设说有足够的资源,运气足够好,能把它做出来最好的结果以及能做出来情况下,去想一想对别人的影响有多大,这个事情的意义的天花板在什么地方,如果这个天花板比较低的话,你可能会考虑它不值得做。因为你不一定能百分百把这个事情做好,即使你百分百做好,它的天花板也很低,还不如去找一个更有意义的事情。
第4章 从疑问到问题
From Questions to Problem。该章节主要讲解怎样将大家问出来的问题(question)变成一个值得解决的问题(problem)。作者把问的问题question和值得解决的问题problem给区分开来,帮助我们新手去了解一个思考的过程。虽然我们关心的只是值得解决的问题(problem),但这个从question到problem的过程同样重要。而且这个思考的过程不仅对新手有用,以后如果你要指导别人做研究的话,也需要了解这个过程来帮助别人来更好的思考。
- 举例:李老师工作中很多时候要干的事情不是要解决某个问题,提出算法来解决,而是帮助大家去思考这个问题值不值得去做,这个东西在整个领域里面的地位在什么地方,有多少人觉得它值得,而且去帮大家换个思路看待这个问题,可能其价值更大。
- 感受:确实很多大佬都能把握方向或者工作的前沿,并判断一个工作能不能做,更好地指导学生。
In this chapter, we explain how to turn a question into a problem that readers think is worth solving. If you are an advanced researcher, you know how essential this step is. If you are new to research, we hope to convince you of its importance, because what you learn here will be essential to all your future projects.
这本书第3章和第4章都是讲工作的动机及意义,第四章会告诉大家一个值得研究的问题长什么样子。首先回顾上一章所提出的三步公式来解决问题:
- 你的话题在研究什么
Topic: I am studying ______ - 然后问一个问题
Question: because I want to find out what/why/how _______ - 需要去找出回答问题之后的意义在哪里
Significanse: in order to help my reader understand _______
如果你从第1步挪到第2步,那你不仅仅是一个简单的数据收集者,而是一个研究者去了解一个特定的问题;如果你从第2步走到第3步,那么你就进入一个研究领域而且去了解从别人眼里来看这个问题的价值在什么地方。
因此,当你完成上述工作,能从别人角度来看解决这个问题的重要性,那么你就创建了一个跟读者非常强的联系,因为当他们读完你的报告能有更深入的理解。总之,通过本章能找到值得解决的problem,别人也会认可你的问题。
- 李老师开场可能会写:a good problem is what,一个好的问题是别人觉得值得去解决的问题,然后再举例和解释为什么需要这件事。
- 这段原文值得大家学习:本章先回顾上章节三个步骤,抽象到更高的层面,并强调为什么要去找出重要性。再回忆第一部分,你需要跟读者建立很好的联系,如果你很好地回答了Significanse问题,就能够很好地跟读者建立联系,最后你就很好地找到一个问题(problem),通过承上启下引出定义。
4.1 Understanding Research Problems
理解研究问题。问题通常有两类:
(1)实际问题(practical problem)
比如说一个算法跑得比较慢,解决它需要让它跑得更快;或者一个任务在某个数据集上的精度不是很高,可以提出一个新的算法解决它;或者这个领域没有一个很好的数据集能够让大家更好的去评估这个问题,那我提出个数据集;这都是解决一些实际的问题。目前读的很多论文都是去解决实际问题。
(2)概念问题(conceptual problem)
这些问题不是要去解决某一个实际的痛点,而是说如果我们回答它的话,会对某一个事情或者这个世界有一个更好的认识。在科学领域,绝大部分问题是这种概念上的一些问题,帮我们更好的理解某一个东西。比如物理学理解这个世界。
但是在技术领域,更偏向实际的问题。当然也有很多偏理论的问题,比如说了解batch normalization为什么能够工作,以及说深度学习为什么能工作,甚至机器学习为什么能工作。这里面有很多的理论工作,但是我们目前为止,没有太多的去涉及这些论文,所以导致大家可能觉得这些东西不多。但实际上在整个人工智能领域特别是机器学习,可能是在深度学习之前,可能至少有1/3的论文是关于这样子的一些概念性的问题。
接着作者画了一个图,告诉大家问题是怎么样来的。
- 首先有一些实际的问题(在日常生活中碰到一些东西)。
- 然后就会有动机(motivates)去找到一些研究的问题。 不是每一个问题都值得研究,可能一些实际问题很容易解决(比如给轮胎打气)。所谓值得research的问题,通常是一些开放性的你不可能立马就知道答案,或者别人觉得没有很容易就解决的,就是一些有价值的问题。
- 有价值的问题就定义了一些研究实际的或者是概念上的问题。
- 这样子的问题导致我们要去研究出它的答案,就是整个研究工作在干的事情。
- 这些研究答案能够去帮助解决这些实际的问题。 比如算法效率低,那么我能不能提出一个新的算法,更有效地利用数据结构,假设你提出来并证明在实际的数据集上效果不错,则解决算法跑得慢的问题。如果是概念性的问题,很可能还要绕几圈才能解决。
本小节最后介绍为什么要有问题?
如果你没有问题的话,可能你整个论文写出来就是很多数据在里面,很多证据摆在里面,但是别人看上去就没有能找到你的观点(point)在哪里。很多新手写作就是没有把东西聚焦在某一个问题上,使得读者跟不上你的节奏,也不知道到底在问什么问题,所以还是需要有一个问题,你的研究不管大或小,不管是小小的技术报告,还是一个跨领域时代的大论文,或者引用上10万的论文,其实你最后都是要解决一个问题,只是说你解决问题的大小而已。
4.2 Understanding the Common Structure of Problems
该小节介绍一个问题的结构通常是什么样子的。 作者说到,不管是实际的问题还是概念上的问题都有一个下面的结构:
- (1)situation or condition:你的状况或先决条件
- (2)你不想要的一个结果,如果不解决它的话,可能需要去付某一些不想付的代价(cost)。
你的状况和你的代价的不同,导致的两类问题是不一样的。
1.实际问题
接着给出实际的问题示例。
- 状况:错过了巴士、臭氧层变得越来越薄
- 代价:上班吃到或丢工作、很多人患病
需要注意的是所谓的代价,其实是读者关心的,不是我们自己要付出的代价而是他们(你的读者)要付出的代价。
接下来讲解怎么样从读者的角度去找出这样子的代价:
- 从自己的状况开始不断的问so what
比如说臭氧层变薄So What,你的回答是“一个臭氧层变薄会使得大家更多地暴露在紫外线下”,接着再So What,回答是“臭氧层会导致皮肤患病”。如果读者意识到这个问题,和生命息息相关,就会觉得和自己相关,就得到了一个问题。反而来,如果读者还在问So What,他表示没有得到你的问题或不觉得这是一个问题。
因此,你需要从读者角度不断地问So What问题,直到你觉得可以停止,停在的那个点就表示你可能找到了一个问题。
2.概念问题
接下来看看概念性问题会有什么样的。
- 在实际问题上,我们的状况通常是一些状态,导致会付出我们不想要付的代价。但对于这种概念上的问题来讲,我们的状态通常是说不知道或者不了解某一个东西,这就是condition;一般来说不理解某一个东西,不会给我们带来立即的一个代价,所以一般不会去谈它的代价。那它的后果是什么呢?如果不能了解这个问题的话,那么就会无法理解一个更重要的问题,而这个重要的问题,大家都觉得我们应该去了解的。
作者画了幅图来说明:去了解我们的第一个问题(研究要去回答的问题),能帮助我们了解一个更大的问题(Q2),就是从Q1一直到Q2,只要Q2足够大而且确实是能过去的话,那么这还是有价值的。
如何更好的去找到这样的一个后果呢?
- 可以反问大家,如果我不能回答这个问题的话,会导致什么的事情。
整体而言,概念性的问题比实际的问题在问上会更虚一点,因为看不到一些事实上可见的代价。很多时候这些问题最后也只是满足了人类的一个好奇心。比如宇宙终极目的是什么,人的存在意义是什么,好奇心推动人类科技的进步。所以,我们在做研究的时候,特别是对概念性问题的研究,其实就是满足人类的好奇心,特别是对本质上的好奇。
3.怎么区别纯研究和应用研究
Distinguishing “Pure” and “Applied” Research.
- 所谓的纯研究就是去回答一个概念上的一个问题。
- 应用研究就是去解决一个实际的问题。
纯研究通常会出现在比如说自然学科领域,在学术界会多一点。在工业界的话,大部分的研究是应用性的研究,当然在学校也是一样,偏技术类的研究通常都是应用性的研究,就是去回答一些实际的问题。
具体的区别就是说最后你的重要性(significance),也就说so what这个问题是要去回答一个问题,满足大家的一个好奇心(纯研究);还是说去解决一个实际的问题,降低某一个代价(应用研究)。举例:
- 纯研究:宇宙中能找出多少星系,回答宇宙会不会一直膨胀然后塌陷成一个点。
- 应用研究:由于从哈勃读的东西和地面上站读的东西不一样,了解整个大气层电磁场辐射后,研究如何更低成本构造望远镜来校验和观察。
同样主题的东西,最后的significance不一样,导致了在纯研究和应用研究的差异。应用性的研究,大家可能会觉得问题不大,反正因为能看到实际的一些结果。但是对纯研究的话,很多时候大家对上面不是那么的理解。如果是做纯研究领域的话,想让大家能够更好的理解你研究价值,也可以往实际的那些应用去靠,举例纯研究与实际应用挂钩,并加强两者的联系。
思考建议
很多时候大家在写纯研究论文的时候,其研究问题是更大领域问题的一块,但你没有有效地将两者的联系写出来,导致读者会有一点困惑。但反过来讲,如果我们是读者的话,在去读纯研究论文的时候,我们要去理解它背后想回答更大的问题是什么,虽然它看上去只解决了一个很小的问题,但是你一定要想清楚它能够拓展到一个什么样更大的问题。从而它从那个更大的问题中获得了意义、获得了价值。
4.3 Finding a Good Research Problem
在讲完这两种不一样问题的结果后,作者提出了一些比较实际的点——怎么样找到一个好的研究问题。
- 找人帮忙(Ask for Help):去跟别人讨论然后不断的去问so what的问题,有人帮你讨论其实会更好一点,日常交互显得更自然一点。
- 在阅读中寻找问题(Look for Problems as You Read):你在读论文的时候需要寻找问题,我们之前在读文章的时候,也给大家提过这样的问题。
- 从自己写作的总结中选择(Look at Your Own Conclusion):在写作的时候通常会想的比较全面,所以写的比较客观,然后把它写下的时候也是帮助我们将整个思维想的更全面,在写作中也可以找到问题的价值。
整体而言,找到一个好的问题,是一个研究者可能需要花很多年的一个事情,需要跟可能比我们更善于去找好问题的研究者去合作,从他那里学习不断的去学习怎么样找到这个领域的好的的问题,也不是短短十几分钟能讲清楚的。大家需要意识到这个问题的存在,然后不断去练习。
4.4 Learning to Work with Problems
本小节主要讲解:在真的去解决一个问题之前,不要去想说能不能解决它。能不能解决它其实是后一步的事情,先要问的问题是说读者认不认为这个东西值得解决。
本书作者直接把后果说了出来,假设我们不这么做的话,那么很有可能读者会不在意(care)我们的工作,这也是得到的最差反馈。换句话说,作者告诉大家为什么在做一个问题之前,一定要想清楚读者会不会觉得这个问题值得解决。
作者给出一些简单的建议:当你是新手或新入某个领域时,其实你并不知道一个问题重不重要,你会有一定的焦虑,那么,怎么样摆脱这样的焦虑呢?
- 首先你要承认这个问题,不可能在一开始就知道问题是不是重要的,很多时候需要写一篇论文然后看一下数据怎么样,看看大家买不买账、引用量有多少、大家愿不愿意读你的文章,很多时候要做这些交互的事情,并不是一两天就能消除的。
老师补充几个办法:(真心受教)
-
不要等到真的把研究做完、论文写完,再去给别人看说这个东西值不值得做。要在一开始的时候,尽量的在有想法的时候,跟别人交流,跟你的同学谈也行,同事谈也行,老师谈也行,甚至是可能针对的用户谈也行,就看看他们关不关心这个事情。
-
不要等到你的研究真的做完,可以是做了中间一半比如说1/3或者1/2的时候,准备一个10分钟、20分钟的小报告,然后在本地的一些研究小组里面给大家讲一讲,看一看大家的一个反馈。如果讲完之后,大家觉得没什么意思,很有可能你做的东西大家不感兴趣。同时,计算机领域很多会议会有workshop,workshop不一定需要把研究做完,您可以做一点点时就写个2-5页报告然后提交,你可以在workshop上面投稿,看看圈子里大家的想法,并参与讨论,
-
在工作中,在公司的时候,想做任何研究的时候,在做它之前一定要想清楚说哪个产品团队或哪个客户可能会需要这个东西,他们会不会把这个研究工作做进产品里面。在做之前先别急着动手,先想清楚你要做什么样的问题,可能用什么方法,然后你去跟这些未来可能存在的合作方去聊,告诉他说:我准备做这个问题,你感不感兴趣,你感不感兴趣把这个东西放进你的产品里面。但需要把握对方真实的想法,是否真的感兴趣,而非客气,你可以说要不你们出一个人我们也出一个人跟进合作之类的。
核心是说要在做研究的过程中,要不断的跟潜在的读者或用户沟通,使得可以根据这个交互来帮助我们改变整个研究的一个方向,也是确保在研究做完之后,最后是有人关心有人买账。
本章小结:
本章主要将怎么样是一个很好的问题,从一个话题到提出一些疑问,怎么样把值得回答的疑问变成一个读者关心的问题。
第5章 从问题到资源
在有了问题的时候,怎么样去找资源(书中偏文科,在技术领域比较简单,仅简要介绍)。 技术领域找相关论文的方法如下:
- 在技术领域,要去解决某个问题,先去找到跟你这个问题最相关的一两篇论文,然后去看他引用了谁,就是往前走,看看他之前的工作长什么样子。
- 你不要去看一篇论文对前面工作总结,而是要去把那些他真正引用的那些论文真的拿去看一下,完成一个自己的总结,然后再看一下谁引用这一篇文章,他之后的工作。
- 找到几个这样的种子论文,往前走往后走,基本上能找到要的那些资源了。
第6章 Engaging Sources
第6章主要讲:当你有了资源的时候,怎么样读它,怎么样评估一篇论文的好坏。 其实李老师之前所有读论文系列都是在帮大家去学习第6章讲的一个事情,即给一篇文章怎么去读懂它,然后去发散,去了解它背后的一些东西,这里就不再详细介绍了。
怎么评估一篇论文的好坏,具体方法如下:
- 看引用。大概就知道这篇文章有多少人读它,多少人关心它,这个方法主要是针对已经发表了几年的文章。
- 顶会顶刊。对于新的文章是说,至少在计算机领域,不管是杂志也好会议好都是有排名的(如NeurlPS、ICML、ICLR、CVPR),虽然排名也不那么可信。假设一篇文章引用的那几篇主文章就是说我们的方法、做对比的或者基于的那些文章,发表在某一个会议的时候,我们的文章也通常要发表过去。意味着,你的文章假设基本引用的是ICML或NeurlPS文章的话,很有可能你也能够发表在ICML或争取发表在上面。当然如果你做的没那么好,你可以往下发一点。反过来讲,假设你的文章主要引用的是一个二流会议的文章,那你很难把该工作发表在一流的会议上面。因此,研究也是有圈子的,假设想发一个一流会议的文章的话,那么我们去读的和引用的,和基于的工作最好也是一流会议甚至是更好的,比如Nature、Science的文章。
总结及个人感受
写到这里,李老师就讲完了第2部分,该部分的标题叫做“问问题然后找到答案(Asking Question,Finding Answers)”。其核心是说先找到大小合适的话题,然后问一些问题,再把一个读者认为值得去了解答案的问题抽出来,做成一个研究问题,我们的研究问题可能是实际的,也可能是概念上的。不管是哪类问题都要想清楚:
- 他的状况是什么
- 不解决他的话他的后果是什么
后面两节是说给一个问题怎么样找到资源,就找到前面的工作;然后怎么样读懂别人的工作,以及把自己的工作放在别人的工作之上。核心是说要学懂前面两章讲的东西,就是话题、问题以及他的后果。
- Topic:话题
- Question:话题背后隐藏的问题
- So What:问题对读者的影响及后果
最后你的摘要也好,Introduction也好,你会发现基本是就是讲这三句话,因此你一定要想清楚。但后面我们讲到实际写作的时候,再带大家回来看怎么样把想清楚的3个东西变成一个故事,写到你的文章里面。
再次感谢李沐老师的分享,推荐大家多看看李沐老师的视频和分享,值得大家学习,学无止境,受教受教。
三月应该是今年最忙碌的一个月了,好多事情。希望一切顺利,更希望四月后能沉下心来读论文和写论文,继续加油,只争朝夕。这篇文章就写到这里,希望对您有所帮助。由于作者英语实在太差,论文的水平也很低,写得不好的地方还请海涵和批评。同时,也欢迎大家讨论,继续加油!感恩遇见,且看且珍惜。
作者论文分享github地址:
- https://github.com/eastmountyxz/AI-Security-Paper
- https://github.com/eastmountyxz/AI-Sec-Paper-Sharing
(By:Eastmount 2023-04-21 周五夜于武汉 http://blog.csdn.net/eastmount/ )