如何看待北大博士实名举报黄亮leonwong 价格教授在ACL上抄袭论文

北大博士生主页()声明:Two of my papers are deliberately plagiarized in an ACL short paper, "Tree-based convolution for sentence modeling," by Mingbo Ma, Liang Huang, Bing Xiang, and Bowen Zhou, from CUNY and IBM.Announcement on the CUNY and IBM's Plagiarism in an ACL
paper, “Tree-based Convolution for Sentence Modeling”
Comments on Mingbo Ma and Liang Huang's Reply黄亮教授主页:
Well done.
不一定到“抄袭”的程度,但是有违最严格的学术道德标准毋庸置疑的。尤其是在Camera Ready的时候删除明显相关的引用,这是非常有利己倾向的可疑行为。我觉得当事人还是道歉比较好。
谢绝转载或分享。一方面,在投稿时引用,最终版隐去这个引用,关键是这个鸡贼的行为还被抓到了,对当事人声誉损害极大。另一方面,学界多个团队同时发明或发现同样的新事物、新方法,是很经常出现的事情,何况还是在深度学习这样非常热门的领域。我自己研究过程中就碰到过几次,有一次成功发表,另一次就只能作为技术报告放出来。我觉得,只要各方介绍各自独立的观点,互相探讨,说不定还能传为一段佳话。发表论文最本原目的是增进交流,获得credit只是副产品。综上,不能因为是首发(而且还是arXiv这样的灰色地带)就直接简单粗暴地判定后来者是剽窃。同时,后来者在确知对方工作的情况下,应给予引用和论述,而非刻意忽略。
程序员,兴趣广泛,熟悉C++,C#,ruby等北大博士生主页()声明:Two of my papers are deliberately plagiarized in an ACL short paper, "Tree-based convolution for sentence modeling," by Mingbo Ma, Liang Huang, Bing Xiang, and Bowen Zhou, from CUNY and IBM.Announcement on the CUNY and IBM's Plagiarism in an ACL
paper, “Tree-based Convolution for Sentence Modeling”
Comments on Mingbo Ma and Liang Huang's Reply黄亮教授主页:
高中时候还看他和刘汝佳合著的黑书,转眼居然已经是教授了。。。。。
不一定到“抄袭”的程度,但是有违最严格的学术道德标准毋庸置疑的。尤其是在Camera Ready的时候删除明显相关的引用,这是非常有利己倾向的可疑行为。我觉得当事人还是道歉比较好。
谢绝转载或分享。一方面,在投稿时引用,最终版隐去这个引用,关键是这个鸡贼的行为还被抓到了,对当事人声誉损害极大。另一方面,学界多个团队同时发明或发现同样的新事物、新方法,是很经常出现的事情,何况还是在深度学习这样非常热门的领域。我自己研究过程中就碰到过几次,有一次成功发表,另一次就只能作为技术报告放出来。我觉得,只要各方介绍各自独立的观点,互相探讨,说不定还能传为一段佳话。发表论文最本原目的是增进交流,获得credit只是副产品。综上,不能因为是首发(而且还是arXiv这样的灰色地带)就直接简单粗暴地判定后来者是剽窃。同时,后来者在确知对方工作的情况下,应给予引用和论述,而非刻意忽略。
Python程序员,工大科研汪北大博士生主页()声明:Two of my papers are deliberately plagiarized in an ACL short paper, "Tree-based convolution for sentence modeling," by Mingbo Ma, Liang Huang, Bing Xiang, and Bowen Zhou, from CUNY and IBM.Announcement on the CUNY and IBM's Plagiarism in an ACL
paper, “Tree-based Convolution for Sentence Modeling”
Comments on Mingbo Ma and Liang Huang's Reply黄亮教授主页:
建议学术界彻底封杀arXiv这种灰色地带,避免鸡贼占坑
不一定到“抄袭”的程度,但是有违最严格的学术道德标准毋庸置疑的。尤其是在Camera Ready的时候删除明显相关的引用,这是非常有利己倾向的可疑行为。我觉得当事人还是道歉比较好。
谢绝转载或分享。一方面,在投稿时引用,最终版隐去这个引用,关键是这个鸡贼的行为还被抓到了,对当事人声誉损害极大。另一方面,学界多个团队同时发明或发现同样的新事物、新方法,是很经常出现的事情,何况还是在深度学习这样非常热门的领域。我自己研究过程中就碰到过几次,有一次成功发表,另一次就只能作为技术报告放出来。我觉得,只要各方介绍各自独立的观点,互相探讨,说不定还能传为一段佳话。发表论文最本原目的是增进交流,获得credit只是副产品。综上,不能因为是首发(而且还是arXiv这样的灰色地带)就直接简单粗暴地判定后来者是剽窃。同时,后来者在确知对方工作的情况下,应给予引用和论述,而非刻意忽略。如何看待北大博士实名举报黄亮教授在ACL上抄袭论文?
北大博士生主页()声明:Two of my papers are deliberately plagiarized in an ACL short paper, "Tree-based convolution for sentence modeling," by Mingbo Ma, Liang Huang, Bing Xiang, and Bowen Zhou, from CUNY and IBM.Announcement on the CUNY and IBM's Plagiarism in an ACL
paper, “Tree-based Convolution for Sentence Modeling”
Comments on Mingbo Ma and Liang Huang's Reply黄亮教授主页:
按投票排序
不一定到“抄袭”的程度,但是有违最严格的学术道德标准毋庸置疑的。尤其是在Camera Ready的时候删除明显相关的引用,这是非常有利己倾向的可疑行为。我觉得当事人还是道歉比较好。
谢绝转载或分享。一方面,在投稿时引用,最终版隐去这个引用,关键是这个鸡贼的行为还被抓到了,对当事人声誉损害极大。另一方面,学界多个团队同时发明或发现同样的新事物、新方法,是很经常出现的事情,何况还是在深度学习这样非常热门的领域。我自己研究过程中就碰到过几次,有一次成功发表,另一次就只能作为技术报告放出来。我觉得,只要各方介绍各自独立的观点,互相探讨,说不定还能传为一段佳话。发表论文最本原目的是增进交流,获得credit只是副产品。综上,不能因为是首发(而且还是arXiv这样的灰色地带)就直接简单粗暴地判定后来者是剽窃。同时,后来者在确知对方工作的情况下,应给予引用和论述,而非刻意忽略。
作为当事人之一,我发表以下观点,供大家参考、欢迎大家指正:1. (希望原提问者以及各位答主删除讨论)黄亮小组的论文已经修改了题目避免文字重复,也在论文中重新引用了相关论文。我根据各方要求也删除了所有发布的声明——我个人对这样的结果显然并不十分满意,但为了维护各方(包括我在内)的最后体面,这是一个权宜做法。黄亮进一步写邮件要求我删除知乎和微博的讨论,但对此我无能为力。我谨代表黄亮老师恳请各位好心网友按自愿原则删除本讨论及微博讨论——如果不删,我个人没有任何意见。2. (关于“学术不端”)虽然这是我第一次就这个问题在社交网络上发表观点,但我之前看了大家的各方观点。最让我困惑的是,有些老师、研究员能说出“学术不端而已”这样的话。我知道学术界未必每个人都很有操守,但拿到面上来把“学术不端”说得如此轻描淡写的我还是第一次见。就我个人的语感而言,学术不端是对一个学者学术信誉的最差评价和全盘否定。这比学问做得浅、做得不严谨要糟糕无数倍。不知道公开在网上发表诸如“学术不端也没有什么大不了”之类言论的老师、研究员,是否自己已经对学术不端习以为常了呢?3. (关于是否抄袭或剽窃)首先,我认为黄亮组的这篇论文说不上抄袭,抄袭至少需要有点文字是一样的。虽然黄亮组的标题几乎一样、个别句子十分眼熟外,倒也没有什么整句文字一样的,所以抄袭我觉得不是。那么是不是剽窃(plagiarism)呢?根据纽约城市大学的学术诚信准则,"Plagiarism is the act of presenting another person’s ideas, research or writings as your ownCopying another person’s actual words or images without the use of quotation marks and footnotes attributing the words to their source. o Presenting another person’s ideas or theories in your own words without acknowledging the source. o Failing to acknowledge collaborators on homework and laboratory assignments. o Internet plagiarism, including submitting downloaded term papers or parts of term papers, paraphrasing or copying information from the internet without citing the source, or “cutting & pasting” from various sources without proper attribution."由此可以看出,剽窃和抄袭是不一样的。剽窃有大有小、有多有少,内容丰富、种类繁多。有的剽窃很好举证(比如直接抄袭),有的剽窃十分严重(比如剽窃算法、模型等)但很难举证。那么黄亮组的论文有没有剽窃呢?我们可以通过时间和是否有证据表明知道来分析。a) “Tree-based convolution”已经出来一年多了,也在AAAI workshop上做过presentation(虽然我的论文档次比较low,没有中正会)。根据Mingbo Ma邮件的说辞,他们提出tree-based convolution是日,这比"Tree-based convolution"的提出、实现、以及workshop展示晚太多。但凡在Google或者Google scholar搜索一下自己提出的概念,就能发现这玩意儿有人已经提过了,唯一一个就是我的论文。毕竟我们很难说现在的某个工作和一年前的工作是并行的。b) 黄亮组的论文在审稿时引用了相关论文并且说明了不同,在发表时删除引用,也删去了不同点,并且在知道之前论文的前提下,还把题目改得和之前的论文题目几乎一样,显然是有意使用之前论文的想法、文字、研究作为自己的工作发表,是典型的剽窃。c) 再抓一个小剽窃。在黄亮论文arXiv第一版中,讨论了constituency tree-based convolution、但没有实现、也没有数据。黄亮组显然知道我的论文(因为在审稿时引用了),并且我的论文是实现了constituency tree-based convolution的;但黄亮组论文的讨论中,并没有引用我的论文。首先,如同部份网友所说,这种做法正是想通过讨论,把idea堵死,再做constituency tree-based convolution无非是这篇文章的一个扩充而已;其次,这种做法也是典型的剽窃,因为我已经做了,他们没做,他们把人家的idea拿来作为自己的idea宣布一下还不引用之前的论文。你总不能说一个你自己没有做的工作,和人家已经做了的工作是并行的?4. (关于arXiv)我个人之前是每天读arXiv相关文章的,arXiv上论文良莠不齐,但是一篇论文大概什么水平,自己看了一般就知道了。我也反对提交一两页纸,说“我是这个idea的所有者”这样的文章。arXiv自己对论文的要求是“referable”,也就是可被人引用、参考的。那么我的论文有么有达到这样的要求呢?我的论文好像比黄亮组的论文页数长、模型多、效果好。那篇"learning to execute"的文章都敢引,黄亮的工作好像也未必能比他们高到哪里去吧?至于说我论文硬伤太多的网友,值得注意这样一个事实:黄亮组是多么希望找到我的硬伤,最终也才找出来一个,还是他们自己错了——要么就是他们睁着眼睛说瞎话,要么就是他们对背景认知太少。我的文章就算写作差点,好像也没有到那么糟糕的地步吧?另外,我第一版和第二版唯一一个区别是有个数据写错了,c-TBCNN/d-TBCNN的准确率写反了。经一个同学告诉我后,我立即更新了版本。虽然初稿的数据到最后都被超过了,但因为涉及到数据的正确性,不能开任何玩笑,这就是我对待arXiv的态度。即使退一万步说,就算是博客、一般网页的东西,也不能直接拿来就用,只做个脚注是可以的。如果是我的话,我可能会在脚注里这么写:"Tree-based convolution was proposed in arXiv:xxxxxx. After we have finished our dependency tree-based convolution, we find our work has been done in arXiv:xxxxxx." 这样倒是有点embarrassing,或许可以加一句“But their papers are of low quality, and we do not offer citations.”小结:大家可以保留自己的自由裁定权,但最好把想法保留在心底即可。根据黄亮老师的建议,我再次恳请大家尽可能地删除本帖、本讨论、微博讨论。我代黄亮老师感谢大家。======================UPDATE: 补充回复对我“自我剽窃”的指责。以下相关文字最早发布于评论中,有部份修改。有多人说,Mingbo Ma等人居然说我自我剽窃增加novelty。我实在没有见过这么不要脸的说法。我的文章还没有发表,怎么自我剽窃?况且我在投稿时,额外信息中注明了:本文技术来源于我的另一篇未发表的文章,这叫增加novelty?大概那些心理龌龊的人是无法想象有诚实的人存在。
我的观点是 这是一个明显的学术不端事件,但是算不上抄袭无责任推测下,事情的真相应该是这样的:确实这应该是两个同时期独立的工作,Mou在ACL deadline前一周把一个还不是特别完善的版本放到了arxiv上。其实做research前沿的人应该都会很经常地去刷arxiv,黄亮的这个学生应该是aware这个工作的。继续无责任推测下这个学生的心理变化:”卧槽,老子辛辛苦苦做了半年的东西,马上要deadline,你丫放了个arxiv占坑。那我的paper也要继续投啊。“于是怎么办呢,我个人也遇到过这样的事情。我一直偏好的做法是,与其故意不引用,被reviewer指出,不如大大方方在paper里cite,然后加一个discussion,讲清楚联系和区别。要首先自黑到位,不给reviewer黑和误解的机会= =从后来的回信中来,黄亮这个学生应该确实也是采取了这样的办法。效果自然也不错,ACL中了。下面要准备final version了,这个时候,大家中过paper的都知道,如果对自己的paper比较负责,那么会在final version的时候按照reviewer的一些反馈做出修改甚至补充实验,但是往往页数限制,不得不删掉原本submission中的一些内容。恰恰在这里这个学生删掉了这个很关键很相关的reference。当然这里的动机,不便随意推测,我相信不会是个巧合。故意去掉一篇也许是最相关工作的reference,而且更改paper title到一个更general的term,个人觉得明显是有故意偷取credit的嫌疑。黄亮后来在信中的解释其实非常苍白无力,什么不会cite一个不稳定版本的paper,这是非常扯淡的理由。做vision的都知道,RCNN这个paper在中cvpr之前在arxiv上更改过多少个版本,根据读者的反馈,作者做出相应的更改这也是一个好事情。综上所述,总结下:1. Mou这面还是占理的,不过过于着急把一个不完善的版本放到arxiv上这其实不是太好。我曾经讲过某个中国人在arxiv上放了一个两页纸的paper,还在title下面加个footnote说"This is used to declare I am the owner of this idea." 我真是从没见过如此厚颜无耻之人。。。如果这个风气扩散开来,是非常有违arxiv初衷的。2. 黄亮组这面,前面分析的很清楚了,说毫无恶意,反正我是不信的。PS1: 这个事情很有意思,如果双方的身份反过来一下,或者比如Lecun放了一个paper在arxiv上,然后一个无名小卒投了一个cvpr中了,这件事情的舆情会不会反转呢?PS2: 黄亮这个人从微博上一贯的作风和处理这个危机的态度上来说,真是智商有余,情商不足。PS3: 两年前黄亮信誓旦旦地说deep learning是bad taste。结果两年后发了一篇deep paper。后来还有人解释说其实是学生搞得,黄亮没参与太多。结果人家自己在邮件里说这个idea,人家讨论了快半年。这个脸啪啪啪啊。以上。
为什么有些人不去看文章overlap的程度而总说什么抄arxiv不算抄,这什么逻辑?Paxos当年还是挂在个人主页好几年了,那你咋不去抄了拿图灵奖呢。
首先 利益无关 我不是当事人 甚至不是ACL圈子里的人我认为这件事不至于被标上“抄袭”的学术界头等罪名,但我完全支持Lili Mou的做法。我不知道Arxiv在NLP是不是还需要时间来得到承认,但是在CV领域,Arxiv的timestamp等效于正式publication了。现在ML界,尤其是deep learning领域,技术更迭速度太快,大家都知道idea is cheap,几个组在做同样的topic是正常的事情。但是第一个想到,并且以一定质量完成的人应该得到足够credit。请注意 是以一定质量完成,而Mou的文章完全达到了这样的标准。这件事对于黄亮组的致命伤在于,submit paper的时候cite,在camera ready的时候抹去,并且把题目改为更general的tree based convolution来claim credit。作者提供的借口是arxiv的版本质量不高,并且还在不断更新,cite之后会影响自己论文的质量。我认为这是非常非常勉强的借口。诚然搞学术不应该以最坏的恶意揣测每一个人,但是站在我的角度,我认为黄亮组这样做的目的无非有两个:1. 与Lili Mou的文章撇开关系,防止文章发表后因为相似性遭到质疑2. Claim一个新的概念,试图获得更大影响 换一个角度来讲,Lili Mou的偏执在国内学术界是罕见的。如果黄亮和Lili的位置颠倒过来,在国内对待知识产权漫不经心,学术不端事件层出不穷的大环境下,恐怕这并不会掀起太大波澜。所以,相对于黄亮仔回信中说Lili Mou是不懂事的“junior researcher”。我认为Lili恰恰非常成熟,把这样的事情摆上台面严肃对待,是一个成熟的researcher对待自己和别人的工作的态度,并且这样做确实需要极大的勇气。相反,黄亮组这篇文章的做法,即使谈不上“不道德”,也是极“不专业”的。我想一个透明公开的学术环境是最能推动学术进步的,而保持谦虚的态度,给相关的工作credit,是建立这样环境的基石。
闲来无事看了下这位叫Lili Mou的announcement,他认为CUNY和IBM的研究人员发表在ACL上的短文章涉嫌抄袭了他之前发表在arxiv上面的paper。首先,ACL是很严格的double-blind的会议,一篇文章决定录取的话,是要经过peer-review(同行评议)的过程才能决定。如果一个研究工作和发表在其他主流会议上的东西太相似,一般TPC都会善意地指出来。但是这件事情复杂在于,Lili Mou的工作是放在了arxiv上面。众所周知,arxiv没有任何peer-review的,而且一般的TPC也不会去看arXiv上面的文章(至少网络和系统方向),虽然很多作者会把自己发表在会议期刊上的paper放在上面。严格来讲,剽窃arxiv当然也算剽窃。但是有时候会发生这种情况,一个作者的工作因为evaluation不够完善,或者实验设计有问题,以至于虽然idea还不错,但是还是会被拒稿。那么之后紧接着很短的时间内如果有人也用到这个idea,但是因为工作更加完善,被接收了。这种情况下成果完成人肯定是后者。但是有时候前一个作者会把文章挂在arxiv这种地方,那么是否可以判定后者抄袭?其实这种事情经常发生。这其实是一个相对灰色的地带,其中的分寸还是需要ACL官方来拿捏,不过我觉得最终官方应该不会理会。idea只是研究工作的一部分而已,做研究不是在那里想idea就可以的,evaluation同样重要。并且那篇ACL文章的作者也回应了,作者很“委婉”地指出了“For the camer-a-ready version, our priority was to cite peer--reviewed work to ensure the quality ofour own paper. I felt it would be embarrassing for us to cite a paper that is still constantly evolvingand that has serious technical problems and not yet justified via rigorous peer--review." 大意便是,这位北大博士放在arxiv上面的文章,首先不是同行评议的所以存在很多严重问题,因此在正式会议中引用会显得"embarrassing"。最重要的是,当事人指出"The independent originality of our paper was already established by ACL’s rigorous double--blindpeer--review process, where our submission received very positive reviews, including one whichmentioned your paper." 很显然,在审稿过程中这位北大博士的工作已经被TPC提及了,我觉得既然TPC都觉得没有问题,所以对他们抄袭的指责至少在国际学术界是没有被认可的。我们就不必去judge他们是不是剽窃了。仔细看了Mou所指出的抄袭的那几个证据,顺便读了两篇文章,确实太过于勉强。两篇paper讲的是完全不同的东西,指责抄袭不成立。但是在camera-ready版本修改了reference也算是个硬伤吧,但是这种事情还是很常见,往往作者上传的camera-ready版本publicity chair也不会去仔细审核。删掉cite可以算不端,但是上来就指责别人抄袭并不合适。
在camera ready删引用确实是耍小聪明搞学术不端。不过Mou在声明里面写的很多东西也太主观,无法令人完全信服。这个方向搞东西太简单了,不是什么突出性的贡献,一般你能想到的别人也能想到,而且很快就能做出来,也不能因为比别人早放在arXiv几天就断定别人是抄袭。不要太当真,你无法左右别人做什么事情。只有当你持续得做出高质量的工作,才会得到别人认可。学术圈黑暗的事情多的是,还有人专门靠审文章找idea。如果有选择,不要混学术圈,做点更有意义的事情。
arVix我只引导师的 别人的我咋知道对错!
这要是真承认了剽窃,那huang和他的这几个学生没法在学术圈混了啊。所以,只有尽量说不是剽窃了
你们啊,taste怎么都这么低呀,有本事写个slides总结下啊
利益无关,只说三点:(1)在我们CV圈,如果发论文而不引用arXiv,那简直是不能直视的,而且今年CVPR会议已经投票表决通过,以后可以接收arXiv论文;(2)在最初的版本引用,而在最后版本删除最相关引用,改更general的题目,显然学术不端,恶意获取credit;(3)Mou的论文还说的过去,对于同样的idea,作为大牛指责别人论文低端、low逼格,显然有失身份,就好比说,同样一个果树下的果子,人家销售技巧不好,只卖5块钱一斤,你有身份,非常会sell,可以卖100块钱一斤,但是都是同样的果子,大家都是出来卖的,这样做真的好吗?
作为NLP圈子内的非大牛一枚,我谈谈我的观点。我觉得首先一点,不算是抄袭或者剽窃。首先是这个想法很容易想到,我记得去年讲完的CNN论文就想到了这个idea,只是由于忙其他的工作就没做,这点Liang Huang的解释是可以接受的;然后就是没必要,为了这样一个工作抄袭而毁了学术生涯是不可理喻的。我认为他们就是差不多的时间想到了相同的想法,然后去网上搜了一下没人做,就开做。然后做完准备投的时候发现有相似的工作出来了。争论的焦点在arxiv发表。我觉得发表论文,不管是peer review的还是arxiv这样的,都是为了占坑。告诉别人,我做了,你们就不要做了。但是arxiv不同在于,随意什么文章都可以发表,质量没有保障。当然,我认为Mou lili的文章是有一定的水平的。对于NLP领域来说,arxiv上的文章最终还是要投到正式的期刊或者会议的,这样才能够得到广泛的承认,也是对自己工作的保护。换句话说,在没有足够的把握的情况下把工作发表在arxiv上或者把idea告诉别人是有风险的(这个在NLP领域近年有发生)。一般来说,只有自己的工作已经在审的时候把论文发表在arxiv上才比较安全。或者自己认为自己的工作足够NB,不用担心别人的竞争,只放arxiv也可以,例如Mikolov的word2vec,论文没有在正式的期刊或者会议发表,但是不影响其地位。回到Mou的问题,他自己的工作本身idea比较简单,而他的做法没有足够的cover所有的情况,然后没有正式或者投稿发表就放到arxiv上。这个时候别人也独立的做了相同或者类似的工作,当然有理由去投稿。最重要的是,liang huang的文章中了之后,Mou lili的工作不可能再在ACL之类的顶级会议上发表了。我是不能理解为什么他不把自己的工作投到ACL之类的会议上。我觉得这是一个公平而残酷的compete,也是游戏规则许可的。最后举一些自己遇到的情况,去年自己做了一个工作,也是属于那种比较简单的想法,然后投了COLING。结果审稿的时候有一篇相似的工作在ACL发了出来,当时还没有正式出录取结果,是作者自己在google plus上贴的。后来COLING被拒了,但是对比了两者的工作,发现还是蛮多不同的,最后就投了一个很普通peer review的会议。当然,我们后来仔细对比了我们的ACL工作的差别,最后reviewer也认同了。本来以为就是灌水了,最近发现还是被一些相关ACL论文引用。然后当时还在做的另外一个工作,做了两个月发现arxiv上类似的工作出来了,是CMU做的。后来就放弃了,他们后来发了一篇ACL+一篇ICML。总而言之,如果Mou有足够的证据证明liang huang是抄袭,那没有问题。如果仅仅是独立的工作,最后即便不引用,也无可厚非,每个人都在试图在合理的范畴内最大化自己的利益。要怪就怪自己没有投稿,也没办法堵死别人的路。还有,Mou同学在pdf文件中从头到尾都是职责别人是抄袭,总觉得戾气太重。PS:我算是认识黄亮,聊过几次,但是没有合作关系。
感觉指导老师要把当事人牵回家的感觉。个人不是特别喜欢arxiv. arxiv更适合物理等专业用,而不适合计算机领域。计算机的审稿周期其实并不长,也就几个月。花一年时间做的项目,如果不是马上要找工作或者申博士,有什么必要要把还没经过peer review的文章发出来?如果不是成名已久的大牛,真的有把握自己写的东西和经过peer review的论文是一个水平的么?顶级会议的圈子就那么大,有兴趣看论文或者能看懂论文细节的人也不超过两只手。如果需要反馈意见,不如把论文放在dropbox上,手动发链接给这些人。说到底主要目的就是占坑,可以排除同一时间工作在同一个问题上的同行,claim自己的credit。但是占着坑不拉屎,或者拉不出屎,这坑就永远被占着了么?最后arxiv是为了promote related research in the community ,不是为了阻碍同行工作。科研里面占坑这件事由来以久,系统做得出来就叫system,做不出来就叫on the feasibility, 实在不行,也要在future work把idea的路堵死,总之每个人都想把自家的坑挖大。但是要是前人如果发了一篇feasibility,即便后面真有人辛苦做出系统了,也会被认为这个contribution是incremental的。==============最后关于移去引用的问题,我觉得其实是一件比较常见的事情。自己这几天刚好也在准备camera ready version,在经过review以后,得到了大量的意见,但是要在本身长度不变的情况下,将各个审稿人的评论集成进论文并不是一件容易的事情,而最容易下手的就是citation部分。==========一直觉得未来计算机的论文就该是一个git repo,每个人可以fork,star,pull a request,涉及硬件的话,就要配上3d打印模型或者reproduce steps。这样虽然会降低整个领域的产量,但是整体上应该是促进领域发展的,避免部分大牛占着坑,霸着之前工作的门槛,不让后来人进入。最后用citation来衡量论文的质量真的是够没意义的,被cite多只能表示这篇论文所处在的领域是一个热门领域。90%的citation都出现在related work,都只是综述性。真正说明一个research 水平的应该是fork,star 数量,这说明多少人真正对这个研究感兴趣。
我的一切出发点都是我读完这两篇paper之后,将这一事件定义成一种idea的撞车,而且是从两个不同起点沿着两个几乎正交的方向殊途同归的撞车(我个人认为对于学术界来说,比起近年来一大批和Socher RNN撞车的工作,这是一件好事)。在这样的前提下,我认为当事人Mou选择了抹黑黄亮组这一对其个人和组织最不智的解决方式,也是会对学术圈产生恶劣影响的解决方式。(我十分肯定这两篇paper属于撞车行为,两个model哪一个都不能说通过加一些trivial的限制来包含另一方。Mou本人在上面的回复并未明确提到model上的抄袭嫌疑,而是更多地表达出因为概念上的相似以及contribution的over claim的愤慨,在一定程度上帮助我确认了我对事件的理解。然而这一点上我不能代表其他人,因为不同的人对于model的理解角度可能也会不同,我欢迎所有其他人跟我对关于这两篇paper理解进行讨论,同时我更希望看到的是Ma和Mou能够官方对质把model的异同讲清楚。)====================================================为什么我坚持反对Mou的抹黑行为?先讲个发生在我自己身上的故事:有一年去nips开会,我做了一篇paper,抢了那个方向上某位大牛的坑(我甚至连几个引理都重造了轮子)。然后poster session那位大牛就站在我的poster前面让我present,我当时吓得恨不得尿遁。。。然而后面的结局峰回路转,这位大牛没有“用四支枪指着我们的头让我们喝尿”:第二天中午,他和他的co-author一起跟我和我的co-author吃了饭,席间作为前辈他们先小表扬了一下我们出手快,然后指出了这个bound接下来如何才能有质的改进,说如果我们要是有兴趣可以去做多年之后再回想起来,我觉得那个工作trivial至极。甚至用本次事件中当事人Mou的说法,我们在引用了大牛那篇arxiv文献时“over claim”说他们的定理是我们的特例。如果让本次事件当事人黄亮来评价,我猜他会说这是一个bad taste的工作。那么,也许你要问我为什么你要在这里去支持有可能批评你研究品位差的黄亮,却不去支持一个和你一样的junior researcher呢?道理很简单:“我不相信黄亮所号称的‘人的taste坏掉了就再也没希望了’,但是我坚信无端的污蔑剽窃会毁掉我的学术生涯”。回想起来,如果我那一年nips之前知道了还存在着被人抹黑抄袭这种可能的结局,我甚至不会有勇气把我的paper投出去,那样也不会有我的今天。我觉得一个普通的博士新生难免会以trivial的工作开始自己的学术生涯,所以跟别人撞车也难以避免。然而在我的经历中,无论是我自己还是我的同学与其他人发生撞车,其最终结局无非是大家在conference上惺惺相惜相见恨晚,甚至还有就此建立合作关系以后一起发表工作的美谈。这让我一度觉得我所在的学术圈是一个温情脉脉的,大家互相欣赏互相扶持的society。但是这次事件Mou的处理方式让我意识到了学术上的撞车事件其实还存在着另一种可能的结局:那就是大家互相诽谤剽窃。如果这件事情开创了一种风气,我不知道会对整个圈子造成怎样的影响。套用一句话来说,今天Mou冲着黄亮来,我没有替他说话,等下次有人冲我来,就没有人替我说话了。黄亮怎么说在NLP领域还算名人,这次舆论上还是有人支持他,但是我只是一个普通人,我被抹黑抢走了工作,对于这里的大部分人来说,他们根本不会听说这件事。更不会有这种知乎问题提出来能让人们自由地讨论来澄清事实。我不是北大的学生,不过就在前几天我一个曾经在北大语言所的同学跟我说,他觉得黄亮这次凶多吉少了,因为他们惹上了北大最能欺负人,名声最不好的一群faculty。我看了一下Mou的导师们貌似是游走在几个不同领域的,所以事情闹多大给圈子带来多不利的影响,他们可能真的无所谓。但是我相信Mou同学既然有这样的执着,说明他希望自己未来能在NLP领域占有一席之地,也会在乎自己在NLP圈子的名声。但是闹到现在,我猜测Mou同学可能也是身不由己了,这说明我发这篇回复可能完全无力改变任何状况,因为有背后的人逼着,Mou也许甚至连道歉都没法做,然后(最坏地情况下)这种坏风气就可以(至少在国内)继续传开。在这种情况下既然我无力改变什么,我唯一能做的就是保护好我自己:我发誓以后一定要做fundamental的工作,不再让对idea撞车的担忧和对credit的争夺占据我宝贵的做研究时间,“我发誓,再也不会让人拿枪指着我的头”p.s. 我不知道在这个问题下讨论的人有多少人读过这两篇paper,总之这个事件最让我最惊讶的不是“黄亮也开始搞deep learning了”,而是根本没有人去讨论两个model的具体关联,学术撕逼的气氛全无。。。=========================================================另外,上面说arxiv重要性的人,有没有就事论事考虑NLP的情况,ACL圈子conference已经很密集了,而且ACL圈子还有个每月都能投的TACL。会议论文(以及其下的大量workshop)已经良莠不齐了,再用arxiv乱占坑只能更加添乱。个人承认arxiv的诸多好处,但是对这种乱占坑的滥用深恶痛绝=========================================================这两篇paper我都读过,我觉得这俩工作差别很大,不能说抄袭。黄亮组的唯一问题在于他们不应该删掉引用,以他的身份,从提携后辈的角度来看,也应该去引用Mou帮助Mou进行一些宣传。另一方面,我觉得这个Mou Lili应该被惩戒,否则此恶例一开,以后是个人做了点儿工作就可以去骚扰其他同一方向的研究人员。另外关于有人黑黄亮说“如果这个arXiv是Bengio的,黄亮敢这样做?”。作为一个有幸与Bengio教授交流过并得到过提点的学生,我可以负责任地说如果这个arXiv是Bengio的,黄亮不引Bengio人家Bengio根本不会搭理你。我曾经被Bengio指责说你不能管Recursive NN叫RNN,但是你看见Bengio去Stanford闹了吗?
在学术圈混还是要按照基本法:1.不要随便抄袭,抄袭也要按照基本法,大家都是为了生活嘛,抄相不要太难看;2.不要举报学术不端,大家都是为了生活嘛,人家抄袭又不会影响你,说不定大家以后都要相互提携的嘛。
利益无关,我要给一个不太相同的回答:竟然没有人去批判Mou同学有故意诽谤,主观上故意夸大当事人过错的嫌疑?做学术之人最为爱惜自己的羽毛,被人诽谤抄袭犹如吃shi,没有摔桌子还好声好气的回复沟通已经算很不错了。做学术之人都知道学术信誉是一辈子的事情,Nature文章撤搞,当事人导师自杀的事情你们可曾还记得?随便拿一个业内科研工作者的学术声誉来要挟他为自己的利益服务,是最卑劣的小人行为。虽然我情感上能理解Mou同学为什么这么生气,但Criticize一篇工作没有cite该cite的文章本来是学术范围内需要讨论的事情。打个比方最近Science上Deep Learning的文章也被JS猛批,但似乎没看到人说这篇文章应该被撤稿。Science的文章可远比ACL short影响力大多了。我个人是非常反感拿arXiv占坑的,arXiv是一个非常好的平台,但是不能这么被用坏了。arXiv上的文章没有peer review是什么意思?不是说arXiv的文章没有质量,而是没有质量认证。再新鲜的鸡蛋不去过质量检查就送到市场上卖,看到别人也在卖鸡蛋,质量可能还不如自己的鸡蛋就妄图给别人抹黑,这样的行为你们有什么好鼓励的?至于黄亮组在审稿过程中对文章做了修改,这本来就是规则内允许的事情,你们通过一些细节事情揣测其存在学术不端意图,本身并不能让他们受到制裁。这件事情至多会对Mou同学的学术利益产生影响,但是Mou同学的行为不但严重破坏学术秩序,而且还助纣为虐给那些arXiv占坑帝树立了“榜样”,竟然也会受人同情,这让鄙人无法接受。至于回答中其他一些对黄亮其个人的评价(而不就事论事)就更加恶意满满,我就不点名了。
你问我资不资瓷学生抄袭,当然资瓷啊,抄完能发acl我能不资瓷么?但是抄袭也要按基本法来,不能抄完引用原作投稿,录音后删引用。当然,老板的决定权也是很重要的,毕竟学生是黄亮的手下。---------------------------------------------------------------------看到上面还有给黄亮洗地的,真是感到恶心和不安。是否剽窃暂时不好定论,但学术不端是坐实的。如果黄亮这种行为没有得到应有的惩罚,此恶例一开,各位看官如何保证没有人欺负到你头上?你们挂在arXiv上的工作被人“借鉴”过去,你们作何感想?你们看看黄亮的回复,说你们文章水平低,我们就把引用删了。简直是赤裸裸的欺负人。为什么黄亮敢明目张胆欺负Mou Lili?因为Mou的学术地位比他低。如果这个arXiv是Bengio的,黄亮敢这样做?如果大家不替Mou Lili说句公道话,以后万一有比你学术地位高的人欺负你呢?Mou Lili已经提供了很多证据证明抄袭,黄亮如果清白,就应该把他和学生之间所有相关的邮件截图公布,届时一看便知是独立工作还是“借鉴”的工作。非常支持Mou Lili同学的维权行为。如果是我,我还会向黄亮所在学校、院系投诉,向ACM投诉,要求黄亮证明自己没有剽窃。把事闹大得罪黄亮没有关系,以后投稿只要把他所在机构标为conflict即可。
一开始以为是《算法艺术与信息学竞赛》的作者。。。一打开主页一看 居然真的是。。。。哎:-(
Mou的心情可以理解,但应该给出更详细的证据,而不是意气用事、夸大其词Ma和Huang的回信太过强硬,毕竟camera-ready删重要citation也不对Huang的水平大家是有目共睹的,不至于为了一个acl short抄袭,再说也不是抄袭了什么了不得的ideaHuang也可以给出事实性证据,证明自己确实是很早之前独立做出了这个ideaMou这样无端攻击他人其实是不好的,建议摆出更多事实证据Ma的回信里面有基本技术上的错误(而Ma说是Mou错了,其实是他自己没搞懂),确实给人很业余的感觉arxiv上的不少手稿确实是为了占坑,但不表示水平就一定低,合理利用arxiv是有很多好处的引用arxiv是可以注明引用是第几个version,不存在“怕手稿变了”这一说很多时候idea是cheap的,同样的想法同时期很多人都有,就看谁先做出来、做得更好圈子太小,太多认识人,所以匿了

我要回帖

更多关于 彩虹无线 黄亮 的文章

 

随机推荐