央视采访《英雄联盟》S9冠军Doinb期待未来加入中国国籍


 早前《英雄联盟》全明星赛已落下帷幕,随后有央视节目分别采访了包括S9总冠军FPX战队的doinb在内的多位职业玩家,同时他们还分享了自己对于2019年的看法以及未来的愿望。

除了隔年出版的会议影响外,我们可以看出一个明显的趋势,即从事NLP研究的人数在不断增长。

从中可以看出,除了各种workshop论文外,LREC已经成为NLP会议论文的最大单一来源(尽管LREC是一个相对较新的会议,每两年召开一次,但它的接受率往往很高,约60%)。其次则是主会ACL/4839,COLING/3142,NAACL/1479……

“这种合作模式不仅为贫困家庭开辟了脱贫的好路径,也助推了园区企业的发展,让扶贫户产品有销路、企业原材料有保障,实现了企业和贫困户的双赢。”古港镇党委书记、两型产业园党组书记陈建说。

在论文首页底部他也写了,匿名是因为这项工作目前还没有正式发表。

食品加工企业需要大量原材料,在脱贫攻坚中扮演着重要角色。作为全国农产品加工基地、湖南省首家特色食品产业园,浏阳两型产业园通过“企业+合作社+贫困户”模式精准实施产业、就业扶贫,从“输血”到“造血”、从“漫灌”到“滴灌”,带动了一大批贫困家庭走上脱贫致富路。

1、NLP领域每年发多少论文?

我们知道,当前的NLP研究主要是针对英语/英语数据集。原因很多,这里不再赘述;这种现象就会造成一个现象,即当研究课题是非英文语言时,往往会在文章标题中显示出语言的名字。

对于自己给2019年的生活打多少分的问题,FPX战队的刘青松表示100分满的话会给自己打70-80分,主要是给自己的中单和打野打的成绩;Tian则表示自己会给自己打70分,10分扣在今年赛季初,剩下20分扣在世界赛;Doinb则给自己打80-90分,同时他对自己对内的每一位队友都很满意,都想打满分,因为大家都很努力;JackeyLove 则结合自己整年的状态给自己打了个及格分;PDD也给自己的2019年打80分,同时他还调侃这20分扣在自己没有减肥成功上。

1)女性发表的论文占多大比例?

从2013年到2018年,我国农村贫困人口从9899万减少到1660万,每年减贫人数都保持在1200万以上,832个贫困县已脱贫摘帽436个,中国的减贫成就令世界瞩目。

现在网购已经成为了大学生主流的购物方式,在大学里的快递服务点每天都会有堆积如山的快递,对于那些不愿从宿舍下楼拿快递的同学,你就可以为他们提供快递送货上门的服务,直接给他们送到宿舍门口,每个快递收两块钱的报酬他们也会欣然同意。

3)直到 2016、2017年,研究人员的平均学术年龄在不断增长,但随后却开始下降了,这个可以从下图中看得更加清楚一点——

而且在学生家长眼里,别人家的孩子为什么学习这么厉害,能成为高考状元肯定是有原因的,自己家的孩子和高考状元之间可能就差这一本高考秘籍了,为孩子投资刻不容缓,再加上商家的故意炒作,高考状元笔记从来就没有消停过,操作这个项目年赚百万的人比比皆是。

且先不追究这位作者是谁,雷锋网从报告及他的博客中撷取部分内容,来了解 NLP 领域 50多年来的发展态势。共有八问——

如果按照这个理想规则,那么使用标题来提取关键词应该会具有一定的代表性。(当然实际上还会有许多要考虑的因素,这里不再赘述)。

大学里面的人很多,消费需求也很高,大家可以从这两点来寻找机遇。大学生和社会人士是有很大的区别的,比较单纯,赚同学的钱也相对更加容易一些,只要我们敢想敢做,就能有所收获。

如果能去调查NLP研究人员的实际年龄分布,当然是一件有趣的事情。但很遗憾,目前没有这样的信息。于是这位匿名作者另辟蹊径,提出了:NLP学术年龄。如果一位研究人员是第一年在AA上发表,那么这个研究人员的NLP学术年龄是 1 ;如果是在2001年发表第一篇AA论文,并且在2018年发表了最新的AA论文,那么他的学术年龄是18。

国家提出“六个精准”“五个一批”实施路径,涵盖了贫困地区基础设施、公共服务、产业就业、生态建设、社会保障等重点领域。并逐步建立起比较完整的脱贫攻坚监督和考核评估体系,对脱贫攻坚政策和规划的落实情况、扶贫对象识别、政府扶贫绩效、财政专项扶贫资金和贫困退出等进行考核评价。由此,中国脱贫攻坚形成了包含责任体系、组织体系、投入体系、动员体系、政策体系、监督体系、考核体系等在内的“四梁八柱”,不仅为决胜脱贫攻坚战、全面建成小康社会,提供了有力的制度支撑,也促进了国家治理体系的进一步完善。

关于出售高考秘籍、状元笔记这类的项目,网赚圈可以说流传甚广,每年都会兴起一波,同时,这本身也是一个生生不息的产业,貌似也成为了每届高中生必经的环节之一,虽然这些秘籍本身并没有多高明,但起码是心理上的一个慰藉。

作者统计了每年首次发表论文的作者比例,在1965年-1985年期间,这个比例逐渐下降;随后到2005年基本稳定在40%-50%之间;然后2005年到2015年则下降到40%上下。这也说明了从1985年之后,NLP社区已经趋于成熟稳定。不过我们有趣的是,从2016年之后,这个比例又开始逐渐上升了。(注:这个比例明显会受到奇偶年的影响)

其中2018年首次发表论文的作者占到44.93%,而学术年龄不到5年的作者比例占到65%。事实上,该数字自1965年以来一直在稳步下降,在1990年代为60%至70%,2000年代初上升到70%至72%,然后再次下降,直到2010年达到最低值(约60%),并再次稳定上升,直到2018年(65%)。

截至2019年6月,AA拥有约50,000个条目,但其中包括一些并非真正的研究出版物的条目(例如,前言、序言、目录等),将这些舍弃后,还剩44,896篇文章。上图中显示了从1965年到2018年期间,每年发表的论文数量。从图中可以看出:1)1990年之后,NLP的研究开始突飞猛进,特别是在2000年之后,AA文章数量开始破千;2)隔年出版的影响在图中可以清晰看到,特别是1998年以来,类似LREC、COLING这样的会议。

NLP领域和其他领域一样,并不会记录作者的个人信息,例如性别、年龄、语言等。但这并不代表我们没有办法研究性别分布——作者的名字往往会蕴含着性别信息。根据这个信息,这位匿名作者利用美国社会保障局发布的新生儿姓名和性别数据库进行匹配识别。

首先来看NLP研究人员的在每一年的平均学术年龄分布——

因此,作者的假设,再具体一点就是:随着时间的流逝,与该领域相关的标题词的出现频率,将在某种程度上反映出对某个研究领域的广泛兴趣。

注意,这里英语的频率并不是第一,原因是大多针对英语的研究并不会在标题中表示。现在社区中有越来越多的人意识到这是不正确的,这对其他语言是不公平的,因此有人建议应当在所有研究的标题和数据集名称中注明所研究的语言。

Sneha Kulkarni曾表示:“一个好的研究论文标题,应当满足三点,1)用尽可能少的词概括论文的内容;2)吸引到读者的注意力;3)将论文与同一领域的其他论文区分开。”

5、NLP领域,年轻人真的越来越多了吗?

3、哪个会议/期刊的论文最多?

3.大学生创业项目:寝室小卖部

因此,如果不是去回顾历史的话,我们常常会感觉最近的会议上有大量新人涌入,虽然这是事实,但也是错觉。事实是,现在(2018年),NLP领域的平均学术年龄要比历史上许多时候都要高,年龄大的(因此也是经验丰富的)人所占的比例要更多。

这张图展示的是不同会议或期刊的收录论文情况。

脱贫攻坚已到了决战决胜、全面收官的关键阶段。“现在全国还剩5%左右的贫困人口,越到最后时刻,越要坚持频道不换、靶心不散,不获全胜,决不收兵。”国务院扶贫办有关负责人说。

3、哪个会议/期刊的论文最多?

2、有多少人在做 NLP 研究?

值得注意的是Doinb还表示自己目前正在准备申请绿卡,2016年到现在每年都在准备一些材料,希望有机会后面转到中国国籍。

扶贫产业园内外,更多的贫困户正在用双手“编织”出美好生活。浏阳古港镇沔江村农民肖永根因父母多病致贫。扶贫产业园的落户,不仅改变了村里的居住环境,也带来了新的发展理念。看到园区广阔的创业空间、不断兴旺的商贸人气,肖永根的生活热情被重新点燃,他开办了一家保洁公司,业务做得红红火火。

目前,全国有92%的建档立卡贫困户参与产业发展,一大批特色产业在贫困地区拔节生长,鼓起贫困群众脱贫致富的“钱袋子”。近6年,贫困地区农村居民人均可支配收入年均增速高出全国农村平均水平2.3个百分点,一个个贫困家庭的生活发生了根本性改变。

在印象最深的事情上,FPX战队的刘青松表示2019年发生了许多之前从未想过的事;Doinb则表示S9夺冠是今年自己印象最深的事情,这也证明了自己是有实力拿下世界冠军的;Tian则表示S9夺冠后走在大街上会被认出来;刘青松则表示S9夺冠后一些之前不怎么说话的人突然都过来表示祝贺;PDD也给自己的2019年打80分,同时他还调侃这20分扣在自己没有减肥成功上。谈到2020年的目标时,Doinb表示自己的目标是春季赛拿个冠军,进MSI,Tian的目标也是2020年再拿一个冠军。

8、谁的影响力最大?

雷锋网AI科技评论按:在昨天ACL 2020公布了最新的投稿数量:3429篇。这也是所有ACL旗下会议首次接收论文数量破 3000篇。

笔者在搜索相关资料的时候,无意间发现就在前不久已经有人做了更为详细的调查和分析,

小康不小康,关键看老乡。为打好打赢脱贫攻坚战,今年以来从中央到地方主攻深度贫困,瞄准突出难题,聚焦产业发展,脱贫攻坚不断提速、提质。

2)女性喜欢做什么研究?

经过统计,女性作为第一作者发表论文数量约26637篇,大约占总论文数量的30.3%。从时间线上来看,从1980年至今,女性第一作者论文比例总体来说变化不大,但近年来却有稍微的下降趋势。

这里作者做了假设,认为标题内容是和文章研究主题一致的。

图中字体较小,但大致是颜色越深,标题中出现的频率越高。从中可以看出中文的研究是所有非英语中频率最高的,且远远高于其他语言(例如法语、日语等)。

一个进一步的有趣的问题是,发表论文的人到底有多活跃呢?这很难确切回答,但我们可以将一段时间里的人数累加起来看,例如

2、有多少人发论文?

作者据此观察,统计了如下的表格,共有122种语言:

6、对哪种语言的研究最多?

【见闻】11月25日,46岁的湖南浏阳小河乡皇碑村村民罗洪明笑开了怀,浏阳两型产业园的食品企业按期收购了他栽种的6亩芥菜叶。“算下来每亩能有4500元的收成,加上上半年种植刀豆的收入,今年我家的纯收入有4万多元。”罗洪明说。

(作者注:由于中文名字的拼音与性别识别的关联较小,因此中文作者的性别较难识别。)

对于那些喜欢晚上打游戏的大学生来说,半夜饿肚子的时候就会想起吃些零食来充饥,但是又不愿跑到超市买东西,寝室里的小卖部就会成为他们优先的选择。而且一个寝室小卖部的前期投资也不会超过一千块,就能够完全满足他们购物的需求,价格上采取薄利多销的模式,也能很好的提升客户的粘性,达到让客户重复消费的效果。

1)2018年的平均学术年龄为5.41年;

正如维特根斯坦所说:“我的语言将限制我的世界”,对于一个语言群体也是如此。能否将其所使用的自然语言融入到自动系统(例如计算机)中,以及融入程度如何,是决定使用该语言的人群在网络世界中影响力的关键因素。

我们还可以从另一个角度来看,

董明珠表示,高质量发展靠互联网不行,必须发展实体经济,实体经济里面最重要的是制造业,我们是一路做出来的。比如,跟雷军赌,当时他们都认为他们能赢,甚至很长一段时间来想十亿拿来怎么分。这个结果证明我们是对的,但实际我没要他的钱,我觉得这个十亿在这个过程中是一个观念的争执,真正不是为了赌这十个亿,我觉得价值所在,在于我们怎么认知传统产业和现代产业。

由于AA文章往往不要求作者提交关键词,因此要想统计文章的研究方向,最便捷的一种方式就是——从标题中提取关键词。

4、NLP领域,女性喜欢做什么研究?

4、高考秘籍、状元笔记

再详细一点,我们来看 2011 – 2018年,不同学术年龄之间的比例:

作者还做了一个有意思的统计,依据关键词来看女性第一作者的分布。从图中可以看出,女性的工作在discourse、annotation、study、corpus等领域所占比例较多,而例如parsing、dependency、model等则相对较少。

在2017年和2018年(至少2年)发表了至少一篇论文的人大约为12k(精确来讲是11957); 在2015年至2018年(至少4年)发表了至少一篇论文的人大约是17.5k(精确为17457)。

这引起了笔者的好奇,历届 ACL 都接收了多少文章呢?当前做NLP的研究人员数量在什么量级呢?目前最热的研究领域是什么呢?

尽管30%的比例,相较于计算机科学的其他子领域已经比较高了,但离男女势均力敌还比较遥远。

作者统计了每年学术年龄的中位数,1965年至1990年大部分时间的平均年龄为1岁,1991年至2006年大部分时间的平均年龄为2岁,2007年至2015年大部分时间的平均年龄为3岁,此后又回到2岁。这大概是 NLP 领域的“返老还童”吧!

1、NLP领域每年发多少论文?

4、NLP领域,女性喜欢做什么研究?

董明珠强调,没有传统产业,没有今天的发展,这是一个社会演变进步的过程。她认为,现在人们印象中空调、冰箱可以讲一大堆,真正的变化是在于装备。我们现在已经自主研发创造了一百几十款各种不同的机床,用最高端的机床来保证消费品的质量,这才是最有价值的。我们过去格力全部靠引进,就是买,购买国际上的这种高端数控机床等等。因为中国做不了,那我认为这就是我们国家的需要。我们既然是企业,企业的使命是什么?就是要和国家共命运,我们当时在2013年进军智能装备,我们用了七年时间,现在这么多装备出来,已经得到了根本的改变,而且同时我们现在装备也开始出口,我觉得这就是它的价值。 

下面这幅图是女性作为第一作者在历年论文中所占比例

从1965年至今,NLP领域的研究热点是怎么变化的呢?这是一个有意思的问题。

6、对哪种语言的研究最多?

5、NLP领域,年轻人真的越来越多了吗?

2)NLP研究也在逐渐走向“老龄化”;

【数据】超1000万,一个温暖人心的数字——国务院扶贫办主任刘永富日前表示,预计2019年我国减贫人口将超1000万。截至2019年底,95%以上的贫困人口可以脱贫,90%以上的贫困县可以摘帽。

【点评】北京师范大学中国扶贫研究院院长张琦:新时期中国脱贫攻坚制度体系的顶层设计,突出强调各级政府都要承担起责任,发挥好中央和地方“两个积极性”,形成上下联通、高效协同的管理体制。各省自上而下地形成了省、市、县、乡、村五级书记一起抓扶贫的领导责任体制。部署东西部协作扶贫、定点扶贫,以及社会各界合力攻坚,不仅有效增强了国家贫困治理体系的资源动员能力,也不断推动着贫困治理领域的改革创新。