投稿/爆料
厂商入驻

ICLR 2018各机构、学校论文成果大排名

论智|2018-02-01 12:07

前天,ICLR官网公布了2018年大会接收论文的名单,其中有23篇(2.3%)oral paper,314篇(32%)post paper,90篇workshop paper。

今天,webia网站提供了ICLR 2018论文的数据,并做成可视化图表展示了论文提交成果。同时附有代码实现,感兴趣的同学可以利用pandas、matlab、numpy等工具动手制作可视化图表。

所需工具:

import pandas as pd
import matplotlib.pylab as plt
import numpy as np
import matplotlib.cm as cm
import seaborn
seaborn.set()
%matplotlib inline

数据框架下载:

### Loading dataframe
df_paper = pd.read_json('./paper_df.json')
df_author = pd.read_json('./author_df.json')
df_inst = pd.read_json('./inst_df.json')
df_country = pd.read_json('./country_df.json')
df_paper = df_paper.drop([0]) # has nan
# All data are available at https://github.com/pajotarthur/ICLR_data

以下是网站所展示的论文分布情况。

所有类型论文的平均分数

groupby_decision = df_paper.groupby('decision')
groupby_decision.aggregate(np.average).review

ICLR 2018各机构、学校论文成果大排名

在接收的论文中,做口头报告的论文平均分为7.3,张贴论文为6.5,workshop论文为5.4,剩下被拒的论文平均分只有4.6。

分数直方图

ag.plot(kind = 'bar', colormap = cm.Accent, width = 1,figsize=(15,10),stacked=True)
plt.show()

ICLR 2018各机构、学校论文成果大排名

分数直方图(非重叠版本)

df = pd.DataFrame({'value': df_paper.review.round(1), 'type': df_paper.decision})
df['dummy'] = 1
ag = df.groupby(['value','type']).sum().unstack()
ag.columns = ag.columns.droplevel()

ag.plot(kind = 'bar', colormap = cm.Accent, width = 1,figsize=(15,10))
plt.show()

ICLR 2018各机构、学校论文成果大排名

虽说oral的分数普遍较高,但有几篇却明显低于大多数oral的分数。

接收论文数量最多的作者排名

df_author.sort_values(['nb_poster','nb_oral','nb_workshop'],ascending=False).head(25)

ICLR 2018各机构、学校论文成果大排名

按照接收论文的多少,为参与者排了名。位列第一的是Sergey Levine,除此之外不乏我们熟悉的Yoshua Bengio(第二)、Ian Goodfellow(第七)等。

提交论文数量最多的作者排名

df_author.sort_values(['nb_paper'],ascending=False).head(10)

ICLR 2018各机构、学校论文成果大排名

以上是提交论文最多的作者排名,包括被拒绝的论文。

论文平均分数作者排名。(我们挑选了提交论文大于三篇的作者)

df_author[df_author.nb_paper > 3].sort_values(['avg_note'],ascending=False).head(10)

ICLR 2018各机构、学校论文成果大排名

接收论文数量最多的机构排名

如果所有作者都来自同一机构,那么算作该机构的一篇论文。如果论文的三位作者中有一位来自这一机构,那么这一机构算完成了三分之一的论文。

df_inst.sort_values(['nb_poster','nb_oral','nb_workshop'],ascending=False).head(10)

ICLR 2018各机构、学校论文成果大排名

提交论文数量最多的机构排名

df_inst.sort_values(['nb_paper'],ascending=False).head(10)

ICLR 2018各机构、学校论文成果大排名

在论文数量上,谷歌毫无疑问稳坐第一,CMU、伯克利、斯坦福等大学均位列其后。在前十名中,有四名是公司,六名是大学。

机构论文接收率排名(仍然保留提交数量大于三篇的机构)

df_inst[df_inst.nb_paper > 3].sort_values(['acceptance_rate'],ascending=False).head(10)

ICLR 2018各机构、学校论文成果大排名

而在各机构的论文接收率中,英伟达却胜出,以0.82的接受率成为第一,而却不见之前大量提交论文的公司的身影。

各机构论文总体情况条形图

df_inst[df_inst.nb_poster > 1][['nb_poster','nb_reject','nb_oral','nb_workshop']].sort_values(by='nb_poster').plot.bar(figsize=(15,10),legend=True,fontsize=15,stacked=True)

<matplotlib.axes._subplots.AxesSubplot at 0x7f60e4bbecc0>

ICLR 2018各机构、学校论文成果大排名

各机构接收论文数量条形图

df_inst[df_inst.nb_poster > 1].nb_poster.sort_values().plot.bar(figsize=(15,10),legend=False,fontsize=20)

<matplotlib.axes._subplots.AxesSubplot at 0x7f60e420e7b8>

ICLR 2018各机构、学校论文成果大排名

各国接收论文数量排名

df_country.sort_values(['nb_poster','nb_oral','nb_workshop'],ascending=False).head(10)

ICLR 2018各机构、学校论文成果大排名

com代表机构,edu代表学校。在这里,中国(cn)位列第九。

各国提交论文数量排名

df_country.sort_values(['nb_paper'],ascending=False).head(10)

ICLR 2018各机构、学校论文成果大排名

各国论文接收率排名

df_country[df_country.nb_paper > 5].sort_values(['acceptance_rate'],ascending=False).head(10)

ICLR 2018各机构、学校论文成果大排名

接收率是上述两表的结合,可以看出,虽然中国在论文提交数量上足够多,但是被接收的论文却不多。

各国论文总体情况条形图

df_country[df_country.nb_poster > 1][['nb_poster','nb_reject','nb_oral','nb_workshop']].sort_values(by='nb_poster').plot.bar(figsize=(15,10),legend=True,fontsize=15,stacked=True)

<matplotlib.axes._subplots.AxesSubplot at 0x7f60e401b358>

ICLR 2018各机构、学校论文成果大排名

各国接受论文数量条形图

df_country[df_country.nb_paper >1].nb_paper.sort_values().plot.bar(figsize=(15,10),legend=False,fontsize=25)

<matplotlib.axes._subplots.AxesSubplot at 0x7f60e438b4a8>

ICLR 2018各机构、学校论文成果大排名

原文地址:webia.lip6.fr/~pajot/dataviz.html#Average-score-of-the-papers,-for-each-type-of-decision

机器人网原创文章,未经授权禁止转载。详情见转载须知

本文来自机器人之家,如若转载,请注明出处:https://www.jqr.com/article/000007
爆料投稿,欢迎投递至邮箱:service@jqr.com
推荐阅读

最新评论(0

暂无回帖,快来抢沙发吧

评论

游客
robot
发布需求
联系客服联系客服
robot
联系客服