ARXIV数学论文分布:偏微分方程最热门!

发布时间:2016-12-27 15:20:56来源:本站原创

笔者对数据分析、计算机等方面很感兴趣,近日兴致来了,想做一下自己的专业和数据挖掘相结合的研究,所以就爬取了ARXIV上面近几年(2010年到2014年)的数学论文(包含的数据有:标题、分类、年份、月份),想对这几年来数学的“行情”做一下简单的分析。笔者认为,ARVIX作为目前全球最大的论文预印本的电子数据库,对它的数据进行分析,所得到的结论是能够具有一定的代表性的。

当然,本文只是用来练手爬虫和基本数据分析的文章,并没有挖掘出特别有价值的信息。原文中有笔者爬取到的数据,供有兴趣的读者进一步分析研究。

整体情况

这几年来,ARXIV的数学论文总数为135009篇,平均每年27000篇,或者每天74篇。

就分类来看,文章数排名前十五的分类是:

S表1.png

这个表某种意义上代表了数学各个方向的热门程度。首先排名第一的是偏微分方程,它跟第四的数学物理多少有点联系,两者基本都代表了偏微分方程的应用,尤其是它在物理、生物等各种领域的应用。排名第二的是概率论,由于我们的世界中几乎任意现象都带有随机性,自然也带动了这个方向的发展,因此概率论的热门也是合乎常理的。排名第三是组合数学,它是离散数学的代表。第五是信息理论,它应该是最近几年数据挖掘发展的结果。后面是代数几何、数论、微分几何、动力学系统、泛函分析、数值分析、最优化控制等,这些应该都是数学中比较前沿和热门的领域。

然后,笔者把标题分拆,看看哪些词在标题上出现最多。结果很容易想到,最多的是of,and,the,for,in,with,a,on这些没什么特别意义的停用词,把这些停用词去掉之后,得到的结果是:

equations(5172), groups(4782), spaces(4531), systems(4422), random(3980), functions(3906), quantum(3817), equation(3720), algebras(3686), theory(3459), graphs(3437), probl em(3337), finite(3275), model(3216), solutions(3097), theorem(3014), operators(2880), li near(2718), generalized(2622), type(2579), group(2565), space(2402), manifolds(2363), a nalysis(2315), stochastic(2278), problems(2235), models(2161), surfaces(2156), applicatio ns(2060), nonlinear(2017), approach(1961), local(1930), polynomials(1922), method(191 9), fields(1886), differential(1882), new(1874), optimal(1869), function(1854), boundary(1789), number(1768), sets(1766), curves(1751)

第一个equations,和第八个equation,估计就对应着分类中的偏微分方程,而且接着是groups(群论), spaces(空间)等,估计是代表了目前数学研究的主流方法,即把研究对象放到某个空间之中,结合泛函分析和抽象代数(尤其是群论)进行研究。有意思的是,quantum(量子)一词也排在前面,这应该表明了以量子理论为背景数学研究也如火如荼。其他方面读者可以自己评价。

逐年变化

看完了整体情况,我们可以来看逐年变化,首先逐年文章变化,每年的文章数都在增加:

S1.png 

然后,我们来看五年来,文章数目最多的五个类别,看看哪些领域在逐步变得热门起来。

2010数学物理(1619)概率论(1437)代数几何(1358)PDEs分析(1319)组合数学(1297)

2011数学物理(1809)概率论(1671)组合数学(1605)PDEs分析(1545)代数几何(1414)

2012数学物理(2005)PDEs分析(1319)组合数学(1826)概率论(1824)信息理论(1616)

2013PDEs分析(2211)概率论(2027)组合数学(2020)信息理论(1958)数学物理(1773)

2014PDEs分析(2464)组合数学(2189)概率论(2105)信息理论(2008)数学物理(1646)

可以看到,前三年数学物理这一方向的论文数稳居第一,而后两年,在论文总数增加的情况下,数学物理的论文数却有着较大幅度的下降,这似乎表明在数学物理方向似乎遇到了瓶颈?而相反,逐年增加并且慢慢提升到第一位的是PDEs分析,这表明偏微分方程组的研究一直是当代数学研究的主流领域。

看看哪些类别增速最快?下面挑了一下笔者认为比较具有代表性的。

第一个是Systems and Control (cs.SY),系统与控制,这五年的论文数依次为9,96,112,139,135;跟这个有点相关的,是Optimization and Control (math.OC),最优化与控制,五年的论文数依次为423,545,778,980,1289

然后,我们来看五年来,文章数目最多的五个类别,看看哪些领域在逐步变得热门起来。

2010 数学物理(1619) 概率论(1437) 代数几何(1358) PDEs分析(1319) 组合数学(1297) 2011 数学物理(1809) 概率论(1671) 组合数学(1605) PDEs分析(1545) 代数几何(1414) 2012 数学物理(2005) PDEs分析(1319) 组合数学(1826) 概率论(1824) 信息理论(1616) 2013 PDEs分析(2211) 概率论(2027) 组合数学(2020) 信息理论(1958) 数学物理(1773) 2014 PDEs分析(2464) 组合数学(2189) 概率论(2105) 信息理论(2008) 数学物理(1646)

可以看到,前三年数学物理这一方向的论文数稳居第一,而后两年,在论文总数增加的情况下,数学物理的论文数却有着较大幅度的下降,这似乎表明在数学物理方向似乎遇到了瓶颈?而相反,逐年增加并且慢慢提升到第一位的是PDEs分析,这表明偏微分方程组的研究一直是当代数学研究的主流领域。

看看哪些类别增速最快?下面挑了一下笔者认为比较具有代表性的。

第一个是Systems and Control (cs.SY),系统与控制,这五年的论文数依次为9,96,112,139,135;跟这个有点相关的,是Optimization and Control (math.OC),最优化与控制,五年的论文数依次为423,545,778,980,1289

此外,数值分析也越来越热门,它的论文数逐年增加,增幅算是比较大的,五年的论文数依次为435,571,778,1012,1262。这些条件表明,数学与计算机的结合是数学发展的主流趋势之一。能反映这个趋势的类别还有Computational Physics (physics.comp-ph)、Computational Geometry (cs.CG)、Computer Vision and Pattern Recognition (cs.CV)等。  

笔者简单使用了一个指标来衡量一个分类的增幅速度: 

S6.png

首先声明,这个指标非常简单,而且不一定准确,仅作感性认知所用,由此指标所筛选出来的增幅速度最大的分类依次如下表。有意思的是,其中不少领域都跟计算机有些联系,我认为,这不是一个巧合。

S表2.png

公众号
返回
顶部
请关注“官方公众号”
Copyright © 2013-2017   广州泰迪智能科技有限公司   技术支持   粤ICP备14098620号