乔山办公网我们一直在努力
您的位置:乔山办公网 > excel表格制作 > excel标准差-如何做标准误差图--SCI论文写作技能第2篇

excel标准差-如何做标准误差图--SCI论文写作技能第2篇

作者:乔山办公网日期:

返回目录:excel表格制作

作者:吴志根,博士,Papergoing创始人,毕业于帝国理工大学和浙江大学,专业分享英文论文写作与发表的知识和动态。






本文是科研论文技能第二篇:如何制作标准误差图。本文将通过名词解释、例子说明和作图步骤,使大家全面了解和学习如何制作标准误差图。笔者希望尽量用简单语言和例子去说明,否则大家又要被统计学的专业术语搞晕了!


在笔者的博士科研训练中,有一项重要的内容就是“如何在论文中合理地展示数据?”。在毕业后的SCI论文发表、审稿和工作中,笔者逐步加深对数据的认识,并且发现了很多英文论文中一些展示数据不合理的现象-只给出数据的平均值而不给出平均值的标准误差。在这篇短文中,笔者将讨论标准误差的必要性和展示方法。


论文中的“标准误差图”

首先通过展示在发表的论文中,用平均值+标准误差(Standard Error)的图形例子,让大家获得直观感受。图1来自于日本学者Fujisawa等人在《生命科学》期刊上最新发表的一篇论文 (1)。每个数据点都是通过平均值+标准误差来表示(见红圈和红色箭头)。



图1:Fujisawa等人论文中的图1A (1)


为什么不用平均值+标准差?

平均值代表一组样本数据的平均含义,在科研论文中,基本上都要求作者直观地表示出来。但是光有样本的平均值还不够,因为平均值只是代表了这组样本的数值平均值(纯代数计算值),而不知道这组数据个体间的离散程度,比如样本[1, 2]的平均值是1.5,样本[1.4,1.6]的平均值也是1.5,但是两组数据代表的意义却不一样,前一组数据的离散程度明显大于第二组数据,因此从离散性角度判断,第二组测量/调查数据要优于第一组数据。


既然标准差(Standard Deviation)可以表示数据的离散程度,那么在国际SCI论文中,为什么大家没有用平均值+标准差的形式来表示数据呢?


原因在于:通过标准差,我们无法知道样本的平均值是否可靠,即无法知道样本的平均值是否接近总体样本真实的平均值。虽然标准差代表着某组样本数据之间的离散程度(内部关系),但是无法跟总体样本之间的其它数据发生关系(外部关系)。即在样本数小的数据组里,得出的标准差有可能和样本数大的数据组一样!如果这时候,平均值和真实的总体样本的平均值相差很大,那么就会被误以为这组数据有代表性。比如,上面例子中平均值是1.5,如果总体样本的平均值是10,但是两组样本的标准差一样(离散程度可能完全一样),那么只测量/调查了2个样本而得到的平均值1.5就带来了相对非常大的误差。


推荐使用平均值+标准误差

在这里,笔者推荐使用的平均值+标准误差的方法。为了说明问题,笔者生成了一组假想数据(图2中的实圆点),其中,总体样本数量=30,每个样本序号为1-30,测量值从1到9。



图2,本文分析的数据


通过分析在不同的样本大小下,我们可以得到图2中数据的平均值、标准差和标准误差的变化,结果如表1所示。


表1 图1中数据分析结果



可以看出,随着样本数量逐渐增加,平均值逐渐靠近总体样本的平均值5.1。但是标准差并不是逐渐降低,比如,样本数量=20时,标准差反而比样本数量=10时高,这说明,在样本数量=20时,这20个数据之间的离散程度比样本数量=10时的离散程度还要大;样本数量=20和30时,标准差都是1.9,即每个样本内数据的离散程度一致。


接着我们来看标准误差。图3中显示:随着样本数量的增加,标准误差在逐渐降低,反映了这样的事实:随着样本数量的增加,样本平均值越来越靠近总体样本的平均值。即某组数据的标准误差越小,由这组数据计算得到的平均值就越有代表性和真实性,用样本的统计量去推断总体参数的可靠度就越大。



图3,标准误差和样本大小关系


标准误差制作方法

笔者通过“Microsoft® Office For Mac”中的Excel来简单说明制作方法:


  1. 计算在每个样本数据的标准差,其命令为:stdev(number1,number2,...);


  2. 计算得到相应的标准误差,命令为:stdev(number1,number2,...)/sqrt(n),即标准差除以样本数量的平方根。


  3. 选中图形(即本文中在没有画出标准误差的图3中),进入Chart Design,找到Add Chart Element, 在其下拉菜单中,找到Error Bars,进入More Error Bars Options, 在右侧的Vertical Error Bar中,点击Custom (Specify Value),在跳出的方框中,让Positive Error Value和Negative Error Value都选中计算出的标准误差。


  4. 如果有出现横向的标准误差,删除它们即可。最后,就出现了图3所示的带有标准误差的数据分析结果。


最后祝大家新春快乐,欢迎分享给您的同事,如想交流请通过微信联系我本人,请注明名字和单位,非诚勿扰,谢谢。



也许您对下面我的其它文章也感兴趣:


如何写高质量的SCI论文摘要--SCI论文写作内容第1篇


如何做双边对比图--SCI论文写作技能第1篇


想写好学术论文,远离以下十点



参考文献


  1. H.Fujisawa, etc. 2017, Life Sciences, 171:39-44.


注明:本文为笔者原创文章,受版权保护,转载请联系本人,谢谢。


相关阅读

  • excel标准差-找到数据中的异常值

  • 乔山办公网excel表格制作
  • 偏离了原来数据的变化轨迹,就可以视为异常值。判断业务异常值的标准大致有以下几个。(1)特别大(小)如果在业务值中出现了特别大或特别小的值,那么就可以认为是异常值。什
关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网