期刊简介

               本刊由卫生部主管,中华预防医学会和天津市卫生防病中心联合主办。于1984年创刊,是环境卫生学专业的学术性期刊(中华预防医学会环境卫生分会唯一认定期刊)。杂志编辑委员会由国内著名的环境卫生学及相关学科的专家、教授组成。本刊报道宗旨是:以预防医学与环境科学相结合,紧密围绕党和国家的卫生工作方针,全方位促进全国各地环境卫生工作水平的提高。主要读者对象:环境卫生、环境医学、环境保护专业工作者,各大专院校卫生学和环境科学的师生等。主要栏目:述评、专题报告、论著、调查研究、技术与方法、监督监测、专业信息、工作交流、卫生标准、综述、讲座等                

首页>环境与健康杂志
  • 杂志名称:环境与健康杂志
  • 主管单位:中华人民共和国卫生部
  • 主办单位:中华预防医学会,天津市疾病预防控制中心
  • 国际刊号:1001-5914
  • 国内刊号:12-1095/R
  • 出版周期:
期刊荣誉:中华预防医学会系列杂志优秀期刊期刊收录:
环境与健康杂志2014年第04期

大规模数据清理的相关问题与探讨

杜艳君;陈晨;李湉湉

关键词:环境与健康, 大规模数据, 数据清理
摘要:随着工业化进程的推进,我国的环境污染问题日益显现,环境污染对居民健康造成了一定程度的影响[1-3],因此环境与健康工作有待广泛和深入地开展,然而伴随着信息化时代的到来,环境与健康工作面临着新的挑战,当前的环境与健康工作已不再是简单地基于几个或者几十个实验室数据的分析结果,而是需要大规模监测和调查数据作为支撑,许多大规模监测网络和调查研究不断涌现,如全国城市空气质量实时发布平台[4]、全国空气污染(雾霾)人群健康影响监测网络[5]和全国农村饮用水水质卫生监测网络[6]等,这些大规模的监测和调查通常会由多个实施机构共同参与完成,存在数据质量参差不齐、数据录入不规范、存在缺失值和异常值及逻辑错误等数据质量问题,因此如何甄别大规模数据的数据质量并大程度地保证数据的可用性,已成为当前环境与健康工作的新挑战.数据质量是分析结果的重要保障,数据质量的高低严重影响分析结果的科学性和准确性,笔者就一些大规模数据清理经验进行论述.