《社会调查数据管理——基于Stata 14管理CGSS数据》一1.2 数据管理内容不清

    xiaoxiao2024-03-29  13

    本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第1章,第1.2节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看

    1.2 数据管理内容不清

    数据管理不被重视,原因很多,其中一个最重要的缘由当属数据管理的工作内容不清。数据管理,乍一听起来,好像知道是什么,但是真要动手做起来,就有些找不着北。特别是对社会调查数据来说,数据管理的界限更是一个让人头疼的问题。

    数据管理,简单地说,在社会调查中,凡是和数据有关的工作都属于数据管理的范畴,除此之外,当社会调查数据收集完成后,数据的录入、清洗、保存、存档、发布等也都是数据管理的重要组成部分。根据工作时间,可以把社会调查数据管理分为三个阶段:数据收集前的管理工作、数据收集过程中的管理工作和数据收集后的管理工作。

    当前,国内的数据管理做得非常浅,尤其是数据收集前的数据管理几乎无人问津,理所当然地认为这个阶段没有和数据有关的工作。实际上,撇开这个阶段的问卷设计和抽样设计等和数据管理息息有关的工作,单是编码手册的制定,就是任何一项数据管理的重中之重,它会直接影响到问卷设计、样本设计、数据采集、数据录入、数据清理。通常,数据收集后的管理阶段是很多人认为的数据管理,即便如此,这个阶段的工作也做得马马虎虎,很多社会调查项目都忽视了这个阶段的数据清理工作,以为把数据录入计算机后,得到的电子版数据能直接用于统计分析和学术研究,忽略了数据中多变量间的逻辑模式检验、对缺失值模式的设计、删除敏感信息/识别信息等。没有经过这些管理的数据,大多数都是糟糕的数据,不仅不利于学术研究和社会研究,而且有可能使研究结果产生误导性,甚至是灾难性的影响。

    相关资源:敏捷开发V1.0.pptx
    最新回复(0)