登陆注册
15501500000034

第34章 学会资料的分组与编码

一、资料的分组

市场调查资料的分组,就是根据市场调查的需要,按照一定的标志,将调查总体划分为若干个组成部分的资料整理方法。通过分组,使得同一组内的各单位在分组标志上具有同质性,不同组之间的单位具有差异性。因此,通过分组可以区分市场现象的类型;反映市场现象总体的内部结构;分析市场现象之间的依存关系。

(一)分组标志的选择

对市场调查资料分组的关键在于正确地选择分组标志。分组标志就是进行分组的标准或依据。分组标志选择是否正确,是资料分组能否发挥其作用的基本前提。分组标志一旦确定,在整理中就会突出单位在该标志下的差异,而掩盖了单位在其他方面的不同。因此,同一调查总体由于选择的分组标志不同,得出的认识结论也会有所不同,甚至是相反的结论。为此,在进行分组时应遵循以下原则选择分组标志:

1.依照调查目的选择分组标志

对同一调查对象的总体,由于调查目的不同,需要采用不同的分组标志。例如,在调查某地区的消费品零售市场时,如果调查的目的在于分析某种商品的市场供应结构,分组时应当采用该种消费品的生产厂商或品牌作为分组标志;如果调查目的在于分析该种商品的消费结构,分组标志应当选择居民的户型或收入水平等。根据不同的调查目的,选择合适的分组标志,才能使分组资料更好地满足调查的需要。

2.依据反映现象本质特征选择分组标志

反映事物差异的标志很多,分组时应当抓住反映其最具本质区别的关键性标志作为分组标志。例如,在调查投资规模效益时,对简单劳动密集型企业的规模分组标志应当选用职工人数;对资金密集型企业的规模分组标志应当选用固定资产原值等。

要调查某城镇的家庭收入状况,需要选择分组标志,现提供两种不同的分组标志。

第一种分组标志是按每户月收入划分的,第二种分组标志是按每户平均每人的月收入划分的。两种分组标志的选择方法不同,可能出现不同的结果,哪种更能反映家庭收入水平的本质特征呢?

第一种分组标志的选择方法,只能看出每户的收入,但每户的家庭成员数量是不同的,也许800元以下这组有的家庭人口数只有1人,而1600元以上这组有的家庭人口数有6人,那么平均到每人的收入只有267元,故这种方法不能反映事物的本质特征,而第二种按每户平均每人收入的分组方法就合理多了。

3.结合现象所处的历史条件和经济状况选择分组标志

事物都处于不断的发展和变化之中,在不同阶段调查对象所表现出的性质和特征都会有所不同。因此,在进行分组时,必须用动态的观点选择分组标志。这一点在研究历史资料、进行时间序列分析和预测中需要特别注意。例如,原来调查工业企业规模时,一般以职工人数为分组标志,把企业规模分为大、中、小型三类。随着机械化、自动化水平的提高,这种分类方法已经不科学,因为有些机械化、自动化水平较高的企业,虽然规模很大,但职工人数却较少。因此,一般使用生产能力和固定资产作为分组标志。而调查乡镇企业的生产规模时,由于多是劳动密集型企业,生产的产品不固定,生产能力很难计算,因此,以职工人数作为企业规模的分组标志简便易行。此外,在将调查资料与历史资料进行对比时,应注意可比性问题。尤其在改变分组标志时,必须注意选择与历史资料可比的分组标志。

(二)资料分组的方法

根据资料分组标志的不同,对资料的分组可以是品质标志分组和数量标志分组。

1.品质标志分组

如果资料的度量尺度是定类尺度或定序尺度,这些资料反映的是调查对象的性质或品质,在对各单位分组时采用按品质标志分组,例如,按照企业进行产品宣传的媒体标志分组,划分为招贴、报纸杂志、广播、电视、互联网等;居民按文化程度标志分组,划分为大学及大学以上、高中、初中、小学、文盲和半文盲等。

2.数量标志分组

如果资料的度量尺度是定距尺度或定比尺度,这些资料反映的是调查对象的数量特征,它们在不同的单位的取值具有可变性,通常称为变量。在对这些资料分组时采用数量标志分组,也称变量分组。例如,研究居民的生活水平,按照居民家庭的恩格尔系数这一标志,把恩格尔系数在60%以上的居民家庭归为贫困家庭;在50%~60%的家庭归为温饱家庭;在40%~50%的家庭归为小康家庭;在40%以下的家庭归为富裕家庭。又如,儿童按年龄分组分为:不满1岁、1~2岁、3~4岁、5~9岁、10~14岁。

(三)资料分组的形式

资料分组按照所用的分组标志的多少及组合形式的不同,可以分为简单分组、复合分组和分组体系。

1.简单分组

如果调查目的只是为了反映总体在某一方面的情况,可采用简单分组。简单分组中所使用的分组标志只有一个。例如,家庭按人均居住面积分组分为:4平方米以下、4~14平方米、14平方米以上,这样的分组就是简单分组。

2.复合分组

如果要反映总体的多个方面的情况,又需要知道这些方面相互交错形成的复杂情况,就需要采用复合分组。复合分组是将总体按照两个或两个以上分组标志相结合进行的资料分组,即首先按照一个标志分组,然后在已划分的各组内按照另一个分组标志或几个分组标志再进行细分组。

现对某地区居民家庭居住面积进行调查,对居民家庭首先按照居住地的性质分为城市家庭和农村家庭2组,再把城市家庭和农村家庭分别按照人均居住面积分为4平方米以下、4~14平方米、14平方米以上3组,形成2个粗分组和6个细分组,共8个组。分组结果如下所示:

城市家庭

人均居住4平方米以下

人均居住4~14平方米

人均居住14平方米以上

农村家庭

人均居住4平方米以下

人均居住4~14平方米

人均居住14平方米以上

用复合分组时,分组单位一般不超过两个,否则分组的结果将显得杂乱不清。

3.分组体系

如果采用资料分组的方法,目的在于从不同角度、不同方面对同一调查对象进行分项说明,使人们对事物的认识有一个全面的总体印象,可采用分组体系。分组体系采用一系列相互联系、相互补充的并列分组标志对总体进行分类。分组体系的分组方式采用罗列式分组,因而各个分组之间不存在交叉层叠,随着分组标志数量增加分组的表现效果会更好。

二、资料的编码

编码是对调查所得资料进行计算机录入的前提,又是使用计算机对资料进行整理的手段。编码一词,既可以理解为名词,也可以理解为动词。作为名词的编码,表面上指的是一套数码符号,实质上应理解为对资料进行确认、记录和分组的一套规则。作为动词的编码,则是指设计这样一套规则,并且按照规则把以文字形式记录的资料转化成数码符号形式的资料的全部过程。编码与分组有密切的关系。只有选择和确定了分组标志和相应的标志表现,才可以为每一种标志表现指定数值符号。而当完成了编码的数码转换工作,并将这些数码输入到计算机存储器内形成资料文件后,计算机的资料整理软件即可对所输入的数据进行分组和汇总工作。

A公司调查某部门20名职工的性别、年龄、月收入以及年终业务考核成绩的数据。如果想用计算机处理这套资料,就必须把表中所载资料转换成数码符号形式的数据。为此,可以规定这样一套规则:

职工编号――按原数码形式;

性别――“男”以“1”表示,“女”以“2”表示;

年龄――按原数码形式;

月收入――原数码形式去掉小数点;

考核成绩――“优”以“1”表示,“良”以“2”表示,“中”以“3”表示,“及格”以“4”表示,“不及格”以“5”表示。

再按这套规则将表载资料转换成数码符号,列入之中。

(一)预编码

一般来说,调查问卷中的多数问题都是封闭性的,预先已经设计出可供选择的答案。有时,为了方便计算机处理,在设计问卷时就预先给这些答案设计了编码,这种编码方式称为预编码。对于大型问卷调查来说,由于调查的范围、对象、所调查的内容、问题形式等都比较复杂,为了便于统一处理,一般会对某些问题答案进行预编码。预编码印在问卷每页的右侧,用竖线将其与问题及答案隔开。例如,一份人力资源基本信息调查的问卷中问题与相应的编码安排。

此外还有另一种预编码方式,即在问卷之外另行制作登录卡。登录卡是一个空白的数码矩阵,编码员根据编码说明书的编码方案将问卷所载的答案转化成数码填入适当的矩阵单元内,经过审核后,计算机就可以直接读取数码了。

(二)后编码

后编码是整理开放式问题答案并对其进行编码的有效方法。开放式问题的提出,是补充封闭式问题的不足,为深入追问被调查者对待特定问题的一些深层次看法而设计的。因为,调查设计者事先对问题不可能预见到所有可能的答案,无法在问卷中给出数目不太多,又能互斥、穷举的一组供选择答案。对这类问题所给的答案进行编码时,首先要阅读部分(最好是全部)答案,记录和分析出包括多少类别,这些类别应该是相互独立的和穷尽所有可能的,然后对这些类别编码。

对开放式问题的答案进行整理和编码,不是机械性的作业。它所依据的不应该仅是答案的文字,更重要的是这些文字所能反映出来的被调查者的思想、认识和心理。如何将从各种角度、依据不同标准给出的叙述性和评论性文字答案,整理出按同一尺度计量的单一系列答案编码是对开放式问题的答案进行整理和编码工作的难点。正因为这种编码只能是在对答案进行整理归纳之后进行,所以叫做后编码。

后编码可以按下列步骤进行:

(1)挑选少量具有代表性的问卷,对答案进行全面的阅读和初步分类,以便初步判断答案的分布状况。通常会抽取全部问卷数的20%来实施这一步工作。

(2)将所有有效的答案列成频数分布表。

(3)拟定适宜的分组数。要从调查的目的出发,考虑分组的标准是否能确实符合调查的目的;同时也要考虑计算机的处理能力和数据处理软件的处理要求。

(4)根据拟定的分组数,对列在答案频数分布表中的答案进行选择和归并。在不影响调查目的的前提下,保留频数多的答案,然后把频数分布较少的答案尽可能归并成意义相近的几组。对那些含义相距甚远,或者虽然含义相近但合起来频数仍然不够多的,一律并入“其他”一组。

(5)为所确定的分组选择正式的组别标志。

(6)根据分组结果为数据制订编码规则。

(7)对全部回收问卷(开放式问题答案)进行编码。

(三)编码说明书

编码说明书是一份说明问卷中各个问题(即变量)及其答案与数据文件中的编码值之间一一对应关系的文件。在制订编码说明书时,要注意以下几个问题:

(1)所有的资料都必须转换成数值,不允许使用字母或其他字符。

(2)使编码的内容保持一致性,通常的操作技巧是,用固定的数字顺序表示回答项的次序。例如,对所有测量等级、程序内容的项目答案,都以从小到大的原则分派编码。例如,“1”表示最不喜欢;“2”表示不太喜欢;“3”表示喜欢等。

(3)每一个数值码占据一列。要为每个变量留出足够的码位。

(4)对无信息的答案赋予标准代码。例如,可以用“0”表示“不知道”;“9”表示“无回答”;“0”表示“不适合”。

(5)尽可能用真实的数字作为编码,例如,对于年龄、分数、收入等在调查时获得的数据,在编码时,就以原数据作为编码。如“59”岁,编码就为“59”;“98”分,编码就为“98”;“2000”元,编码就为“2000”。这样可以保持数据库的原始资料性质。

总之,制订编码方案是组建数据库关键的一步,其质量决定着今后计算机处理的效率和速度。要依据编码方案,编制出编码说明书,以准确的语言和清晰的格式说明每一个问题、每一种回答的编码是什么,含义是什么。

同类推荐
  • 指导学生心理健康的经典故事:点燃生命中的春天

    指导学生心理健康的经典故事:点燃生命中的春天

    每个人都在梦想着成功,但每个人心中的成功都不一样,是鲜花和掌声,是众人羡慕的眼神,还是存折上不断累积的财富?其实,无论是哪一种成功,真正需要的都是一种健康的心理。有了健康的心理才是成功的前提与保证,在人的一生中,中学是极其重要的一个阶段,心理健康对以后的健康成长非常重要。
  • 美国TOP60文理学院逐一点评

    美国TOP60文理学院逐一点评

    本书对于中国留学生来说,美国大学前60名的文理学院备受关注。本书逐一介绍学校的概况、专业和课程设置、申请事宜及留学花费,特别是张旭老师收集到的中国学生申请该校最多的几个主要专业,并对学校做出了个性化的点评,针对中国学生的实际及各学校的特点逐一点评,帮助不同情况的学生都能找到适合自己的学校。
  • 新课标课外快乐阅读丛书——快乐心灵的名胜故事

    新课标课外快乐阅读丛书——快乐心灵的名胜故事

    快乐阅读,陶冶心灵,这对于提高广大中小学生的阅读写作能力,培养语文素养,促进终身学习等都具有深远的意义。现代中小学生不能只局限于校园和课本,应该广开视野,广长见识,广泛了解博大的世界和社会,不断增加丰富的现代社会知识和世界信息,才能有所精神准备,才能迅速地长大,将来才能够自由地翱翔于世界的蓝天。
  • 攻克7大学习问题的145个好方法

    攻克7大学习问题的145个好方法

    学习成绩总是提高不了怎么办?学过的东西总是记不住怎么办?考试总是发慌考不好怎么办?家长想正确指导孩子学习该怎么办?……本书共分五部分,分别针对学习中常见的七类问题——学习兴趣、阅读习惯、听课效率、学习习惯、学习方法、记忆力、应付考试,为大家提供了一些行之有效的方法。
  • 师恩之情动天

    师恩之情动天

    人生匆匆,岁月涛涛,总有一份份感动在我们心灵留下倒影,总有一种情愫让人回味无穷,使我们或感觉人生的美好,或感觉希望的永恒,这就是我们生命的光华。让我们采撷心灵感动的倒影,编织美好心灵的花环,让我们永远生活在温馨的心灵花园吧!心灵是我们的生命之场,演绎着我们人生的酸甜苦辣,只要我们细细品味,就会触摸到真实的内心世界,就会走到心灵之河的彼岸。让我们坚守心灵的真实吧!这样我们才会感觉到人生的深刻内涵;让我们获得心灵的小憩吧!这样我们才会收获那份沉静的感动。
热门推荐
  • 全植大领主

    全植大领主

    不周山有一先天葫芦藤,结有先天七葫芦,赤橙黄绿青蓝紫各一个,三清圣人,红云老祖,女娲,陆压道君和鸿钧老祖各取其一。鸿钧老祖的是蓝色葫芦,置放于紫霄宫,镇压人族气运。叶植在机缘巧合之下,跟蓝色葫芦的灵智融合,让蓝色葫芦重新复苏,他也成为了所有葫芦复苏的希望。为此,作为老大的九九散魂葫芦,将叶植送到异界去成长。肩负拯救兄弟重任的叶植,首先要做的就是让自己成长起来,而他做的第一步,就是培养自己的小弟,壮大自己的势力。那你能告诉我,为什么你身后有那么的妹子吗?说出来你可能不信,她们都是我种出来的,想当初我只是播一下种而已,结果却收获了一大堆的妹子。咦,这句话好像有些不对劲的地方?
  • 极品特种兵在都市

    极品特种兵在都市

    李沐辰一个久经战场的特种兵,曾经杀人无数,却被派来保护美女总裁。看他如何惹的美女投怀送抱,在金都城打出属于自己的地盘。
  • 太古狩猎

    太古狩猎

    狩猎太古魔兽狩猎大陆强者狩猎美女这种生物!
  • 我所祈求的明天

    我所祈求的明天

    故事始于遥远的移民星球:尼翁。在进化波的干扰下,尼翁的生物迅速变异,成为了高度进化的屠戮机器。人类在与异形的战争中失利,沦陷了整个北半球,而剩下的人类则蜷缩在了世界的一角,彻底沦为难民。在这样的绝境中,青年巅佩自愿成为了“监察官”,一项专司研究并屠杀异形的可怕工作。而他的战友则是手段高超的星光灿和元气满满的凝,三人协同作战,并在一步一步的探索中,挖掘到了异形的真相......以战火星球为主调,一场沉重的生存之战就此打响。
  • 废女轻狂之妖娆异世

    废女轻狂之妖娆异世

    夙府长相丑陋、性格懦弱、经脉封闭的废物大小姐,不甘凌辱而死,再睁眼,灵魂已是现代古武世家的天才继承人……(本故事纯属虚构,如有雷同,纯属巧合,切勿模仿。)(本人是第一次写小说,写的不好的话,请见谅啊~~)
  • 人生不必太计较

    人生不必太计较

    本书告诉读者一个工作顺利、事业有成的人,不是因为运气多好,而是因为他很少计较。因此无论在生活还是工作中,都不应斤斤计较。这样你的人生才会更潇洒、更舒畅。
  • 丑妃无敌:本王就要你

    丑妃无敌:本王就要你

    一场意外穿越,她的归来,注定了她不平凡人生!她从一个绝世丑女变成他的独爱!【情节虚构,请勿模仿】
  • 午夜情缘:陆少的神秘恋人

    午夜情缘:陆少的神秘恋人

    午夜敲门声响,英俊的男人拿出了一叠钞票蛮横地入住了下来。暖身,暖心,什么?还要暖床!“我丢了一样很重要的东西。”夜半时分,男人神情哀伤,仿佛天塌下来一般,“我爱的那个人喜欢上了别人。”嘁,原来高高在上的陆少爷是为情所困。她无所谓,微微笑着:“陆少爷,只要你拿钱给我,想听多少句‘爱’,我都说给你听。”话音落,陆少爷更加哀伤了,搂着她直接吻了过去:“丫头,你为什么就不明白。我爱你啊,我真的好爱好爱你。”知道,知道,陆少爷千里迢迢来找她不就是因为那一份情吗。可是陆少爷,你又知道吗,比起嫁给你,我果然还是更加愿意成为随便敲诈你的小情人。
  • 妃你莫属:废材也疯狂

    妃你莫属:废材也疯狂

    赶潮流穿越了,傲天大陆,一个以武为尊的大陆!颜氏家族废材三小姐,老爹不疼,后娘不爱,更是被姐姐陷害不慎掉进河里。被救上来以后,再次睁开眼睛她已经不是她原来的颜九卿已死,她既然能在她的身上复活就要让那些欺凌过的她的人血债血还!且看废材如何逆转玩转异世,一统天下!
  • 追梦锐雯心

    追梦锐雯心

    他以为他将这样度过一生,他以为他始终只是个衰小孩。但是,一封来自【阿瑞斯学院】的录取通知书改变了他。