登陆注册
15501500000034

第34章 学会资料的分组与编码

一、资料的分组

市场调查资料的分组,就是根据市场调查的需要,按照一定的标志,将调查总体划分为若干个组成部分的资料整理方法。通过分组,使得同一组内的各单位在分组标志上具有同质性,不同组之间的单位具有差异性。因此,通过分组可以区分市场现象的类型;反映市场现象总体的内部结构;分析市场现象之间的依存关系。

(一)分组标志的选择

对市场调查资料分组的关键在于正确地选择分组标志。分组标志就是进行分组的标准或依据。分组标志选择是否正确,是资料分组能否发挥其作用的基本前提。分组标志一旦确定,在整理中就会突出单位在该标志下的差异,而掩盖了单位在其他方面的不同。因此,同一调查总体由于选择的分组标志不同,得出的认识结论也会有所不同,甚至是相反的结论。为此,在进行分组时应遵循以下原则选择分组标志:

1.依照调查目的选择分组标志

对同一调查对象的总体,由于调查目的不同,需要采用不同的分组标志。例如,在调查某地区的消费品零售市场时,如果调查的目的在于分析某种商品的市场供应结构,分组时应当采用该种消费品的生产厂商或品牌作为分组标志;如果调查目的在于分析该种商品的消费结构,分组标志应当选择居民的户型或收入水平等。根据不同的调查目的,选择合适的分组标志,才能使分组资料更好地满足调查的需要。

2.依据反映现象本质特征选择分组标志

反映事物差异的标志很多,分组时应当抓住反映其最具本质区别的关键性标志作为分组标志。例如,在调查投资规模效益时,对简单劳动密集型企业的规模分组标志应当选用职工人数;对资金密集型企业的规模分组标志应当选用固定资产原值等。

要调查某城镇的家庭收入状况,需要选择分组标志,现提供两种不同的分组标志。

第一种分组标志是按每户月收入划分的,第二种分组标志是按每户平均每人的月收入划分的。两种分组标志的选择方法不同,可能出现不同的结果,哪种更能反映家庭收入水平的本质特征呢?

第一种分组标志的选择方法,只能看出每户的收入,但每户的家庭成员数量是不同的,也许800元以下这组有的家庭人口数只有1人,而1600元以上这组有的家庭人口数有6人,那么平均到每人的收入只有267元,故这种方法不能反映事物的本质特征,而第二种按每户平均每人收入的分组方法就合理多了。

3.结合现象所处的历史条件和经济状况选择分组标志

事物都处于不断的发展和变化之中,在不同阶段调查对象所表现出的性质和特征都会有所不同。因此,在进行分组时,必须用动态的观点选择分组标志。这一点在研究历史资料、进行时间序列分析和预测中需要特别注意。例如,原来调查工业企业规模时,一般以职工人数为分组标志,把企业规模分为大、中、小型三类。随着机械化、自动化水平的提高,这种分类方法已经不科学,因为有些机械化、自动化水平较高的企业,虽然规模很大,但职工人数却较少。因此,一般使用生产能力和固定资产作为分组标志。而调查乡镇企业的生产规模时,由于多是劳动密集型企业,生产的产品不固定,生产能力很难计算,因此,以职工人数作为企业规模的分组标志简便易行。此外,在将调查资料与历史资料进行对比时,应注意可比性问题。尤其在改变分组标志时,必须注意选择与历史资料可比的分组标志。

(二)资料分组的方法

根据资料分组标志的不同,对资料的分组可以是品质标志分组和数量标志分组。

1.品质标志分组

如果资料的度量尺度是定类尺度或定序尺度,这些资料反映的是调查对象的性质或品质,在对各单位分组时采用按品质标志分组,例如,按照企业进行产品宣传的媒体标志分组,划分为招贴、报纸杂志、广播、电视、互联网等;居民按文化程度标志分组,划分为大学及大学以上、高中、初中、小学、文盲和半文盲等。

2.数量标志分组

如果资料的度量尺度是定距尺度或定比尺度,这些资料反映的是调查对象的数量特征,它们在不同的单位的取值具有可变性,通常称为变量。在对这些资料分组时采用数量标志分组,也称变量分组。例如,研究居民的生活水平,按照居民家庭的恩格尔系数这一标志,把恩格尔系数在60%以上的居民家庭归为贫困家庭;在50%~60%的家庭归为温饱家庭;在40%~50%的家庭归为小康家庭;在40%以下的家庭归为富裕家庭。又如,儿童按年龄分组分为:不满1岁、1~2岁、3~4岁、5~9岁、10~14岁。

(三)资料分组的形式

资料分组按照所用的分组标志的多少及组合形式的不同,可以分为简单分组、复合分组和分组体系。

1.简单分组

如果调查目的只是为了反映总体在某一方面的情况,可采用简单分组。简单分组中所使用的分组标志只有一个。例如,家庭按人均居住面积分组分为:4平方米以下、4~14平方米、14平方米以上,这样的分组就是简单分组。

2.复合分组

如果要反映总体的多个方面的情况,又需要知道这些方面相互交错形成的复杂情况,就需要采用复合分组。复合分组是将总体按照两个或两个以上分组标志相结合进行的资料分组,即首先按照一个标志分组,然后在已划分的各组内按照另一个分组标志或几个分组标志再进行细分组。

现对某地区居民家庭居住面积进行调查,对居民家庭首先按照居住地的性质分为城市家庭和农村家庭2组,再把城市家庭和农村家庭分别按照人均居住面积分为4平方米以下、4~14平方米、14平方米以上3组,形成2个粗分组和6个细分组,共8个组。分组结果如下所示:

城市家庭

人均居住4平方米以下

人均居住4~14平方米

人均居住14平方米以上

农村家庭

人均居住4平方米以下

人均居住4~14平方米

人均居住14平方米以上

用复合分组时,分组单位一般不超过两个,否则分组的结果将显得杂乱不清。

3.分组体系

如果采用资料分组的方法,目的在于从不同角度、不同方面对同一调查对象进行分项说明,使人们对事物的认识有一个全面的总体印象,可采用分组体系。分组体系采用一系列相互联系、相互补充的并列分组标志对总体进行分类。分组体系的分组方式采用罗列式分组,因而各个分组之间不存在交叉层叠,随着分组标志数量增加分组的表现效果会更好。

二、资料的编码

编码是对调查所得资料进行计算机录入的前提,又是使用计算机对资料进行整理的手段。编码一词,既可以理解为名词,也可以理解为动词。作为名词的编码,表面上指的是一套数码符号,实质上应理解为对资料进行确认、记录和分组的一套规则。作为动词的编码,则是指设计这样一套规则,并且按照规则把以文字形式记录的资料转化成数码符号形式的资料的全部过程。编码与分组有密切的关系。只有选择和确定了分组标志和相应的标志表现,才可以为每一种标志表现指定数值符号。而当完成了编码的数码转换工作,并将这些数码输入到计算机存储器内形成资料文件后,计算机的资料整理软件即可对所输入的数据进行分组和汇总工作。

A公司调查某部门20名职工的性别、年龄、月收入以及年终业务考核成绩的数据。如果想用计算机处理这套资料,就必须把表中所载资料转换成数码符号形式的数据。为此,可以规定这样一套规则:

职工编号――按原数码形式;

性别――“男”以“1”表示,“女”以“2”表示;

年龄――按原数码形式;

月收入――原数码形式去掉小数点;

考核成绩――“优”以“1”表示,“良”以“2”表示,“中”以“3”表示,“及格”以“4”表示,“不及格”以“5”表示。

再按这套规则将表载资料转换成数码符号,列入之中。

(一)预编码

一般来说,调查问卷中的多数问题都是封闭性的,预先已经设计出可供选择的答案。有时,为了方便计算机处理,在设计问卷时就预先给这些答案设计了编码,这种编码方式称为预编码。对于大型问卷调查来说,由于调查的范围、对象、所调查的内容、问题形式等都比较复杂,为了便于统一处理,一般会对某些问题答案进行预编码。预编码印在问卷每页的右侧,用竖线将其与问题及答案隔开。例如,一份人力资源基本信息调查的问卷中问题与相应的编码安排。

此外还有另一种预编码方式,即在问卷之外另行制作登录卡。登录卡是一个空白的数码矩阵,编码员根据编码说明书的编码方案将问卷所载的答案转化成数码填入适当的矩阵单元内,经过审核后,计算机就可以直接读取数码了。

(二)后编码

后编码是整理开放式问题答案并对其进行编码的有效方法。开放式问题的提出,是补充封闭式问题的不足,为深入追问被调查者对待特定问题的一些深层次看法而设计的。因为,调查设计者事先对问题不可能预见到所有可能的答案,无法在问卷中给出数目不太多,又能互斥、穷举的一组供选择答案。对这类问题所给的答案进行编码时,首先要阅读部分(最好是全部)答案,记录和分析出包括多少类别,这些类别应该是相互独立的和穷尽所有可能的,然后对这些类别编码。

对开放式问题的答案进行整理和编码,不是机械性的作业。它所依据的不应该仅是答案的文字,更重要的是这些文字所能反映出来的被调查者的思想、认识和心理。如何将从各种角度、依据不同标准给出的叙述性和评论性文字答案,整理出按同一尺度计量的单一系列答案编码是对开放式问题的答案进行整理和编码工作的难点。正因为这种编码只能是在对答案进行整理归纳之后进行,所以叫做后编码。

后编码可以按下列步骤进行:

(1)挑选少量具有代表性的问卷,对答案进行全面的阅读和初步分类,以便初步判断答案的分布状况。通常会抽取全部问卷数的20%来实施这一步工作。

(2)将所有有效的答案列成频数分布表。

(3)拟定适宜的分组数。要从调查的目的出发,考虑分组的标准是否能确实符合调查的目的;同时也要考虑计算机的处理能力和数据处理软件的处理要求。

(4)根据拟定的分组数,对列在答案频数分布表中的答案进行选择和归并。在不影响调查目的的前提下,保留频数多的答案,然后把频数分布较少的答案尽可能归并成意义相近的几组。对那些含义相距甚远,或者虽然含义相近但合起来频数仍然不够多的,一律并入“其他”一组。

(5)为所确定的分组选择正式的组别标志。

(6)根据分组结果为数据制订编码规则。

(7)对全部回收问卷(开放式问题答案)进行编码。

(三)编码说明书

编码说明书是一份说明问卷中各个问题(即变量)及其答案与数据文件中的编码值之间一一对应关系的文件。在制订编码说明书时,要注意以下几个问题:

(1)所有的资料都必须转换成数值,不允许使用字母或其他字符。

(2)使编码的内容保持一致性,通常的操作技巧是,用固定的数字顺序表示回答项的次序。例如,对所有测量等级、程序内容的项目答案,都以从小到大的原则分派编码。例如,“1”表示最不喜欢;“2”表示不太喜欢;“3”表示喜欢等。

(3)每一个数值码占据一列。要为每个变量留出足够的码位。

(4)对无信息的答案赋予标准代码。例如,可以用“0”表示“不知道”;“9”表示“无回答”;“0”表示“不适合”。

(5)尽可能用真实的数字作为编码,例如,对于年龄、分数、收入等在调查时获得的数据,在编码时,就以原数据作为编码。如“59”岁,编码就为“59”;“98”分,编码就为“98”;“2000”元,编码就为“2000”。这样可以保持数据库的原始资料性质。

总之,制订编码方案是组建数据库关键的一步,其质量决定着今后计算机处理的效率和速度。要依据编码方案,编制出编码说明书,以准确的语言和清晰的格式说明每一个问题、每一种回答的编码是什么,含义是什么。

同类推荐
  • 感动中学生的精品美文:常怀感恩之心

    感动中学生的精品美文:常怀感恩之心

    本书精选以感谢父爱、母爱等为主题的,适合中学生阅读的精品美文。情动你我,爱让天地广阔如许;美在瞬间,乐得人生感动多多。赏读精品美文,拾取久违的感动,体悟百味人生,感受成长的快乐。本书中精选的美文,让你拓宽阅读视野,提高写作水平。
  • 阅读中华国粹-青少年应该知道的-漆器

    阅读中华国粹-青少年应该知道的-漆器

    从河姆渡新石器时代的朱漆木碗,到楚汉漆文化的繁荣,直至明清达到顶峰,中国可谓世界上最早用漆制作器物的国家,并将漆艺绵延传承,走过了7000年漫长而辉煌的历程,为世人塑立了一座丰富而又绚丽的漆工艺殿堂。
  • 法制教育一年级(上)

    法制教育一年级(上)

    青少年的健康成长离不开法律青少年是祖国的未来,民族的希望,党和国家历来重视对青少年的教育、引导和保护,并为青少年的健康成长创造良好的条件和环境;青少年正处于长身体、长知识的重要时期,各方面都很不成熟,缺乏自我保护意识和能力;由于社会环境复杂,存在着不利于青少年健康成长的因素,青少年合法权益和身心健康受到侵害的现象时有发生。
  • 61个故事学会高效做题

    61个故事学会高效做题

    在中小学的学习中,写作业做习题直接关系到学生对于课堂知识的消化吸收和理解运用,本书通过61个故事生动地介绍了做题时应该具备的心态、方法和思维技巧,让中小学生在趣味阅读的同时,轻松掌握必要的做题方法,养成良好的做题习惯,让学习的效率最大化,使成绩在短时间内得到提升。
  • 解密失踪事件

    解密失踪事件

    本书介绍了神秘失踪的百余孩童、格兰特将军号失踪案、沙漠里失踪的部落、来自空中的呼救、消失醉汉的救援声、他失踪了半小时、隐形的日本男人、神秘失踪的公交车等内容。
热门推荐
  • 唯念伊人

    唯念伊人

    从相遇到相知,从相爱到相濡以沫,我们蹉跎了太多时光,若说人生是一场旅行,那么我愿意与你相携从日出到星辰,从朝阳到晚霞,这些话我不知道在心里默念了多少次,可是我怎能让你知道?——薛亦枫我费尽心思给你这下一封情书,可是到头来我发现我是多么胆小,以至于我连给你的勇气都没有——莫笙北他们一直爱着,只是两个人都有自己的骄傲,谁先表白,谁就输了一切,只是两只…胆小鬼青梅竹马,HE
  • 明伦汇编人事典讳忌部

    明伦汇编人事典讳忌部

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 抽到幸福,寒少的爱很霸道

    抽到幸福,寒少的爱很霸道

    本书属于【半宠文】她,在一次偶然的机会里,竟然嫁给了威霆市的首富!本以为会有一个幸福、美满的家庭,可是现实是非常残酷的。她嫁人之后,就没有见过她的丈夫几面。可是,在之后发生的事中,他们的感情越来越好。后来,他们还是在一起了,并且拥有了一个幸福、美满的家。希望大家多多支持,谢谢。
  • 透视高手

    透视高手

    影视城中的龙套李凡,被神庙中的泥塑砸中,险些丧命,却意外获得了神秘的宝瞳异能……能透视,能观看万物灵光磁场,甚至通过物品窥测曾经发生的‘过去记忆’,从此屌丝人生逆袭。众美纷至沓来;珍稀宝石,甚至深海宝藏,都统统收获囊中!
  • 嚣张小萌妻

    嚣张小萌妻

    简易凌遭男友背后劈腿,想买酒醉一回,没想到竟偶遇“牛郎”?跟“牛郎”生米煮成熟饭也就算了。可他的身份好像不一般?前男友的大哥?喂,这么算来,她可以报“劈腿”之仇,成为前男友的大嫂了!“签约吧!”没听说过结婚还要先签约,不过这吃抹干净之后,想毁约?没门!“没听说过街头小霸王?”她简易凌可不是那么好惹的!左手擒情儿,右手打SPY,暴力女闯关成功。大Boss,乖乖束手就擒,跟我回家暖被窝吧!
  • 烈焰王者

    烈焰王者

    本书停止更新,抱歉
  • 大乘百法明门论开宗义决

    大乘百法明门论开宗义决

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 尼克斯教父

    尼克斯教父

    你想过将球队的总经理,主教练和当家球星一肩挑吗,克里斯·多兰就做到了。在纽约,他的名字比帕特里克·尤因更加让人熟知。在NBA,他创立了尼克斯王朝。作为一个穿越过来的富二代,和好莱坞美女没有交集怎么行。
  • 隋末弃少

    隋末弃少

    魂穿隋末成为望族弃少,受尽嘲讽与冷落,仅有一间破败酒楼为生,穷则变,变则通,通则久,八大菜系与满汉全席等接连上市,轰动长安.......乱世将临,一帮兄弟誓死相随,主角将于李渊、李世民等十八路反王争夺天下,都说英雄难过美人关,李秀宁,兰陵公主,长孙无忧等等美女又会与主角演绎多少儿女情长……
  • 重生的烈火冰姬

    重生的烈火冰姬

    席火炎穿越到乾隆年间,误闯部落圣地,险些遇难,被江南“无敌庄”庄主欧阳月夜解救。然而却失去了记忆,摇身一变成了这个冷酷的男人的大嫂,那个花天酒地、不学无术、腿瘸丑容,整日泡在药罐子里的男人的夫人!当她以为这完全是命运的安排时,却发现那个邪恶的男人竟然是……