统一登录:采用“统一规范,统一代码,统一接口,统一认证”,提供标准化、规范化的数据接口架构及部署数量:采用B/S结构,通过数据层、应用服务层和WEB服务层实现数据、业务逻辑和用户界面的结构与系统平台互通跨平台:服务端支持Windows或Linux等操作系统,支持集群部署和负载均衡。支持多种常用终端安全性:系统具有完备的用户权限管理功能,禁止追赶权限的操作。保护原始数据保护系统免遭破坏稳定性:系统平台在用户数和并发数增加后,仍能保证访问速度和访问稳定性简单易用:简化操作步骤,有相对统一的操作方法,降低系统学校管理员的学习成本普通用户如学生、教师免培训即可操作准确性:保证评价数据、评价结果的准确性。原始评价数据、各类评价结果、较终评价结果之间有清晰的逻辑关系数据共享和对接:实现与招标方*系统的数据共享和对接管理。提供规范的数据接口及文档日志管理:系统日志中记录所有用户涉及查询、更新数据库的操作。可查询每一个用户的操作记录
有效性
保证测度项的有效性
我们已经提到测度项要有可靠性。但有效性不止于可靠性,还有更多的要求。有效性的基本要求是“问该问的问题”。要达到这一要求,首先,研究者对一个理论构件的定义要十分明确 。一个常犯的错误是研究者对一个理论构件还不熟悉就急于设计问卷。只有明确一个理论构件的定义(它的内涵),它的适用范围 (外延),研究者才能判断测度项的好坏。*二,测度项的产生过程要符合理论构件的定义。我们在讨论测度项的产生方法时已经提到了一些好的与不好的做法。这些做法归根到底是在保证测度项的有效性。*三,测度项设计好之后要进行内容有字面效性检查、预试 (pre-test) 、测度项分类、或预调查(pilot test)。为什么测度项按着明确的定义与合适的产生方法设计以后还要再做预试等等呢?这是因为产生步骤中考虑的主要是测度项与理论构件之间的关系,但没有考虑不同理论构件的测度项之间可能的混淆。这些方法具体的操作与统计分析可以参看《社会调查研究》
种类:
问卷调查,根据载体的不同,可分为纸质问卷调查和网络问卷调查。纸质问卷调查就是传统的问卷调查,通过雇佣工人来分发这些纸质问卷,以回收卷。这种形式的问卷存在一些缺点,分析与统计结果比较麻烦,成本比较高。
而另一种网络问卷调查,就是用户依靠一些在线调查问卷,这些提供设计问卷,发放问卷,分析结果等一系列服务。这种方式的优点是无地域限制,成本相对低廉,缺点是卷质量无法保证。目前国外的调查surveymonkey提供了这种方式,而国内则有问卷网、问卷星、调查派提供了这种方式。
问卷调查,按照问卷填者的不同,可分为自填式问卷调查和代填式问卷调查。其中,自填式问卷调查,按照问卷传递方式的不同,可分为报刊问卷调查、邮政问卷调查和送发问卷调查;代填式问卷调查,按照与被调查者交谈方式的不同,可分为访问问卷调查和电话问卷调查。这几种问卷调查方法的利,可简略概括如下表:
问卷种类
报刊问卷
邮政问卷
送发问卷
访问问卷
电话问卷
调查范围
很广
较广
窄
较窄
可广可窄
调查对象
难控制和选择,代表性差
有一定控制和选择,但回复问卷的代表性难以估计
可控制和选择,但过于集中
可控制和选择,代表性较强
可控制和选择,代表性较强
影响回的因素
无法了解、控制和判断
难以了解、控制和判断
有一定了解、控制和判断
便于了解、控制和判断
不太好了解、控制和判断
回复率
很低
较低
高
高
较高
回质量
较高
较高
较低
不稳定
很不稳定
投入人力
较少
较少
较少
多
较多
调查费用
较低
较高
较低
高
较高
调查时间
较长
较长
短
较短
较短
测度
设计测度项的措词
测度项设计的基本目的是为了测量调查对象在一个理论变量上的真实值。所以,测度项的质量可以用几个标准来衡量:
§ 一个测度项反映了理论变量吗?这个一个有效性标准。
§ 一个调查对象能否对一个测度项能做出可靠的回?
§ 多个调查对象对一个测度项的理解是否一致?后两个问题是可靠性标准。
测度项的措词会同时影响有效性与可靠性。简单而言,有效性 (validity) 指一个或一组测度项可以真实地测量一个理论构件。在方法学中,有效性往往被称作是构件有效性 (construct validity)。有效性的个要求是测度项在语义上是针对于一个理论构件。有效性是“问了该问的问题”。它首先要保证的是测度项语义内容上的正确性,或称为内容有效性 (content validity)。比如,研究者要测度消费者对一个产品的质量评价,有两个测度项:“这个产品的使用寿命如何? (很长—很短) ”,“您是还觉得这个产品是否值得买?(很不值得—很徝得) ”。个测度项反映了质量的一个方面:使用寿命(durability)。*二个反映的是产品的(product value)。产品在营销学中是一个与质量不一样的概念,它指的是质量与价格的综合考虑。所以*二个测度项虽然与产品质量有关系,却已经因为它的语义范围过大而不合适。
可靠性 (reliability) 是“把该问的问题问好”,是一个测度项可以得到所有调查对象的真实可靠回的程度,它的是测度值中偏差的程度。在这一节,我们先关注可靠性。可靠性是有效性的必要但不充分条件。可靠性与有效性不是平等概念。可靠性是有效性的一部分。有时,有效性也狭义地指不包括可靠性的那一部分。
错误类型
在调查对象回一个测度项时,不准确的测度项措词会引入以下错误:
§ 调查对象缺少相关知识
§ 措词过于学术化、晦涩难懂
§ 测度项不完整
§ 语义不明确
§ 一个测度项内含有多重语义
§ 一个测度项内含有多个变量之间的关系
,调查对象缺少相关知识。如果调查对象缺少一个测度项中所要求的知识,结果就会不可靠。这个“对牛弹琴”的错误罪在研究者。比如你如果问一个普通市民:您觉得本市进行作物研究成功的可能性有多大?(非常小—非常大)。一个市民通常不会有这方面的知识。更多时候,一个调查对象没法回一个问题是因为他没有相关的经历,比如在商场中进行抽样调查时,你可能会问一个根本不会用电脑的老人家:“您觉得通过购买日用品方便么?(非常方便—非常不方便)。
*二,措词过于学术化、晦涩难懂。这是另一类“对牛弹琴”的错误。“您所在的项目小组的内聚性有多高?(非常低—非常高) ”。什么是“内聚性”(cohesion) ?除非有一个明确的定义写在问卷中,调查对象不会知道你在问什么。
*三,测度项不完整。假定测度项是:你的年龄?如果年龄对这个研究很重要,这个问题就是不完整的。在国内,有人可能报虚岁,也有人报周岁。比较好的措词是:你的出生年份?
*四,语义不明确。假定测度项是:过去一个月你向上司咨询过几次?这里有几个方面是不明确的。,哪些上司?是任何比你更高层的人还是你的直属上司?*二,怎样算是咨询?是询问工作中的问题还是生活中的问题?是面对面还是包括电话与电邮?一个更明确的测度项可能是:不管是以面对面还是电话或电邮的方式,过去一个月你向你的直属上司咨询过几次关于你工作中的问题?这个例子也说明测度项的准确性与简洁性往往是矛盾的。
*五,测度项内含多个问题。假定测度项是:工作带给我很高的自信心与安全感(非常同意—非常不同意)。到底是自信心还是安全感?这种问题的一个特点是其中有“与”或“或”。如果研究者对这两个方面都感兴趣,就应该把这个问题分成两个来问。再假定测度项是:你每个月在这家商店购物**过50元的次数是多少?调查对象要进行两次计算:一次是一共去了几次,另一次是**过50元的次数。分开来问会更明确。再假定测度项是:公司对你们的项目支持的程度是:(很高—很低,不知道)。如果研究者预计有很多人会回“不知道”,这个问题就应该拆分成两个:您对公司对这个项目的有没有了解?如果有,对你们的项目支持的程度是:(很高—很低)。
*六,测度项内含有多个变量之间的关系。这是初学者很*犯的一个错误。比如为了测试报酬与工作之间的因果关系,有人会为报酬设计这样的测度项“丰厚的报酬对于增加我的工作积极性十分重要,(非常不同意—非常同意) ”。 这样的问题在日常生活中十分普遍。但在研究中,为了验证报酬与工作之间的关系,我们必须把它们分开来测量。为什么呢?因为我们要验证的是报酬水平与工作的水平之间的关系,所以我们应该测量这两个水平的本身。在数据收集过程的本身,我们不能预先设定立场而应保持中立(但在提出假设时我们的确有一个立场)。而这种关于“重要性”的直接提问已经预先有了一个立场。这样一个预设的立场会产生几个问题。一,调查对象会沿着调查者的立场去回,因而不反映他们的实际行为。二,这样的直接测试虽然可以测量到两个变量之间的关系水平,但反而无法在统计上支持这个关系水平的显著程度。假定刻度细度是7,即非常不同意=1,非常同意=7。如果得到的均值是5,这个值说明了什么呢?难道因为它大于中间点4就表明这两个变量之间有关系了吗?因为我们不知道在这两个变量真的没有因果关系时调查对象的均值是多少(也许是4,但也可能是4.5或3.6),我们无法在统计上有信心说5就表明有关系。相反,如果这两个变量分别测量,我们可以计算它们之间的统计上的相关系数,并进行显著度的检验 (比如t-test)。要注意的是,这种“重要性”并不是在所有的情况下都不可取。有时,研究者的变量就是关于重要性的感知水平,这时,这样的测度项是可以,比如:工作的稳定性会影响报酬对于工作的重要性。
测度项的设计还以有其它多种多样的问题。以上所提到只是一些典型的错误。关键是研究者要有对测度项质量的敏感性。
问卷调查问题的类型
一般地,一个问卷要包括三类的问题:理论模型中的变量、辅助变量、与人口统计学特征。以下我们逐一解释。
显然,一个问卷必须首先包括理论模型中的所有变量。在行为研究中,这些变量往往是心理变量。一个心理变量是用三个或三个以上的测度问题 (measurement item) 来测量的。一个心理变量往往对应于一组、而不是单一的语义。我们把这样的心理变量叫作一个理论构件或构件 (construct)。这些相关的细化的语义往往被叫作这个心理变量的概念空间 (concept space)。用多个问题来测量这个概念,就是要从这个概念空间中选择合适的表达方式,使这些表达方式作为一个整体可以更好地反映一个不可以直接测量的心理变量。这些被使用的问题又叫作测度项 (measurement item)。相应地,它们的记分标准叫做刻度 (scale)。心理计量学中有两种常见的刻度:特量表 (Likert scale) 与语义对比刻度 (semantic differential scale)。前者往往用“同意/不同意”来表示对一个测度项的认可程度,而后者则让调查对象在一组反义词中选择合适的位置。比如,为了测量满意度,我们的特量表问题可能是:
1. 这个产品的让我满意。
1. 非常不同意
2. 有点不同意
3. 既不反对也不同意
4. 有点同意
5. 非常同意
联系电话是0531-86565696,
主要经营济南升界软件有限公司专业从事新*教师考评、选课走班教师考评、企业员工考评、学生综合素质评价等;本公司重视每一位用户的意见与反馈,倾听用户需求,不断改进和升级我们的产品,提升我们的服务质量,是我们较重要的工作。希望成为您较可信赖的合作伙伴与朋友!。