贝叶斯推理的影响因素

: bluemichael 这家伙很懒，还没有设置简介...

0 人点赞了该文章 · 92 浏览

贝叶斯推理的影响因素

　　1.问题内容

　　贝叶斯推理问题总是通过某种具体事例来进行表述的。Kahneman和Amos Tversky认为，被试在概率推理中使用了代表性启发式(representativeness heuristics)，他们进行推断所依据的是问题内容中特征对事件的代表性程度而不是贝叶斯规则删。按照他们的理论，在前述的乳腺癌问题中，由于阳性的检查结果很大程度上代表了有病的信息，所以被试在判断中忽略了问题的基础概率，而主要根据击中率信息进行推理。Gavanski等同所提出的自然抽样空间(natural sample spaces)理论认为，被试的判断错误不在于忽略了基础概率，而是把后验概率P(H/D)表征为了击中率P(D/H)，因为从事件H (患有乳腺癌)中抽取特征D (检查呈阳性)的取样方式更为自然。或者说，事件是原因，特征是结果，从原因到结果的取样方向才更符合人类的思维习惯。事件与特征之间的因果关系或代表性程度都是由问题的内容所决定，因此可以认为这两种理论都是从问题内容角度来解释贝叶斯推理中的认知错觉的。后来的一些研究者虽然也使用了不同内容的贝叶斯问题，但主要是考察它们的平均效应，很少考虑到问题内容对贝叶斯推理的影响。

　　Girotto和Gonzalez(2001)在他们的研究中使用了疾病问题、入学问题等贝叶斯推理任务，他们发现被试在这两类问题上的推理成绩并没有表现出显著差异，即贝叶斯推理问题不存在内容效应(efect of content)。但有研究者认为，人们对入学考试和医学检查的结果都比较信赖，因此，以考试结果预测录取率和以检查结果预测患病率一样具有权威性，仍然可以用代表性启发法进行推断。研究者自行编制了“作家问题”，将贝叶斯问题中的事件与特征换成了作家和影迷。影迷与作家之问并不像阳性与疾病之间那样存在着关联，因此不能用代表性启发法进行推断。他们将作家问题与疾病问题进行对比研究，发现在同样的基础概率、击中率和误报率条件下，人们对作家问题的概率估计值显著低于疾病问题，并由此得出结论：贝叶斯推理中存在着内容效应。

　　近年来，随着社会认知研究的兴起，越来越多的研究开始关注“热”认知的过程。张向阳等(2006)设计不同内容的问题研究了情绪、动机等因素对贝叶斯推理的影响。他们采用2(事件性质：积极事件/消极事件) ×2(事件与主体的关系：与主体有关/与主体无关)的混合设计进行实验，其中事件性质为被试内因素，事件与主体关系为被试间因素。研究发现被试对于消极事件的概率估计值显著低于积极事件，对与己有关的消极事件的概率估计值显著低于与己无关的消极事件。

　　由此可见，问题内容会导致被试在认知、情绪和动机等方面产生一定的倾向性，从而在不同程度上影响贝叶斯推理的结果。这与主观概率的支持理论是一致的，该理论认为：人类在不确定条件下的概率判断不符合外延性原则(extensionality principle)而是表现出描述依赖性，即对同一外延事件的不同描述所做出的主观概率不同。

　　2.信息格式

　　信息格式(information format)指的是贝叶斯推理问题中概率数据的形式，包括数据的类型及其相互关系。早期研究中采用的数据大都是百分数形式，Gigerenzer和Hoffrage(1995)指出，从进化论角度来说，人类祖先在其进化环境中所遇到的信息形式是自然频数(natural irequencies)格式而不是近代才出现的概率和百分数形式，被试在某些问题中犯推理错误并不说明人类不能按照贝叶斯规则进行推理，而是由于问题的信息格式与人类的认知算法规则不一致造成的。他们用自然频数的信息格式，对乳腺癌问题中的概率信息进行如下表述：每1000名妇女中有10名患有乳腺癌(对应于1%的基础概率)。在患有乳腺癌的10名妇女中，有8名妇女胸透片呈阳性(对应于80%的击中率)。未患乳腺癌的990妇女中，有95名胸透片呈阳性(对应于9.6%的误报率)。研究发现：在自然频率形式条件下，46%的判断符合贝叶斯定理，而概率条件下只有16%的判断符合贝叶斯定理。因此他们认为，采用自然频数的信息格式可以帮助人们在无需刻意指导的情况下按照贝叶斯规则进行推断。Cosmides和Tooby(1996)同意Gigerenzer和Hoffrage的生态与进化观点，并通过进一步的研究支持了他们的理论{“1。Sedlmeier等(2001)也认为自然频数格式更符合人类的信息表征方式，他们采用相应的“频数树”(Frequency Tree)方法对人们的贝叶斯推理能力进行训练，并认为该方法可以使人们更快的学会使用贝叶斯推理规则，其效果优于“概率树”(Probability Tree)训练法。

　　Lewis和Keren(1999)认为，自然频数格式下的乳腺癌问题改变了两个因素：一是，数据形式由概率变为频数；二是，信息取样方式由条件式(conditiona1)变为结合式(joint)。他们提出了条件式频数的信息表征方式：每1000名妇女中有10名患有乳腺癌(对应于1%的基础概率)。在患有乳腺癌的妇女中，每1000人中有800名妇女胸透片呈阳性(对应于80%的击中率)。未患乳腺癌的妇女中，每1000人有96人胸透片呈阳性(对应于9.6%的误报率)。研究发现，被试在该条件下的正确率为4%，显著低于结合式频率(即自然频率)条件下的30%。因此他们认为被试成绩的提高不是因为数据形式由概率变为了频数，而是信息由条件式变为了结合式。Mellers和McGraw (1999)则认为，频数和结合式都可以改进贝叶斯推理，哪种条件占优势取决于事件的性质。频数格式比概率格式更有利于人们对稀有事件的理解，此类问题中，频数格式更容易提高被试的成绩；结合式有助于人们建立适宜的心理模型(mental models)，一般性事件中，他的优势会更加明显。

　　Fiedler等(2000)也对Gigerenzer和Hoffrage的研究提出质疑，他们认为自然频数格式一方面将数据形式由概率变为频数，另一方面也将参照尺度(reference scale)由不一致变为了一致。自然频数格式中，所有信息都是来自同一个1000人的样本，有着一致的参照尺度，数据之间可以进行直接的比较和计算，因此推理显得容易。他们通过实验研究发现，无论哪一种数据形式，只要参照尺度一致，被试进行推理的成绩都比较好。由此同样证明了频数并不是成绩提高的关键。

　　Girotto和Gonzalez(2001)认为是提问形式和信息结构共同影响了推理成绩。自然频数的表述中，不仅是将概率数据变成了频率数据，而且还将提问形式由一步变成了两步(...人中有...人)，将信息结构由未分割数据变为了分割数据(partitioned data)。所谓分割结构数据就是将1000分割为了10和990两部分，又从10中分割出8，从990中分割出95。他们通过实验考察了提问形式、信息结构以及数据类型等因素，结果发现，无论在概率还是频数格式下，两步提问的贝叶斯推理的成绩优于单步提问的成绩，具有分割的信息结构的问题成绩优于不具有分割信结构的问题。

　　以上关于贝叶斯推理的信息格式的研究和争议最初是源于Gigerenzer和Hofrage提出的自然频数理论。但后来的研究者似乎误解了他们的原意，主要是在“频数”上作争论，而忽视了“自然”的意义。Gigerenzer和Hofrage强调，他们所说的频数并非任意形式下的频数，而是通过自然取样获得的自然频数。因为自然频数携带了有关基础比率的信息，所以简化了贝叶斯计算。很显然，他们所说的“自然频数”就是Lewis和Kere所说的“结合式频数”、Fiedler等所说的“一致性参照尺度下的频数” 以及Girotto和Gonzalez所说的“分割结构的频数”。这些研究者都同意，该方式下推理会变得简单。但频数是否能起到作用呢?Gigerenzer和Hofrage不同意其他研究者的观点，他们通过考察“结合式频数”和“结合式概率”两种条件，发现前者的成绩明显好于后者。但Fiedler等(2000)的研究表明，这两种条件下，被试成绩的差异是不显著的，这可能与两种研究使用了不同的表述方式有关。总的来说，信息格式中所包括的数据类型和结构都会对贝叶斯推理的成绩产生影响，其中后者的作用更为明显。

　　3.信息呈现方式

　　大多数有关贝叶斯推理的研究中，概率信息都是以整理好的百分数或自然数的形式直接呈现给被试的，但也有的研究中采用另一种信息呈现方式，得到了一些不同的结果。Fiedler等(2000)将乳腺癌问题中的患病信息和诊断信息分别在卡片的正反两面先后呈现给被试，让他们根据其中一种信息搜索另一种信息。例如，先在电脑上呈现患病信息，被试点击后反馈诊断信息。研究发现，被试根据诊断信息搜索患病信息时，判断的准确性更高，且与相反条件下差异显著。李晓明等(2004)模拟人们平时获得信息的情景对贝叶斯推理问题进行了研究，他们将患病信息和诊断信息以样例的方式逐个呈现给被试，例如，其中一个样例为“体检者1号，化验结果：阴性；诊断结果：没有甲病”，依此类推。测试阶段为“体检者11号，化验结果：阳性；诊断结果：请你判断该人实际患有甲病的概率有多大?” 研究发现被试在该条件下的成绩优于概率信息集中呈现条件下的成绩，但是比频率集中呈现条件下的成绩差。一般将这种让被试在实验中通过经历事件过程主动收集信息的研究范式叫做经验范式，而将直接在实验中向被试提供概率信息的方式称为文本范式。不同的信息呈现方式会影响信息的获取与加工方式，从而影响推理的过程与结果。

　　4.个体因素

　　除了问题本身的内容、信息格式和呈现方式等因素之外，推理者的知识、经验以及思维方式等因素也会影响贝叶斯推理问题的解决。张向阳等(2006)认为，医务人员之所以对人患病的概率作出高估，可能正是他们的医学经验在起作用。另一方面，如果被试具备相关的概率知识，则可能会促进贝叶斯推理问题的解决。研究者以被试的知识背景为自变量，用专家(有概率知识的数学系大学生)和新手(无概率知识的其他系大学生)进行对比实验。研究表明：在贝叶斯推理中，专家的概率知识背景有助于他们运用贝叶斯规则进行推理，概率估计准确性明显好于新手。这一结论与史滋福等(2006)的研究结果有所不同，他们以数学系和中文系的大学生为被试进行实验，发现两者之问概率估计的准确性没有显著差异。研究者认为，文理科被试之间并不存在所谓的思维类型不同而导致复杂概率推理成绩差异的现象。傅小兰等(2005)在考察不同信息表征方式对贝叶斯推理的影响时发现，中外被试在某些条件下的表现不同甚至相反。在Girott0和GonZalez的研究中，被试解决两步问题的成绩总是优于解决一步问题的成绩。而傅小兰等的研究却表明：对于中国被试而言，两步问题形式并不能改进他们解决贝叶斯推理问题的成绩，甚至在某些情况下还会干扰他们做出正确的回答。研究者认为，这可能在一定程度上反映了东西方人的不同思维风格和特点：对西方人而言，分析性的思维操作有助于他们顺利解决贝叶斯推理问题，而中国被试面对贝叶斯推理问题时则更倾向于整体性解决，因此，他们解决两步问题与解决一步问题的成绩之间没有出现显著差别，甚至解决一步问题的表现可能还会更好一些。另外，问题提问信息格式对中国被试解决贝叶斯推理问题也有影响，与概率格式相比，频数格式可以显著改善两步问题的贝叶斯推理成绩。这也与Girotto和Gonzalez的研究结果也不一致。后者的研究结果表明，问题提问的信息格式不影响被试解决贝叶斯推理问题的成绩。研究者认为，这可能也是由于东西方人思维方式的差异造成的。

贝叶斯推理的影响因素

bluemichael 这家伙很懒，还没有设置简介...

免责声明:

推荐内容