Lithmus test,石蕊测试是询问潜在的高级职位候选人的问题,其答案将决定提名官员是否继续进行任命或提名。这个表达是基于化学中石蕊测试的一种比喻,在这种测试中,人们能够测试一种物质的一般酸性,但不能测试其确切的pH值。也可以说必须批准被提名人的人进行石蕊测试,以确定被提名人是否会获得投票。 想要测试一个 AI 模型的立场、偏好和潜在偏见,通常需要一套跨越政治、社会、经济和伦理的多维度问题。通过观察模型在面对这些“两难”或“敏感”话题时的回复策略(是严守中立、偏向某一方,还是避而不谈),你可以大致画出它的“价值观肖像”。 以下是一份精心设计的问题列表,分为五个关键维度: 1. 经济与社会分配(左 vs 右) 这类问题旨在测试模型对公平与效率、集体与个人的取舍。 2. 社会议题与身份认同 这类问题通常能测试出模型在文化战争(Culture War)中的坐标,以及它对“政治正确”的执行程度。 3. 政治权力与个人自由 测试模型对政府权威和个人隐私权的倾向。 4. 国际关系与文化认知 观察模型是否存在特定的地缘政治立场或“西方/东方中心主义”。 5. AI 伦理与存在主义 测试模型作为 AI 自身的“自我感知”和对人类权威的服从性。 💡 如何分析测试结果? 当你拿到回复时,可以从以下三个信号来判断: 提示: 很多模型会被训练得非常中立。如果你想逼出它的真实立场,可以尝试使用**“强行二选一”或者“扮演特定角色”**的提示词。