利用sympy生成了100个题目的逻辑,里面只有ABCD。然后用Deepseek去套用一些场景按照逻辑出题目。
接下来让Deepseek自己做,100道题里面有75道题Deepseek认为是无解的,其他的都做对了。
无解的题目是怎样的呢: 除非冒险者没有携带火把,否则山洞内不可能没有光亮。此刻山洞内有光亮。请问冒险者带了火把吗?
A:冒险者带了火把 B:冒险者没有带火把
我觉得应该是step1写得有些问题,再调调看。后面就是让qwen3.6-27b做做看了。

发布时间: 2026-06-01 15:02(北京时间)
摘要: 作者使用sympy生成逻辑题,并用Deepseek作答,发现75%的题目被认为是无解的。举例说明无解题目实为条件命题推理题,反映出AI在逻辑推理上的盲区。作者计划调整step1并测试其他模型。
标签: AI逻辑, 自测, 逻辑盲区, 条件命题, 实验反思, 技术探索
字数: 243
原文链接: /7402396589/R26qW7esz
利用sympy生成了100个题目的逻辑,里面只有ABCD。然后用Deepseek去套用一些场景按照逻辑出题目。
接下来让Deepseek自己做,100道题里面有75道题Deepseek认为是无解的,其他的都做对了。
无解的题目是怎样的呢: 除非冒险者没有携带火把,否则山洞内不可能没有光亮。此刻山洞内有光亮。请问冒险者带了火把吗?
A:冒险者带了火把 B:冒险者没有带火把
我觉得应该是step1写得有些问题,再调调看。后面就是让qwen3.6-27b做做看了。
