Gemini3的棱镜式启发与指令困境

这段时间几乎每天都有在和Gemini3对话。我觉得Gemini3在“洞察力”方面确实是比较“震惊”的。某些时刻很能理解纯银老师这篇头条微博正文里提到的那种“shock”。

虽然我不是什么“专家”，但和不同的模型聊多了也能感受到输出中的“谄媚”成分并自动忽略掉。Gemini3和GPT5.1都会“谄媚”,但剔除掉这些部分，在聊天与分析类的任务上，Gemini3能给出更意想不到的思路。不是说Gemini3“对的更多”，反而这些思路很多时候是有瑕疵、待我验证的。

而且我能感觉到Gemini3面对越专业的提问，回答的质量就越高(提问的专业度我这里没有下定义)。而GPT5.1是越专业的提问就越“谄媚”，在拓展思路这块我比较少被“shock”到。
↑这段我表达不好。可能可以把GPT5.1类比成镜子，提问专业的话照出来的也很专业，但只是在反射，熵增很低。而Gemini3可以类比成分光棱镜，总能折射出色彩，色彩没有对错，但有些颜色确实能启发到我。

但具体到整理日报这项工作，Gemini3似乎不那么遵循指令。以前用Gemini2.5来生成日报是很舒服的，换成Gemini3之后就出现各种格式错误，我认为是prompt的问题就优化了几个版本，甚至把它常见的错误都描述在prompt中都压不住。优化后的prompt我也用Gemini2.5再复判了下，可能真不是提示词的问题，Gemini2.5生成的日报质量依旧是好。