该死,GPT 5.4终于可以帮助定位一个非常隐蔽的内存泄漏问题,而Claude和5.3-codex都在幻觉中认为存在不存在的问题。 我主要在Codex中使用计划模式,要求创建长时间运行的脚本,以模拟应用程序使用情况,怀疑内存泄漏发生在这里,并输出正确数量的日志,以便GPT 5.4可以从这里进行调试。 当我没有明确告诉它在哪里并且不让它触碰其他部分时,它仍然试图修复其他东西,但它变得非常令人印象深刻且节省时间。 顺便说一下,Codex应用程序真的是工程师的最佳选择,因为你可以像与其他工程师在Github上工作一样评论差异,这样代码审查就容易得多,可以从那里继续。