AI 到底什么时候能真正"干活",而不是光"聊天"?
有个说法叫"长周期任务",说人话就是你扔一个目标给它,不用一步步教,它自己就能规划、试错、调整,连干几小时甚至几天,最后把结果交到你手上。
这才是 AI 真正提高生产力的地方。
你看哈,以前我们比模型好坏,看的是给它一句话答得漂不漂亮。但现实中干活的时候,答得好不好当然重要,但能不能稳得住会更重要。
比如找安全漏洞这事,得先啃一堆代码,理解系统怎么运行的,再构造攻击,一遍遍试,失败了换思路,成功了还得验证。整个过程没人告诉你哪条路对,全靠自己摸索。
这种活,现在的 AI 已经可以干了。连续跑几个小时、上千步操作不用人管。你只要把需求讲清楚,它自己就把整个模块开发、测试、部署全包了。
想想还挺感慨的。以前我们说 AI 是工具,工具嘛,总得有人拿起来用。现在的问题是,它好像不需要你拿了。
