对于 AI 应用技术的一些小思考
最近三四个月,AI 应用技术的发布似乎层出不穷,当下最强烈的感受不是新模型能力体验的新鲜感,反而是增加了不少焦虑感。尤其是过年期间,几天不看手机只要一刷到,所有人的内容都是“我XX做了XX”或者“我的XX工作流让XX提升十倍”如此的吸人眼球的内容。即使是 OPENAI 和 Anthropics 的技术文章第一眼让人耳目一新的感觉,看完之后还是增加了不少空虚感。
击碎和重组思维已经是常态
去年的这个时候,多少类似“不会开发也要懂 Cursor”或者“不会 Cursor 就落后了”的言论也是层出不穷,反而那个时候,我看定了 Gemini-cli 这样的底层的和本地数据结合落地的应用,花了不少的时间去熟悉和应用,构建了简单的工作流去优化我的工作。而一年后的今天,没有人在讨论这个 Cursor 了,大家的关注点落到了类 Gemini-cli 的应用了,所以焦虑本身来自于未知,要清晰的分析和研究才是解剖焦虑的最佳方式。
Cursor 就是一个落地的工具,严格说,他和 Gemini-cli 的工具大同小异,但是很多事情的夸张发展程度,都在击碎几个月前的自己。比如一个新的强大的小模型能力可以和两年前的闭源大模型能力相媲美,这种限制的突破之前就应该思考到,未来的发展是大概怎么样的,假如真的做到了万事俱备,只欠东风的东风,现在就是想法和时间了。
在新应用横飞的现在,我认为我们还是应该关注偏底层的东西,并不是说训练,模型之类的,而是大家实际上都在解决什么问题,现在还有什么问题,这个问题在以后还是问题吗,有什么问题以后肯定一直都是问题。这才是你值得关注的地方,而不是人云亦云的“吸睛”的内容。
当前百花齐放的场面,我们需要做好击碎和重组思维,因为这可能是常态了。
不要限制自己的尝试
我歧视力大飞砖,但是目前来看,力大飞砖早就开始了。在我研究 MCP 的原理的时候,发现居然是靠 LLM 去读取和生成文本的 json 格式去调用 MCP Server,当时觉得无比丑陋和恶心,但是后面是 GEMINI.md 初始化设置也是直接注入的做法,我大约相通了,其实力大飞砖一直就存在,只是我内心为了嫌弃某个东西自己找的借口而已。以前的 token 可能和以前的流量一样,每个人都需要,每个人都会去订阅,或者每个人都不知道自己订阅了,他无处不在。现在我需要做的就是多些尝试,找到属于自己要抓住的部分,也就是前文提到的“问题”。比如我认可软件开发要 cli 化,否则没有未来,那换句话说是不是把当前的软件 cli 化也是一个超大需求点呢。
依然需要努力
上面这些不是不努力的借口,而是一个瞄准镜,希望自己能瞄准自己的方向继续努力下去,研究和学习总不会错的。