对这个小模型的能力表示惊讶,我让它用 Ruby 写一个获取天气的小程序,结果它一口气输出了整套 Sinatra 项目代码。这是奔着和 Open Code 配合使用的节奏呀,已经不单单是个聊天取向的模型了。
@super 哈哈,真的我也试过,看到整整一屏的but ,wait感到无语。忍不住骂它 这点小任务都做不好,怎么把大任务交给你😂
@ToT 这个模型好像特别为写代码优化的,我试着让它写个小程序反而相对顺利,没有太长时间的思考。但是做其他任务,让它做翻译,就直接陷入了无尽的 thinking,甚至循环思考出不来了。
@super 原来起这样啊
@ToT 我觉得这个模型最有意义的场景就是本地视觉识别,比起调用商业 API 真的能省很多钱,速度也不慢,效果也很好。
这个模型的主要问题是过度思考,大多数时候无用的思考太久,输出太慢。比如让它翻译一段文字,它会逐字逐句分析是什么意思,然后分析原语句中的逻辑和错误,最后才给出翻译。思考过程会不断反思之前翻译是否正确,不断去修改调整。一点点小任务做成了没完没了的大项目。