全球首位 AI 程序员正式上线,这个月薪只要三千的同事能干什么?
说到「编程」,我们常常会想到那个不太友善的程序员笑话:
虚假的程序员:从零开始编写代码,勤勤恳恳修改、优化、注释;
真正的程序员:熟练掌握「Ctrl + C」和「Ctrl + V」。
▲图源:Laravel
不过,由 Cognition Labs 开发的全球首位 AI 程序员「Devin AI」或许可以让你把「复制粘贴」这一步都省了,你可以直接把 TA 当成你的「程序员同事」,让 TA 帮你干活。
既然被称为「程序员」,那 TA 就不可能白白干活。Devin AI 的服务起价为每月 500 美元(约合 3624 元),还真不算便宜。不过相比之下,这个价格比国内一线大厂程序员的平均工资还是低了不少。
▲图源:COGNITION
Devin AI 实际上是一个由人工智能驱动的编码平台,配备了命令行、代码编辑器和浏览器等常见的开发者工具,它可以在编写代码片段、检测错误和建议改进等方面协助开发人员完成代码编写,几乎覆盖了编程工作的全流程。
值得一提的是,Devin AI 还可以通过机器学习算法分析代码模式,从先前的经验中持续学习,这极大地提高了其编码效率,还能保持与最新编程趋势的同步。
作为一位「编程助理」,Devin AI 可以辅助程序员完成下面的工作:
- 代码补全:Devin AI 能够通过分析代码上下文和语法预测下一行代码,加快编码效率;
- 错误检测:Devin AI 可以检测代码中的常见错误和问题,帮助开发人员识别和修复 bug;
- 代码重构:Devin AI 会提供代码重构建议,能够帮助开发人员编写更简洁、更高效的代码;
- 代码优化:Devin AI 可以分析代码性能,提出优化建议,以提高速度和效率;
- 多人协作:Devin AI 甚至可以作为协作工具,允许多个开发人员同时在同一项目上工作。
官方建议,Devin AI 在处理小型前端错误和极端情况、进行针对性的代码重构以及为待办事项列表中的任务创建初稿 PR(Pull Request)等场景下最为实用。
▲图源:SHIFTMAG
当然,作为一位名副其实的「AI 程序员」,除了辅助编程开发以外,TA 还可以「独立完成任务」供开发人员审核。官方介绍 Devin AI 是「一位不知疲倦并且技术娴熟的团队成员」。
据官方介绍,Devin AI 能够自主规划和执行需要数千个决策的复杂工程任务。这也就意味着开发者可以化身「产品经理」,将开发需求和任务等等「告诉」Devin AI,其就可以进行独立的成果产出。
针对这项功能,官方还贴心地给出了 Devin AI 的「使用指南」,就像你平时叮嘱同事一样:
- 给 Devin AI 分配「你自己知道如何完成」的任务;
- 告诉 Devin AI 如何测试或者检查自己的工作;
- 将会话时间保持在大约 3 小时以内,并且尽量将大型任务分解;
- 提前将你的详细需求告知 Devin AI;
- 通过在对话中给出反馈、采纳建议的知识,或者手动添加你自己的知识,来强化对 Devin AI 的训练。
▲图源:Xeven Solutions
关于 Devin AI 在具体场景下的表现,官方展示了几个有趣的用例,我们能够从中一窥这位「程序员」有多厉害。
Devin AI 可以学习和使用「不熟悉」的技术。其在阅读了一篇博客文章后,现学现卖,自主编写代码,在 Modal 上运行 ControlNet 并且生成了一张带有隐藏文字「SARA」的图片:
Devin AI 还可以端到端构建和部署应用。在演示中,其根据需求制作了一个模拟「Game of Life」的交互式网站,并且逐步添加了用户提出的功能,然后将这个应用程序部署到 Netlify 中:
Devin AI 甚至可以训练和微调自己的 AI 模型。演示人员仅仅提供了一个指向 GitHub 研究存储库的链接,其就对某个大语言模型进行了「微调」:
此外,Devin AI 还可以实现自动查找和修复代码库中的错误,处理开源仓库中的错误和功能请求等等。
在「SWE-bench」这项「具有挑战性」的基准测试中,Devin AI 正确解决了 13.86% 的问题,远超之前 1.96% 的最佳水平。即使确切给出了需要编辑的文件,之前最好的模型 Claude 2 也只能解决 4.8% 的问题。
令人惊叹的是,Devin AI 甚至已经通过了现实世界的工程师面试,还在流行的自由职业平台「Upwork」上找到了一份工作。
Devin AI 成为「自由职业者」的新闻还曾引起过不小的争议。一位有着几十年软件工程师经验的 YouTube 博主质疑其演示视频造假,表示这些内容是「自导自演」、「无用功」,并且对其实际能力和效率提出了质疑。
无论是不是商业炒作,Devin AI 目前都已经全面推出。真正的编程表现如何,不妨再等等看,交由时间和用户评判。
▲图源:COGNITION
在 Devin AI 正式推出后不久,OpenAI 也宣布推出了 ChatGPT Canvas 的多项更新,其中就包括直接运行 Python 代码功能,更新后的 Canvas 可以根据要求搜索 API 文档,指导模型编写并执行代码,还可以开发小工具和游戏等。
可以看到,即使是规模大如 OpenAI 这样的人工智能企业,也在不断对「AI 编程」加注。在这样的背景之下,我们自然会想到那个「终极」问题:
TA 离取代真正的程序员还有多远?