返回首页
最新
我已经构建人工智能代理一段时间了。在尝试了各种框架并与许多使用人工智能的创始人交流后,我注意到一个有趣的现象:大多数投入生产的“人工智能代理”实际上并没有那么智能。最好的那些大多只是经过精心设计的软件,在关键点上加入了大型语言模型(LLM)。
因此,我决定记录我在构建生产级人工智能系统方面的经验:<a href="https://github.com/humanlayer/12-factor-agents">https://github.com/humanlayer/12-factor-agents</a>。这是一个关于构建可靠的LLM驱动软件的原则集合,足够可靠,可以交给生产客户使用。
本着Heroku的12 Factor Apps精神(<a href="https://12factor.net/" rel="nofollow">https://12factor.net/</a>),这些原则专注于使LLM应用程序更可靠、可扩展和可维护的工程实践。即使模型变得越来越强大,这些核心技术仍将保持其价值。
我看到许多SaaS开发者试图通过在代理框架上构建全新项目来转向人工智能,但发现使用现成工具无法达到70-80%的可靠性。那些成功的开发者往往是从代理构建中提取小而模块化的概念,并将其融入现有产品,而不是从头开始。
完整指南详细介绍了每个原则,并提供了示例和可遵循的模式。我看到这些实践在处理真实用户流量的生产系统中表现良好。
我分享这些内容作为一个起点——这个领域发展迅速,因此这些原则将不断演变。我欢迎您的反馈和贡献,帮助我们弄清楚“生产级”在人工智能系统中意味着什么!
很遗憾,我没有被我申请的顶尖学校的硕士/博士项目录取,因此我正在寻找计算机科学领域的预博士等价项目(类似于经济学的运作方式)。我已经给许多我感兴趣的教授发了冷邮件,但大多数似乎缺乏资金或没有回复冷邮件。你有什么更好的建议吗?