返回首页
最新
背景简介:我拥有数学与计算机科学学位,并且在计算机视觉、语音处理和扩散模型方面有大约两年的经验(主要集中在工程方面)。我现在希望更多地转向机器人技术,并且对制定学习路线图非常感兴趣。我想更深入地了解软件和人工智能方面的内容,特别是像视觉-语言-行动(VLA)模型这样的主题。对于像我这样背景的人,谁能提供一些建议或推荐一个适合新手的机器人领域学习路线图?非常感谢任何指点!
我一直觉得从网站上复制粘贴内容到ChatGPT非常烦人,基本上希望Cursor的CMD+K能在任何地方都能使用。<p>于是我开发了一个小的Chrome扩展程序,名为InPageAI,旨在实现这个功能:<a href="https://inpageai.com" rel="nofollow">https://inpageai.com</a><p>在任何页面上按下快捷键,它会自动抓取上下文,然后你可以让AI进行总结、解释等。你还可以直接在输入框/文本框中写入内容。<p>现在还处于早期阶段,但你可以试试看?我很想听听你的想法,或者你发现它在哪些地方出现问题!
大家好!我个人使用这个技术栈已经有一段时间了,决定通过将其转化为一个可以重复使用的模板来进行一些自动化。希望其他人也能觉得它有帮助!
刚刚发布了我们的计划检查工具——一个小型静态分析工具,可以在 AI 代理计划运行之前捕捉到“明显愚蠢”的错误。
<p>GitHub 仓库 -> <a href="https://github.com/cirbuk/plan-lint">https://github.com/cirbuk/plan-lint</a></p>
<p>还可以阅读关于如何通过四步安全栈(“无安全词”)来处理安全问题的内容 → <a href="https://mercurialsolo.substack.com/p/no-safe-words" rel="nofollow">https://mercurialsolo.substack.com/p/no-safe-words</a></p>
<p>为什么?</p>
<p>代理现在生成机器可读的 JSON/DSL 计划。大多数生产事故(循环、权限飙升、原始秘密)本可以通过离线扫描这些计划来捕获,但大家都专注于运行时的保护措施。</p>
<p>它的功能:</p>
* 模式 + 策略验证(JSONSchema / YAML / OPA)
* 数据流 + 种污检查(针对秘密和个人身份信息)
* 循环检测(图循环)
* 风险评分 0-1,失败阈值可配置
* 通过入口点插件规则
<p>对于 100 步的计划,运行时间小于 50 毫秒,零令牌成本。</p>
<p>在生产环境中部署具有工具访问权限的代理时,您是如何处理安全问题(预算超支、令牌泄漏)的?</p>
我之前的帖子标题没有“Show HN”前缀,所以在这里重新发布一下。<p>整个技术栈都是使用人工智能构建的,从基础设施管道、后端API、前端到AI聊天服务器。<p>下一步:构建一个代理,通过以下方式提升用户体验:
- 测试与AI角色的聊天
- 分析体验
- 改进角色的系统提示
- 然后重复这个过程