1作者: quocanh342 个月前原帖
背景简介:我拥有数学与计算机科学学位,并且在计算机视觉、语音处理和扩散模型方面有大约两年的经验(主要集中在工程方面)。我现在希望更多地转向机器人技术,并且对制定学习路线图非常感兴趣。我想更深入地了解软件和人工智能方面的内容,特别是像视觉-语言-行动(VLA)模型这样的主题。对于像我这样背景的人,谁能提供一些建议或推荐一个适合新手的机器人领域学习路线图?非常感谢任何指点!
4作者: andersmyrmel2 个月前原帖
我一直觉得从网站上复制粘贴内容到ChatGPT非常烦人,基本上希望Cursor的CMD+K能在任何地方都能使用。<p>于是我开发了一个小的Chrome扩展程序,名为InPageAI,旨在实现这个功能:<a href="https://inpageai.com" rel="nofollow">https://inpageai.com</a><p>在任何页面上按下快捷键,它会自动抓取上下文,然后你可以让AI进行总结、解释等。你还可以直接在输入框/文本框中写入内容。<p>现在还处于早期阶段,但你可以试试看?我很想听听你的想法,或者你发现它在哪些地方出现问题!
1作者: mercurialsolo2 个月前原帖
刚刚发布了我们的计划检查工具——一个小型静态分析工具,可以在 AI 代理计划运行之前捕捉到“明显愚蠢”的错误。 <p>GitHub 仓库 -> <a href="https://github.com/cirbuk/plan-lint">https://github.com/cirbuk/plan-lint</a></p> <p>还可以阅读关于如何通过四步安全栈(“无安全词”)来处理安全问题的内容 → <a href="https://mercurialsolo.substack.com/p/no-safe-words" rel="nofollow">https://mercurialsolo.substack.com/p/no-safe-words</a></p> <p>为什么?</p> <p>代理现在生成机器可读的 JSON/DSL 计划。大多数生产事故(循环、权限飙升、原始秘密)本可以通过离线扫描这些计划来捕获,但大家都专注于运行时的保护措施。</p> <p>它的功能:</p> * 模式 + 策略验证(JSONSchema / YAML / OPA) * 数据流 + 种污检查(针对秘密和个人身份信息) * 循环检测(图循环) * 风险评分 0-1,失败阈值可配置 * 通过入口点插件规则 <p>对于 100 步的计划,运行时间小于 50 毫秒,零令牌成本。</p> <p>在生产环境中部署具有工具访问权限的代理时,您是如何处理安全问题(预算超支、令牌泄漏)的?</p>
2作者: gfai2 个月前原帖
我之前的帖子标题没有“Show HN”前缀,所以在这里重新发布一下。<p>整个技术栈都是使用人工智能构建的,从基础设施管道、后端API、前端到AI聊天服务器。<p>下一步:构建一个代理,通过以下方式提升用户体验: - 测试与AI角色的聊天 - 分析体验 - 改进角色的系统提示 - 然后重复这个过程