展示 HN:Pebble Falcon——自主的资源调整器和碳意识 Kubernetes 调度器
嗨,HN — 我是Keval,Pebble Falcon背后的AI团队成员。
什么是Pebble Falcon:
这是两个长期运行的代理,您可以在您的Kubernetes集群中部署。
> PerfectFit:
- 流式传输Pod / 虚拟机 / GPU的利用率
- 计算剩余空间
- 生成JSON补丁以调整CPU、内存和存储的配置
- 可选的人为审批步骤
> EcoAgent:
- 实时轮询电网碳排放数据,并重新配置GPU节点和Pod,以最大化清洁能源的使用。
- 将批处理作业重新排队到满足延迟服务水平协议(SLA)且二氧化碳排放最低的区域。
一个轻量级的网页用户界面显示节省的成本、避免的功耗和30天的预测。
没有数据离开集群;唯一的输入数据是公共碳强度。
我们为什么要构建它:
我们发现GPU节点的闲置率低于20%,而ETL作业却在高碳排放区域运行。手动的“调整大小冲刺”从未赶上。
试点结果(40节点GPU集群,30天):
- 移除70%的闲置计算
- 避免4160千克二氧化碳(约相当于六次纽约到伦敦的航班)
Pebble Falcon需要访问集群,因此目前没有公共沙盒。我们录制了一段3分钟的代理概述视频。
视频演示: [https://youtu.be/DTpHxAmVrAo](https://youtu.be/DTpHxAmVrAo)
如果您有兴趣试用,请留言,我们会与您联系,并可以将您添加到我们的试点测试中: [https://www.gopebble.com/sign-up](https://www.gopebble.com/sign-up)
欢迎就能源、成本和计算感知调度AI工作负载进行提问。
查看原文
Hi HN — I’m Keval, part of the AI team behind Pebble Falcon.<p>What it Pebble Falcon:<p>Two long-running agents you deploy inside your k8s cluster.<p>> PerfectFit:<p>- Streams pod / VM / GPU utilization<p>- Calculates head-room<p>- Generates JSON patches to right-size CPU, memory and storage<p>- Optional human-approval step<p>> EcoAgent<p>- Polls real-time grid-carbon feed and re-configures GPU nodes and pods to maximize clean energy use.<p>- Re-queues batch jobs to the region with the lowest gCO₂/kWh that still meets your latency SLA<p>A lightweight web UI shows cost saved, watts avoided and a 30-day projection.<p>No data leaves the cluster; the only inbound feed is public carbon intensity.<p>Why we built it:<p>We kept seeing GPU nodes idling below 20 % while ETL jobs ran in high-carbon regions. Manual “rightsizing sprints” never caught up.<p>Pilot result (40-node GPU cluster, 30 days)
70% idle compute removed<p>4160 kg CO₂ avoided (≈ six NYC→London flights)<p>Pebble Falcon needs access to clusters so no public sandbox yet. Instead we recorded a 3-min overview of the agents.<p>Video Demo: <a href="https://youtu.be/DTpHxAmVrAo" rel="nofollow">https://youtu.be/DTpHxAmVrAo</a><p>However if you’re interested in trying it out, comment and we’ll get in contact and can add you to our pilot test: <a href="https://www.gopebble.com/sign-up" rel="nofollow">https://www.gopebble.com/sign-up</a><p>AMA about energy, cost and compute aware scheduling for AI workloads.