5作者: lmazgon3 个月前原帖
Benchi 是一个命令行工具,用于运行基准测试和收集指标。它使用 Docker Compose 来协调基准测试所需的基础设施和工具,使得在不同机器上重复运行成为可能。它允许您对不同的工具运行相同的基准测试,并比较收集到的结果。 该仓库包含一个简单的示例。有关更复杂的示例,请查看我们如何使用 Benchi 比较在 Conduit 和 Kafka Connect 上运行的数据管道,这两种是数据流工具(仍在进行中):[https://github.com/ConduitIO/streaming-benchmarks](https://github.com/ConduitIO/streaming-benchmarks)
1作者: daniel-munro3 个月前原帖
我对数学常数(如拉姆齐数、忙海狸函数等)收敛界限的集体过程感到着迷。我想制作一些可视化图形,但找不到一个方便的历史界限更新来源,因此我创建了这个仓库。 这个汇编数据的两个主要目标是以视觉上信息丰富的方式展示它们,和以各种格式(如JSON、CSV等)提供下载。 我并不是专业的数学家,因此欢迎任何建议,以便使这个项目对数学家和爱好者更有用、更直观。也欢迎通过GitHub讨论区进行贡献!
1作者: lerno3 个月前原帖
从这里获取:<a href="https://github.com/c3lang/c3c" rel="nofollow">https://github.com/c3lang/c3c</a> <p>在2019年,我在为C2语言做贡献时,开始了“C3”这个宠物项目,期间在等待拉取请求被批准……</p> <p>现在已经过去6年,C3正在稳步迈向1.0版本,上周发布了0.7.0版本。</p> <p>与其他C语言替代品不同,C3试图对C语言进行演进,但不考虑与后者的向后兼容性。</p> <p>它为C语言添加的功能包括:</p> <ul> <li>模块系统</li> <li>语义宏和编译时自省</li> <li>轻量级泛型模块</li> <li>零开销错误</li> <li>内置切片和SIMD类型</li> <li>渐进式合约</li> <li>调试模式下的内置检查</li> </ul> <p>您可以在网站上找到更多详细信息:<a href="https://c3-lang.org" rel="nofollow">https://c3-lang.org</a></p> <p>查看示例可能会很有趣:<a href="https://c3-lang.org/language-overview/examples/" rel="nofollow">https://c3-lang.org/language-overview/examples/</a>,以了解该语言在一些简单示例中的表现。</p> <p><i>以下是一些可能感兴趣的其他链接:</i></p> <p>我之前在HN上发布过关于C3的内容,特别是:</p> <ul> <li><a href="https://news.ycombinator.com/item?id=24108980">https://news.ycombinator.com/item?id=24108980</a></li> <li><a href="https://news.ycombinator.com/item?id=27876570">https://news.ycombinator.com/item?id=27876570</a></li> <li><a href="https://news.ycombinator.com/item?id=32005678">https://news.ycombinator.com/item?id=32005678</a></li> </ul> <p>这里有一些关于C3的访谈:</p> <ul> <li><a href="https://www.youtube.com/watch?v=UC8VDRJqXfc" rel="nofollow">https://www.youtube.com/watch?v=UC8VDRJqXfc</a></li> <li><a href="https://www.youtube.com/watch?v=9rS8MVZH-vA" rel="nofollow">https://www.youtube.com/watch?v=9rS8MVZH-vA</a></li> </ul> <p>这里有一个系列展示在C3中完成各种任务的内容:</p> <ul> <li><a href="https://ebn.codeberg.page/programming/c3/c3-file-io/" rel="nofollow">https://ebn.codeberg.page/programming/c3/c3-file-io/</a></li> </ul> <p>一些项目:</p> <ul> <li>Gameboy模拟器 <a href="https://github.com/OdnetninI/Gameboy-Emulator/" rel="nofollow">https://github.com/OdnetninI/Gameboy-Emulator/</a></li> <li>RISCV裸机Hello World: <a href="https://www.youtube.com/watch?v=0iAJxx6Ok4E" rel="nofollow">https://www.youtube.com/watch?v=0iAJxx6Ok4E</a></li> <li>“Daemonheim的深渊”类roguelike游戏 <a href="https://github.com/TechnicalFowl/7DRL-2025" rel="nofollow">https://github.com/TechnicalFowl/7DRL-2025</a></li> </ul>
2作者: snehanairdoc3 个月前原帖
我们最近进行了深入的基准测试,比较了Docsumo的专有OCR技术与Mistral OCR和Landing AI的智能文档提取技术。我们的目标是评估它们在实际文档处理任务中的表现,尤其是在复杂布局和低质量扫描的情况下。 关键发现: 准确性:Docsumo的OCR在各种文档类型(包括发票和银行对账单)的文本提取方面表现出更高的精确度。 布局保持:我们的技术更有效地保持了文档的原始结构,确保了提取数据的可用性。 处理速度:Docsumo实现了更快的处理时间,使其更适合高容量的文档处理任务。 为了确保透明度和可重复性,我们已将基准测试结果公开。您可以在此处查看并排输出、准确性评分和布局比较: <a href="https://huggingface.co/spaces/avinash112/ocr-benchmark" rel="nofollow">https://huggingface.co/spaces/avinash112/ocr-benchmark</a> 有关我们方法论和详细发现的全面分析,请参考我们的完整报告: [插入博客链接] 我们邀请社区审查我们的发现,并分享对生成式OCR工具在生产环境中准备情况的见解。它们真的能胜任吗?
41作者: joshdickson3 个月前原帖
嗨,HN!<p>今天我很高兴地推出 OpenNutrition:一个免费的、遵循 ODbL 许可的营养数据库,包含日常的通用食品、品牌食品和餐厅食品;一个可以浏览网络以导入新食品的搜索引擎;以及一个将数据库和搜索功能整合为免费的宏观追踪应用的伴侣应用。<p>持续记录你所吃的食物已被证明有助于支持长期健康结果(1)(2),但要轻松做到这一点,依赖于一个大型、准确且最新的营养数据库。免费的公共数据库往往过时、难以导航,并且缺乏关键覆盖(例如品牌餐厅食品)。用户生成的数据库可能不可靠或是闭源的。商业数据库则伴随持续的、通常按席位收费的许可费用,以及限制创新的使用限制。<p>作为一名业余的力量举选手和长期保持体重的人,帮助他人追求健康目标是我非常关心的事情。在去年退出我的前一家初创公司后,我想探讨使用大型语言模型(LLMs)创建所需数据库和基础设施的可能性,以便制作一个优秀的食品记录应用,并使其成本工程化以实现免费和可获取的分发,因为我相信这些工具的可用性是一种公共利益。这促成了我今天发布的数据集的创建;营养数据是公共记录,其组织和传播也应如此。<p>数据库中包含什么?<p>- 5,287种常见的日常食品,3,836种准备好的通用餐厅食品,以及来自约50家热门美国餐厅连锁的4,182种独特菜单项;食品有标准化的名称、一致的数值份量、估算的微量营养素概况、描述,以及尽可能引用/基于 USDA、AUSNUT、FRIDA、CNF 等的数据。<p>- 313,442种最受欢迎的美国品牌杂货产品,具有标准化名称、解析的份量和添加剂/过敏原数据,基于品牌 USDA 数据;最受欢迎的1%产品有估算的微量营养素数据,目标是实现全面覆盖。<p>即使是最大的商业数据库,在搜索没有现有覆盖的食品或自定义时也可能令人沮丧。为了解决这个问题,我创建了一个实时版本,使用与构建核心数据库相同的方法,可以浏览网络以了解新食品或食品自定义(例如,高度定制的星巴克订单)。网络上有一个有限的演示,在应用内你可以通过文本搜索、条形码扫描或图像记录食品,所有这些都可以在需要时搜索网络以导入食品。通过这些搜索发现的食品会反馈到数据库中,我计划在覆盖范围扩大时发布更新版本。<p>- 搜索与探索:<a href="https://www.opennutrition.app/search" rel="nofollow">https://www.opennutrition.app/search</a><p>- 方法论/关于:<a href="https://www.opennutrition.app/about" rel="nofollow">https://www.opennutrition.app/about</a><p>- 获取 iOS 应用:<a href="https://apps.apple.com/us/app/opennutrition-macro-tracker/id6670272666">https://apps.apple.com/us/app/opennutrition-macro-tracker/id...</a><p>- 下载数据集:<a href="https://www.opennutrition.app/download" rel="nofollow">https://www.opennutrition.app/download</a><p>OpenNutrition 的 iOS 应用提供免费的基本记录和有限数量的自主搜索,以及支出追踪和持续的饮食建议,类似于顶级付费应用。付费层($49/年)解锁额外的搜索和功能(数据备份、优先覆盖已记录食品的微量营养素),并帮助资助进一步开发和更广泛的库覆盖。<p>我很想听听你们的反馈、问题和建议——无论是关于数据库本身、非常出色/糟糕的搜索结果,还是应用。<p>1. Burke 等人,2011年,<a href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3268700/" rel="nofollow">https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3268700/</a><p>2. Patel 等人,2019年,<a href="https://mhealth.jmir.org/2019/2/e12209/" rel="nofollow">https://mhealth.jmir.org/2019/2/e12209/</a>
3作者: echosec3 个月前原帖
hCaptcha Challenger 利用多模态大语言模型(MLLMs)的空间链式思维(SCoT)推理能力,构建了一种自主工作流框架。这种架构使得自主智能体能够在多样的空间视觉任务上进行零-shot 适应,通过动态问题解决工作流来实现,消除了对特定任务微调或额外训练参数的需求。
1作者: jackson12t3 个月前原帖
我几年前制作了这个工具,最近才有时间将其完善到可以分享的程度:<a href="https:&#x2F;&#x2F;github.com&#x2F;pangolinsec&#x2F;shihtzu" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;pangolinsec&#x2F;shihtzu</a> <p>它可以解析ldapsearch或dsquery的输出,并生成带有一些额外逻辑的Markdown文件,这样你在使用Obsidian打开文件夹并查看图形视图时,可以可视化嵌套的成员关系——从某种意义上说,它有点像一个功能较弱的Bloodhound(<a href="https:&#x2F;&#x2F;github.com&#x2F;SpecterOps&#x2F;BloodHound" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;SpecterOps&#x2F;BloodHound</a>),但它的运行更为安静。它还解析Active Directory中的`useraccountcontrol`和一些与登录相关的属性,以自动标记对攻击者特别有趣或不感兴趣的账户。 <p>一些核心功能: - 从文本文件中解析LDAP属性为结构化的Obsidian Markdown - 智能分类对象为用户、组或计算机 - 自动识别管理员及其管理权限 - 检测潜在的风险账户配置(过期账户、登录次数低) - 在相关对象之间创建Obsidian链接,以便进行网络可视化 - 处理UserAccountControl (UAC)值并提供解释 - 将Windows时间戳转换为人类可读的格式 - 智能追加模式,仅将新数据添加到现有文件 - 便于在Obsidian中进行过滤和搜索的标签功能 <p>这并不是新颖的工具,但在一些情况下对我非常有用。
1作者: jFriedensreich3 个月前原帖
Shortwave,这款(至今为止)最具前景的电子邮件客户端,继承了尚未被超越且令人怀念的谷歌收件箱的优良基因,最近却移除了行业标准的侧边栏,该侧边栏显示了诸如收件箱或归档等邮件标签及其数量。当被问及这一令人不安的举动时,公司回应称这是必要的,因为需要腾出空间来为“即将推出的人工智能功能”做准备。难道大家都完全失去理智了吗?我们是否正在接近人工智能产品的NFT阶段?