返回首页

24小时热榜

1作者: ntbperst大约 4 小时前原帖
## [0.0.1-alpha.5] - 2025-06-14 ### 新增 - 集成了 AWS S3 存储支持,新增 `S3` 类和环境变量,实现无缝的文件上传和检索。 - 引入了 `FileController`,用于从 S3 或本地存储提供文件,具备强大的路径验证和错误处理功能。 - 增加了多个内容转换器(如 Screenshot 和 `HTMLTransformer`),提升了 HTML/Markdown 的提取和截图生成能力。 - 扩展了抓取功能,新增选项:输出格式、超时设置、标签过滤、等待时间、重试策略、视口配置和自定义用户代理支持。 - 在 `SearchSchema` 中添加了安全搜索参数,以过滤搜索结果。 - 重新构建了引擎架构,采用工厂模式,并新增核心模块用于配置验证、数据提取和任务管理。 - 实现了 API 服务器的优雅关闭处理,并改进了未捕获异常和未处理拒绝的日志记录。 - 为 API 和库包添加了 Jest 配置,支持 ESM,并更新了测试脚本。 - 更新了 CI 工作流,以在版本标签上发布 Docker 镜像。 - 扩展了 README,详细描述了环境变量和 API 使用示例。 ### 更改 - 精炼了 `ScrapeController` 和 `JobManager` 中的错误处理;失败响应现在包含结构化错误对象和 HTTP 状态码。 - 增强了 `BaseEngine`,增加了显式的 HTTP 错误检查和韧性改进。 - 更新了 OpenAPI 文档,以反映新的抓取参数和错误格式。 - 将键值存储名称迁移到环境配置中,以提高灵活性。 - 在 `ScrapeController` 中增强了每个请求的信用跟踪,并改进了日志中间件以包含信用使用情况。 ### 修复 - 改进了作业失败消息,包含详细的错误数据,确保更清晰的调试信息。 - 进行了小幅文档修正和澄清。