返回首页
24小时热榜
## [0.0.1-alpha.5] - 2025-06-14
### 新增
- 集成了 AWS S3 存储支持,新增 `S3` 类和环境变量,实现无缝的文件上传和检索。
- 引入了 `FileController`,用于从 S3 或本地存储提供文件,具备强大的路径验证和错误处理功能。
- 增加了多个内容转换器(如 Screenshot 和 `HTMLTransformer`),提升了 HTML/Markdown 的提取和截图生成能力。
- 扩展了抓取功能,新增选项:输出格式、超时设置、标签过滤、等待时间、重试策略、视口配置和自定义用户代理支持。
- 在 `SearchSchema` 中添加了安全搜索参数,以过滤搜索结果。
- 重新构建了引擎架构,采用工厂模式,并新增核心模块用于配置验证、数据提取和任务管理。
- 实现了 API 服务器的优雅关闭处理,并改进了未捕获异常和未处理拒绝的日志记录。
- 为 API 和库包添加了 Jest 配置,支持 ESM,并更新了测试脚本。
- 更新了 CI 工作流,以在版本标签上发布 Docker 镜像。
- 扩展了 README,详细描述了环境变量和 API 使用示例。
### 更改
- 精炼了 `ScrapeController` 和 `JobManager` 中的错误处理;失败响应现在包含结构化错误对象和 HTTP 状态码。
- 增强了 `BaseEngine`,增加了显式的 HTTP 错误检查和韧性改进。
- 更新了 OpenAPI 文档,以反映新的抓取参数和错误格式。
- 将键值存储名称迁移到环境配置中,以提高灵活性。
- 在 `ScrapeController` 中增强了每个请求的信用跟踪,并改进了日志中间件以包含信用使用情况。
### 修复
- 改进了作业失败消息,包含详细的错误数据,确保更清晰的调试信息。
- 进行了小幅文档修正和澄清。