2作者: aethiopicuschan10 天前原帖
嗨,HN, 我很高兴地分享 SpeechAnalyzerDylib,这是一个小型的 C 兼容动态库,封装了苹果即将在 macOS 26.0(Tahoe)中推出的 SpeechAnalyzer API。如果你正在构建 Swift、Objective-C 或纯 C 项目,并希望以几乎没有样板代码的方式添加设备上的转录功能,这个库可能会对你有所帮助。 ## 主要特性 - *C-FFI 封装* 提供一个简单的 C 兼容 API,方便你从 Swift、Objective-C 或纯 C 中调用。 - *异步文件转录* `sw_transcribeFile(const char *filePath, const char *locale, TranscriptionCallback callback, void *userData)` 在后台转录磁盘上的任何音频文件;通过回调返回完整的转录文本或错误字符串。 - *内存数据转录* `sw_transcribeData(const uint8_t *bytes, size_t size, const char *locale, TranscriptionCallback callback, void *userData)` 通过内部写入临时文件并重用基于文件的转录路径来转录原始音频缓冲区。 - *实时麦克风流式传输* `sw_startMicrophoneTranscription(const char *locale, TranscriptionCallback callback, void *userData)` 从默认麦克风实时流式传输语音,接收逐步到达的部分转录,并在引擎停止时自动停止。 - *区域设置感知* 所有 API 接受一个可选的区域设置标识符(默认为系统区域设置),以支持特定语言的模型。 - *自动模型管理* 在开始转录之前,验证或下载所需的离线语音模型,以匹配你选择的区域设置。 - *基于回调的错误处理* 在失败时,回调会接收到一个 `"Error: …"` 字符串,以便你处理重试或后备方案。 - *零外部依赖* 完全基于苹果的 AVFoundation 和 Speech 框架构建,无需第三方库。 ## 版本要求 macOS 26.0(Tahoe)beta Xcode 26 beta 这两个版本目前都处于测试阶段,SpeechAnalyzer 仅在测试版中可用,因此你需要运行开发者测试版才能试用。 ## 仓库与许可证 [https://github.com/aethiopicuschan/speech-analyzer-dylib](https://github.com/aethiopicuschan/speech-analyzer-dylib) 许可证为 MIT。 ## 欢迎反馈与贡献 - 对于你遇到的错误或边缘情况,请开放问题 - 提交 PR 以添加测试、CI 或示例集成 - 在下方分享你的经验或集成问题 期待听到你用它构建的内容!
1作者: HeartStamp11 天前原帖
我是HeartStamp的创始人,这是一家获得种子轮融资的初创公司。我们正在构建一个生成式人工智能平台,旨在通过结合前沿模型、LoRA定制和市场,来实现个性化的数字表达,将创意意图转化为精美呈现的数字内容和高保真、可打印的媒体。我们计划在2026年第一季度在美国、加拿大和英国推出,并计划在此后迅速扩展到全球市场。 我们正在招聘一位基础性的*自由职业AI工作流工程师*,帮助我们推出我们的最小可行产品(MVP)。你将与我们的技术负责人密切合作,设计和优化我们的生产流程,使用ComfyUI、Stable Diffusion(SD3.5/SDXL)、LoRA和TensorRT。该职位的一个关键部分还包括帮助我们定义需求、面试并引入我们的初始提示工程团队。这不仅仅是一个自由职业的工作机会;这是一个基础性的、共同创始人的机会。作为我们第一位外部工程师,你将直接与创始团队合作,并有明确的路径转为全职共同创始人角色,享有可观的股权。 考虑到你的专业背景,我认为这可能非常适合你。如果你对新项目持开放态度,我很想和你聊聊,分享更多细节。你可以通过这里联系我,或者在Telegram上找到我,用户名是*@phoenixonego*,也可以通过电子邮件联系我,邮箱是*[email protected]*。