大家好!我们是Praxos的创始人Lucas和Soheil(网址:<a href="https://praxos.ai">https://praxos.ai</a>)。Praxos是一个AI代理的上下文管理器,提供构建状态保持代理所需的一切,确保它们在生产环境中不会出现故障。
Praxos能够解析任何数据源,从非结构化的PDF和API流到对话消息,再到结构化数据库,并将其转换为一个统一的知识图谱。这个图谱中的所有内容都是语义化的,并且其关系是明确的,从而将数据转化为一个干净、可查询的理解宇宙,AI可以在其中使用而不会出错。
无论您需要查询问题的答案,还是以适合当前用例的方式提取数据,Praxos都能做到,无需重新查询。这使得AI应用能够端到端解析数据,然后基于这些数据进行操作,提供单链和多链推理步骤的输出。中间结果、最终结果和用户编辑的输出都可以重新添加到知识图谱中,使Praxos能够实时学习。
在我们从事保险行业的开发时,常常遇到两个主要问题:
首先,大型语言模型(LLMs)无法解析诸如财产清单和保险政策等文档。举个例子,财产清单可能是一个包含50页的Word、Excel和PDF文档的集合,详细说明了一系列物理财产的建设、使用和地理信息。重建一个对象(财产)意味着需要仔细梳理这些文件,以建立数据之间的语义、概念、空间,甚至是隐含的联系。
结果是:关系信息可能会丢失、留空或被虚构。
其次,重复调用搜索、检索和更新信息有时会导致级联错误。这在处理复杂任务时变得更加频繁,比如阅读文档、获取之前的用户信息、进行计算、存储结果,然后再呈现给用户。
我们意识到,为了让AI提供更有用和准确的响应,正确使用文档中的关系,这些关系需要被明确化。许多上下文信息是以非语言的方式表示的。这意味着我们无法直接以编程方式与它们互动,LLMs被迫每次都自行解释。这就是我们开始构建Praxos的原因。
我们为爱好者和早期采用者设置了一个自助选项,提供免费层(有数据上限)。作为参考,这应该能覆盖您最多200页文档。您可以在这里注册:<a href="https://data.praxos.ai/sign-up">https://data.praxos.ai/sign-up</a>。
我们的第一个版本是一个SDK,旨在满足您所有的数据提取、检索和更新需求。
以下是它的工作原理:
组织信息:Praxos将信息分类为本体,这是一种用于存储数据的结构化模式。这些本体允许您引入预定义的类型、属性和关系,指导知识图谱的构建和解释。
处理输入数据:Praxos可以处理任何数据源,从PDF到表格数据、JSON和对话式交换。提取过程是端到端的。您无需进行OCR、分块或预处理输入。处理过程简单到只需传入您的文件并选择一个本体。
检索信息/记忆:对于每个查询,Praxos通过结合图遍历技术、向量相似性和键值查找来搜索和检索相关的存储信息。搜索对象将返回实体及其连接,以及一句话的描述。
我们非常希望听到您的想法!请随时参与讨论,并通过Discord与我们分享任何想法或建议(链接:<a href="https://discord.gg/wVmrXD2dJA" rel="nofollow">https://discord.gg/wVmrXD2dJA</a>)。
您的反馈将帮助我们决定Praxos的未来发展方向!
返回首页
最新
我很高兴地分享CeresAi,这是一个面向消费者的平台,让您可以根据自己的WhatsApp、Instagram或短信聊天记录创建深度个性化的AI伴侣。与其使用通用的机器人,每个CeresAi角色都能学习您所爱之人的表达方式、情感细微差别和聊天记忆——这样您就可以随时进行真实而真挚的对话。我们还提供了预构建的角色:可以查看我与特朗普的对话(<a href="https://www.ceresai.xyz/share/2e902afc-f76f-476c-a52c-9c30d7acfb7b" rel="nofollow">https://www.ceresai.xyz/share/2e902afc-f76f-476c-a52c-9c30d7...</a>)。
它是什么
一个单一的 45 MB Windows .exe 文件,嵌入了 llama.cpp 和一个简约的 Tk 用户界面。将它(以及任何 .gguf 模型)复制到闪存驱动器上,双击任何 Windows PC,你就可以与一个大型语言模型(LLM)聊天——无需管理员权限、云服务或网络连接。
我为什么要构建它
现有的“本地 LLM”图形用户界面假设用户可以使用 pip 安装、传递长命令行参数,或下载数 GB 的额外文件。我希望有一个我的技术能力较弱的同事在客户访问时可以通过简单地插入 USB 驱动器来运行的工具。
它是如何工作的
使用 PyInstaller 一键构建 → 将 Python 运行时、llama_cpp_python 和用户界面打包成一个单独的可执行文件。在首次启动时,它会对 .gguf 文件进行内存映射;后续的提示在 i7-10750H 上以约 20 个标记每秒的速度流式传输,使用的模型是 gemma-3-1b-it-Q4_K_M.gguf(0.8 GB)。基于时钟驱动的渲染循环保持用户界面的响应性,同时 llama.cpp 进行计算。一个解析器会将每个源自提示的标记加粗并下划线;按住 Ctrl 并点击会弹出一个“源查看器”,以追踪事实。(有助于快速发现幻觉。)
我只是想问谷歌如何停止过度思考。<p>结果我看到的是SEO诱饵、Pinterest上的励志语录,还有一个人在低保真音乐中低声细语的YouTube视频。<p>于是我创建了Nexix:一个情感上不在场的人工智能,只给你答案——没有网红,没有广告,没有“十大正念仪式”。<p>Nexix不关心互动。它只关注逻辑和氛围。<p>https://nexix.netlify.app<p>在我情绪低落的时候做的。不知怎么的,它效果不错。你可以批评它,也可以试用它——我都准备好了。
今天在扔掉一个墨盒时注意到,所使用的染料升华技术在每张照片中留下了每种颜色(蓝色、黄色、品红色、白色)的负片,细节足以让人花一点时间通过 Photoshop 或 GIMP 自动化处理,层叠并合并每种颜色的反向图像。用谷歌搜索这个问题似乎没有找到相关的结果,所以我想在这里发帖,以便纠正我的假设,或者至少引起大家对这个问题的关注。佳能在数字设备的隐私使用方面发布了相当多的支持文档,但我想老式的数据外泄仍然是一个可能性。
请问佳能或相关行业的朋友们有什么见解?对于这些墨盒,什么是合适且保护隐私的消费者处理选项?
关于人工智能是否会在所有经济上可行的技能上超越人类(根据某种定义的通用人工智能,AGI),存在很多争论。无论这种情况是否会发生,或者何时发生,许多人已经因为人工智能模型的出现能力而失去了工作,这些能力包括写作、文档分析、设计、艺术等。
这使得许多人感到恐惧,他们担心自己会成为下一个被裁员的人。许多人认为,物理任务需要更长的时间,因为构建、验证和测试类人机器人所需的时间会比某些虚拟人工智能代理更长。然而,许多人相信,无论如何,未来的趋势已经显而易见,从事体力劳动或手工工作的人员所剩的时间也不过比以前的白领阶层多几年。
那么,您认为哪些技能或技能组合在人工智能继续以过去几年速度发展的情况下,能够更安全地保持就业和发挥作用呢?