九游娱乐(China)官方网站即无需东说念主类遏止-九游娱乐(China)官方网站

发布日期:2025-02-06 08:46    点击次数:61

九游娱乐(China)官方网站即无需东说念主类遏止-九游娱乐(China)官方网站

AIxiv专栏是机器之心发布学术、时刻内容的栏目。往时数年,机器之心AIxiv专栏领受报说念了2000多篇内容,遮掩寰宇各大高校与企业的顶级履行室,灵验促进了学术洽商与传播。若是您有优秀的使命念念要共享,接待投稿或者筹商报说念。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

近期,OpenAI CEO Sam Altman 文书,2025 年将推出名为 “Operator” 的编造职工标的,AI 代理将简略自主引申任务,如写代码、预订旅行等,成为企业中的 “数字共事”。

在 OpenAI 发布 “Operator” 之前,清华、复旦和斯坦福的计议者不竭提倡了名为 “Eko” 的 Agent 设立框架,旨在让设立者通过粗略的代码和天然言语,快速构建可用于坐褥的 “编造职工”。这种框架使得 AI 代理简略给与用户的电脑和浏览器,代替东说念主类完成多样任务,为使命经过提供自动化相沿。

张开剩余90%

论文标题: Eko: Build Production-ready Agentic Workflow with Natural Language 技俩主页: https://eko.fellou.ai 技俩地址:https://github.com/FellouAI/eko Docs:https://eko.fellou.ai/docs

中枢时刻翻新:

1. 搀和智能体示意:提倡了 “Mixed Agentic representation”,通过无缝团结抒发高端倪遐想的天然言语(Natural Language)与设立者低端倪罢了的要道言语(Programming Language)。

2. 跨平台 Agent 框架:提倡环境感知架构,罢了兼并套框架和编程言语,同期相沿浏览器使用、电脑使用、当作浏览器插件使用。

3. 坐褥级遏止机制:现存 Agent 框架巨额强调自治性(Autonomous),即无需东说念主类遏止,而 Eko 框架提供了显性的坐褥级遏止机制,确保智能体使命流不错随时被中断和疗养,从而保险东说念主类对坐褥级智能体使命流的灵验监管和治理。

Eko:雠校坐褥级智能体设立的框架

让咱们用本体的例子来感受一下这个 Agent 框架的设立难度:只需要一句话,就不错让 Eko 生成一个全 Agent 帮你作念股票分析。这不即是妥妥的坐褥力器具吗!果然自若双手!

“在雅虎财经上集聚纳斯达克的最新数据,包括主要股票的价钱变化、市值、来回量,分析数据并生成可视化评释。” “ 现时登录页面自动化测试: 1. 正确的账户和密码是:admin / 666666 2. 请就地组合用户名和密码进行测试,以考证登录考证是否正常使命,举例:用户名不成为空、密码不成为空、用户名不正确、密码不正确 3. 临了,尝试使用正确的账户和密码登录,考证登录是否得胜 4. 生成测试评释并导出” 计帐现时目次下大于 1MB 的总共文献

环境感知架构(Environment-Aware Architecture)

主要场景

i)浏览器使用:主要专注于通过图形用户界面(GUI)来操作网页和浏览器中的元素,常见的罢了款式包括截图和网页索求时刻。

ii)电脑使用:与浏览器不同,Node.js 自动化则主要面向号令行界面(CLI)操作和文献系统管束,将来还会引入 GUI 感知才气。

架构先容

Eko 的跨平台设立是通过其 环境感知架构(Environment-Aware Architecture)罢了的,这一架构由三个要害端倪组成:通用中枢(Universal Core)、环境特定器具(Environment-Specific Tools) 和 环境桥接(Environment Bridge)。

1. 通用中枢:这一层提供了与环境无关的基本功能,如使命流管束、器具注册管束、LLM(大言语模子)集成和钩子系统。

2. 环境特定器具:每种环境(如浏览器膨胀、Web 环境、Node.js 环境)王人提供了优化的器具集。

3. 环境桥接:这一层持重环境的检测、器具注册、资源管束和安全限度,确保不同平台之间简略告成互动和通讯。

安全性和看望限度:Eko 针对不同环境实施了恰当的安全设施。浏览器膨胀和 Web 环境王人遴荐了严格的权限限度和 API 密钥管束,而 Node.js 环境则允许更泛泛的系统级看望,基于用户权限进行文献操作和号令引申,在需要时会在引申前恳求用户阐述。

自动器具注册:通过 loadTools () 等器具,Eko 自动注册适用于现时环境的器具,这使得设立者不错在多个环境中无缝地切换,并确保器具的正确加载。

端倪化筹算(Hierachical planning)

咱们提倡端倪化感知框架,将任务的拆解分为两层,包括 Planning layer 和 Execution layer。其中 Planning layer 持重将用户的需求(天然言语或代码言语示意)和现存器具集拆解成一个有范围特定言语(Domain-specific language)示意的任务图(Task graph)。任务图是一个有向无环图,描写了子任务之间的依赖筹商。该任务图由 LLM 一次性合成。在 Execution layer 中,证据每个任务调用 LLM 来合成具体的引申行径和器具调用。

多步合并优化:当 Eko 检测到两次引申王人是对 LLM 的调用时,会触发框架的自动合并机制,将两次调用的 system prompt 自动整合,合并成一次调用。从而加速推理速率。

视觉 - 交互身分不竭感知(Visual-Interactive Element Perception)

视觉 - 交互身分不竭感知框架(VIEP)是一种新颖的浏览器感知处分决策,通过将视觉识别与元素高下文信息团结,显贵进步了在复杂网页中的任务精度和后果。它通过索求网页中的交互元素(如 A11y 树),并将其映射到范围特定言语(DSL),生成高效的伪 HTML 代码,简化了元素的表征。不同于传统的 A11y + Screen shot 决策,VIEP 在视觉信号方面,引入了 Set-of-Mark,确保每个元素的视觉标记符与伪 HTML 中的标记符逐一双应,进步了元素识别的精度。为了优化性能,截图分手率被压缩至原始的 60%,同期画质压缩至 50%,减少了资源迫害,同期保捏了满盈的识别质料。

与传统的 HTML 示意比较,VIEP 通过简化交互元素和生成紧凑的伪 HTML 结构,幸免了径直处理重大 HTML 内容的支出。举例,Google 首页的 HTML 从 22 万字符减少至仅 1,058 个字符,大幅提高了处理速率和准确度。

VIEP 不仅优化了性能,裁减了老本,还进步了跨环境安妥性,确保自动化操作在不同浏览器和操作系统中理会运行。

坐褥级的可遏止机制

在构建 AI 驱动的自动化系统时,设立者频频需要监控任务的引申情况,随时疗养行径,或在必要时进行遏止。天然 “钩子” 是软件设立中的常见主见,但在 Eko 中,它们承担了独到的变装 —— 在 AI 自动化和东说念主工监督之间架起了一座桥梁。浅易来说,你不错在 Workflow 引申前后插入我方的逻辑,比如考证输入、处理终结、以至重试失败的任务。代码如下:

JavaScript

await eko.execute (workflow, {

hooks: {

beforeToolUse: async (tool, context, input) => {

console.log (`准备引申器具:${tool.name},输入参数:`, input);

return input;

},

afterToolUse: async (tool, context, result) => {

console.log (`器具引申完成:${tool.name},输出终结:`, result);

return result;

}

}

});

Eko 提供三种不同层级的钩子,每个层级王人具有独到的作用:

1. 使命流钩子(Workflow Hooks)

这些钩子位于使命流的最表层,用于合座限度和监控自动化经过的启动和终结。举例,你不错在使命流出手之前进行资源运行化,或在使命流终结后进行计帐和处理最终终结。

2. 子任务钩子(Subtask Hooks)

这些钩子位于使命流的中间层,允许你在每个子任务出手前和终结后进行监控和处理。举例,你不错在每个子任务前记载日记,或在职务完成后对中间终结进行处理。

3. 器具钩子(Tool Hooks)

这是最细粒度的钩子,允许你在每个器具引申前后进行考证和修改。举例,你不错在器具引申前考证输入参数,或在器具引申后处理复返终结。

钩子不错匡助设立者及时优化使命流,提高自动化系统的精度和后果。举例,在引申某些任务时,设立者不错通过钩子对输入数据进行考证,戒备不实信息传入系统;或在职务完成后,处理和升沉终结,以便更好地左右输出。钩子还能匡助设立者集聚引申数据,进行性能分析,识别瓶颈并优化自动化经过。

除了通例的监控和调试功能,Eko 的钩子系统还相沿更翻新的使用场景。举例,在一些要害任务引申时,钩子不错暂停使命流并恭候东说念主工审批;在 AI 决策出现问题时,设立者不错通过钩子进行东说念主工遏止或遮掩 AI 的判断,确保业务经过的顺畅。

瞻望

非论你是 AI 设立者依然自动化使用者,Eko 为你提供了更天真、高效的器具,匡助你将编造职工部署到本体坐褥环境中,进步使命后果和质料。立即保重 Eko,让 AI 自动化为你的坐褥力加速!

作家先容

陆逸文,清华大学博士生,计议兴致为具身智能平台和智能体。

罗卓伟,FellouAI 首席工程群众,现在从事东说念主工智能关联范围使命。

马骁腾,清华大学自动化系博士后,博士毕业于清华大学。主要计议兴致为强化学习和智能体。

陈家棋,复旦大学硕士生,斯坦福大学看望学生学者。主要计议范围为筹算机视觉和智能体。

发布于:北京市