简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » OpenAI发布智能体开发套件:AI能自主操作计算机

OpenAI发布智能体开发套件:AI能自主操作计算机

文章来源: 腾讯科技 于 2025-03-11 19:10:46 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数


OpenAI通过小型圆桌发布会发布AI Agent开发套件

3月12日,OpenAI发布针对AI Agent打造的系列工具与API,助力开发者更便捷地创建可自动执行任务的AI Agent。

--全新的Responses API:深度融合对话式API的交互简洁性与助手API的工具调用能力,打造面向智能体开发的统一接口范式。该API支持动态任务解析与工具链自主调度,显著降低复杂业务流程的架构复杂度。

--内置工具:包括网络搜索、文件搜索和计算机使用等功能。

--全新的智能体SDK:用于协调单代理和多代理工作流。

--集成的可观测性工具:用于追踪和检查智能代理工作流的执行情况。

OpenAI官方提供的Agent工作流执行进度跟踪面板

这些新工具简化了智能体的核心逻辑、编排和交互,极大地降低了开发者构建智能体的入门门槛。在未来几周和几个月内,OpenAI计划陆续推出更多工具和功能,进一步简化并加速在OpenAI平台上构建智能体应用的流程。

01.Responses API技术解析

作为OpenAI面向智能体开发的基础API组件,Responses API深度融合对话式接口的易用性与助手API的工具调度能力。该API旨在为开发者构建具备持续演进能力的智能体系统提供核心支撑框架。

随着模型能力的迭代升级,Responses API将持续优化其灵活性和扩展性,使开发者通过单次API调用即可完成多工具协同、多轮推理的复杂任务处理。

Responses API首批支持网络搜索引擎、文件搜索和计算机使用等功能。这些工具旨在协同工作,将模型与现实世界连接起来,使其在完成任务时更具实用性。

Responses API专为需要将OpenAI模型与内置工具无缝集成至应用系统的开发者设计,OpenAI默认不会将存储于其平台的企业数据用于模型训练,该承诺在数据处理协议中有明确条款约束。

该API即日起面向所有开发者开放,采用标准化计费体系:Tokens与工具调用均按官网公示费率执行‌。

对现有API的影响

Chat Completions API‌⁠:作为OpenAI当前市场占有率最高的接口方案,该API将持续获得新型号模型与功能迭代支持。对于无需内置工具调用的应用场景,建议开发者继续沿用现有技术架构。

‌Assistants API‌⁠:基于Assistants API测试版获得的开发者反馈,OpenAI已将关键改进整合至Responses API,使其更灵活、更快速、更易用,未来OpenAI将弃用Assistants API,目标时间为2026年年中。

02.Responses API的内置工具

网络搜索

开发者现在可以通过网络获取快速、最新的答案,并附带清晰相关的引用来源。在Responses API中,使用gpt-4o和gpt-4o-mini时,网络搜索可作为工具使用,并可与其他工具或函数调用结合。

在早期测试中,开发者群体已将网络搜索应用于多种用例,包括购物助手、研究代理和旅行预订代理——任何需要及时网络信息的应用场景。

演示使用OpenAI的API来生成与当天新闻相关的文本响应

GPT-4o搜索和4o-mini搜索的定价分别为每千次查询30美元和25美元。

文件搜索

开发者现在可以轻松从海量文档中检索相关信息。升级后的文件搜索工具支持多种文件类型、查询优化、元数据过滤及自定义重新排序,能够提供快速精准的搜索结果。通过Responses API,仅需几行代码即可完成集成。

文件搜索工具适用于多种实际场景:支持客服助手快速调取常见问题库、协助编程助手查询技术文档等。定价为每千次查询2.50美元,文件存储费用为每GB每日0.10美元(首GB免费)。

计算机使用

开发者现可通过Responses API构建能够操作计算机完成任务的智能体,该工具基于与Operator同源的计算机使用代理(CUA)模型。

该工具能捕获模型生成的鼠标与键盘操作轨迹,使开发者可将这些动作转化为具体环境中的可执行命令,实现计算机任务的自动化处理。

安全方面:内置防御提示注入的安全检查、敏感操作确认提示、环境隔离工具及策略违规检测强化。OpenAI提示,建议涉及系统操作时保持人工监督。

该工具现以研究预览版形式向使用层级3-5的开发者开放于Responses API中,定价为每百万输入Token 3美元、输出Token 12美元。

03.智能体SDK

全新开源的‌智能体SDK‌显著简化多智能体工作流管理,相较去年发布的实验性工具Swarm⁠(已被开发者社区广泛采用并成功部署于多个客户场景),本次升级包含以下改进:

--‌智能体配置‌:支持快速部署预置清晰指令与内置工具的大语言模型。

--‌流程交接‌(Handoffs:):实现智能体间控制权的动态转移与上下文继承。

--‌安全护栏‌(Guardrails):可定制的输入输出验证机制,防范有害内容。

--追踪与可观测性:可视化智能体执行轨迹以调试并优化性能。

智能体SDK适用于多种现实场景,包括客户支持自动化、多步骤研究、内容生成、代码审查与销售线索挖掘。它兼容Responses API与Chat Completions API。该SDK也支持其他提供商的模型。

查看评论(5)

24小时热点排行

国会推"尊严法案" 非法移民交$7000 可申请永久身份
华裔夫妇疯狂代孕案中案:保姆涉虐童遭FBI通缉
骇人听闻!华裔夫妇涉虐童丑闻 受害者包括20余幼儿
宗氏三兄妹在港起诉宗馥莉文书曝光,揭示家族斗争
17岁中国学生在日本溺亡身上多暴力伤痕 调查出来了!

24小时讨论排行

有损国格!一切西方伪史论 本质都是辱华的高级黑
川普:中国很快会处死芬太尼制造者 北京:责任在美国自身
印度空难后"东航惨案"被提,"可能危及国安"会被尘封吗?
马斯克密集发文猛烈抨击特朗普“爱泼斯坦案是骗局”
宗庆后杜建英合影曝光 女方主动又热情 看对方眼神…
苦吞50%关税!巴西总统鲁拉"强硬杠上川普"民调反涨
移民这局赢了!川普政府想拔他绿卡"法院2理由推翻"
别被川普“临阵软脚”骗了 他要的就是关税!越高越好…
长记性吧,以后媒体再吹谁俭朴我都不信!
宗馥莉的妈妈 才是狠人 以柔克刚 有容乃大
《竹林女儿》:离散和跨国收养,一对双胞胎的命运回响
川普宣布可口可乐"改配方",喊:就是比较好喝!
澳总理:中国洋溢自信和创新 成都建筑前所未见
卡尔森率领忧心忡忡的MAGA斗士们 质疑特朗普
川普18岁孙女身价飙千万!穿红衣“伪参选”签重磅代言
马斯克"美国党"声势冷,民调:仅11%考虑支持
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

文学城新闻
切换到网页版

OpenAI发布智能体开发套件:AI能自主操作计算机

腾讯科技 2025-03-11 19:10:46


OpenAI通过小型圆桌发布会发布AI Agent开发套件

3月12日,OpenAI发布针对AI Agent打造的系列工具与API,助力开发者更便捷地创建可自动执行任务的AI Agent。

--全新的Responses API:深度融合对话式API的交互简洁性与助手API的工具调用能力,打造面向智能体开发的统一接口范式。该API支持动态任务解析与工具链自主调度,显著降低复杂业务流程的架构复杂度。

--内置工具:包括网络搜索、文件搜索和计算机使用等功能。

--全新的智能体SDK:用于协调单代理和多代理工作流。

--集成的可观测性工具:用于追踪和检查智能代理工作流的执行情况。

OpenAI官方提供的Agent工作流执行进度跟踪面板

这些新工具简化了智能体的核心逻辑、编排和交互,极大地降低了开发者构建智能体的入门门槛。在未来几周和几个月内,OpenAI计划陆续推出更多工具和功能,进一步简化并加速在OpenAI平台上构建智能体应用的流程。

01.Responses API技术解析

作为OpenAI面向智能体开发的基础API组件,Responses API深度融合对话式接口的易用性与助手API的工具调度能力。该API旨在为开发者构建具备持续演进能力的智能体系统提供核心支撑框架。

随着模型能力的迭代升级,Responses API将持续优化其灵活性和扩展性,使开发者通过单次API调用即可完成多工具协同、多轮推理的复杂任务处理。

Responses API首批支持网络搜索引擎、文件搜索和计算机使用等功能。这些工具旨在协同工作,将模型与现实世界连接起来,使其在完成任务时更具实用性。

Responses API专为需要将OpenAI模型与内置工具无缝集成至应用系统的开发者设计,OpenAI默认不会将存储于其平台的企业数据用于模型训练,该承诺在数据处理协议中有明确条款约束。

该API即日起面向所有开发者开放,采用标准化计费体系:Tokens与工具调用均按官网公示费率执行‌。

对现有API的影响

Chat Completions API‌⁠:作为OpenAI当前市场占有率最高的接口方案,该API将持续获得新型号模型与功能迭代支持。对于无需内置工具调用的应用场景,建议开发者继续沿用现有技术架构。

‌Assistants API‌⁠:基于Assistants API测试版获得的开发者反馈,OpenAI已将关键改进整合至Responses API,使其更灵活、更快速、更易用,未来OpenAI将弃用Assistants API,目标时间为2026年年中。

02.Responses API的内置工具

网络搜索

开发者现在可以通过网络获取快速、最新的答案,并附带清晰相关的引用来源。在Responses API中,使用gpt-4o和gpt-4o-mini时,网络搜索可作为工具使用,并可与其他工具或函数调用结合。

在早期测试中,开发者群体已将网络搜索应用于多种用例,包括购物助手、研究代理和旅行预订代理——任何需要及时网络信息的应用场景。

演示使用OpenAI的API来生成与当天新闻相关的文本响应

GPT-4o搜索和4o-mini搜索的定价分别为每千次查询30美元和25美元。

文件搜索

开发者现在可以轻松从海量文档中检索相关信息。升级后的文件搜索工具支持多种文件类型、查询优化、元数据过滤及自定义重新排序,能够提供快速精准的搜索结果。通过Responses API,仅需几行代码即可完成集成。

文件搜索工具适用于多种实际场景:支持客服助手快速调取常见问题库、协助编程助手查询技术文档等。定价为每千次查询2.50美元,文件存储费用为每GB每日0.10美元(首GB免费)。

计算机使用

开发者现可通过Responses API构建能够操作计算机完成任务的智能体,该工具基于与Operator同源的计算机使用代理(CUA)模型。

该工具能捕获模型生成的鼠标与键盘操作轨迹,使开发者可将这些动作转化为具体环境中的可执行命令,实现计算机任务的自动化处理。

安全方面:内置防御提示注入的安全检查、敏感操作确认提示、环境隔离工具及策略违规检测强化。OpenAI提示,建议涉及系统操作时保持人工监督。

该工具现以研究预览版形式向使用层级3-5的开发者开放于Responses API中,定价为每百万输入Token 3美元、输出Token 12美元。

03.智能体SDK

全新开源的‌智能体SDK‌显著简化多智能体工作流管理,相较去年发布的实验性工具Swarm⁠(已被开发者社区广泛采用并成功部署于多个客户场景),本次升级包含以下改进:

--‌智能体配置‌:支持快速部署预置清晰指令与内置工具的大语言模型。

--‌流程交接‌(Handoffs:):实现智能体间控制权的动态转移与上下文继承。

--‌安全护栏‌(Guardrails):可定制的输入输出验证机制,防范有害内容。

--追踪与可观测性:可视化智能体执行轨迹以调试并优化性能。

智能体SDK适用于多种现实场景,包括客户支持自动化、多步骤研究、内容生成、代码审查与销售线索挖掘。它兼容Responses API与Chat Completions API。该SDK也支持其他提供商的模型。