AI工具集
共 641 条资讯-
Page Agent – 阿里开源的 JavaScript GUI 智能体库
Page Agent 是阿里巴巴开源的纯前端 JavaScript 智能体库,通过一行代码嵌入网页,可让用户用自然语言操控页面 DOM 元素。
-
EdgeBench – 字节跳动推出的 AI 学习能力基准测试框架
EdgeBench 是字节跳动 Seed 团队推出的基准测试框架,用于评估自主 AI Agent 在真实世界环境中的长期学习能力。
-
ComAct – 上海AI Lab等推出软件自动化操作的研究范式
ComAct(COM-as-Action)是重新定义专业软件自动化操作的研究范式,由Jiaxin Ai等人提出。范式将Windows的Component Object Model(COM)识别为统一的可执行...
-
不用花钱的 AI 换脸方案 – VisoMaster-Fusion 批量视频图片换脸
今天发点适合做视频/图片换脸的东西。 平时让想弄点恶搞视频或者图片时,换脸用 PS 老是 P 的不好,用 AI 吧又有点贵。 我终于在GitHub上找到一个好东西,叫 ...
-
AReaL 2.0 – 蚂蚁等开源的Agent在线强化学习基础架构
AReaL 2.0是蚂蚁联合香港科技大学、清华大学开源的Agent在线强化学习基础架构,能让已部署的Agent从真实交互轨迹中持续自我演进。
-
Chichi-pui – AI图像生成与分享平台,专注日系风格
Chichi-pui(ちちぷい)是AI图像生成与分享平台,专注于日系动漫、插画及写实风格的AI艺术创作。用户通过输入文本提示词('咒语')调用MIRAGE、PAPYRUS、GARL...
-
Ego Lite – 专为AI Agent设计的浏览器,实现人与AI协同工作
Ego Lite 是基于 Chromium 的人与 AI 智能体并行协作的浏览器。Ego Lite是为 AI Agent 提供底层浏览器操作能力的基础设施。
-
Vidu S1 – 生数科技推出的实时交互视频基础模型
Vidu S1 是生数科技推出的全球领先实时交互视频基础模型,标志着 AI 视频从离线生成迈入实时双向互动时代。基于自回归扩散架构,支持 540P 分辨率、25FPS(最...
-
Octo – 明略科技开源的 AI-native 团队协作平台
Octo 是明略科技开源的 AI-native 团队协作平台,将分散的 AI Agent 聚合到统一空间,通过 IM 形态实现人与 Agent、Agent 与 Agent 的高效编排。
-
TabFM – 谷歌开源的零样本表格基础模型
TabFM 是 Google Research 推出的零样本表格基础模型,支持对混合数值与类别特征的结构化数据进行分类(最多10类)和回归。模型在数百亿合成表格数据上训练,...
-
SemanticAudio – 港中文等推出的音频生成与编辑框架
SemanticAudio 是香港中文大学、LIGHTSPEED、上海交通大学联合推出的音频生成与编辑框架。框架将文本到音频生成拆分为'语义规划'与'声学合成'两阶段,在高层...
-
Command Code – AI 编程智能体,自动记录沉淀编码偏好
Command Code 是 CLI 优先的 AI 编程智能体,核心差异化在于其 Taste(编码品味)持续学习系统。通过自动记录你对代码的接受、拒绝和修改行为,跨项目沉淀个...
-
跃迁维度 – 一站式国产 AI 模型 API 聚合平台
跃迁维度(dimleap)是一站式国产AI模型API聚合平台,为全球开发者提供先进、稳定的AI模型API服务。通过简洁的API接口,用户可快速集成DeepSeek、Qwen、GLM、...
-
video-use – Browser Use 团队开源的 AI 视频剪辑 Agent
Video-use 是 Browser Use 团队开源的 AI 视频剪辑 Agent,通过自然语言对话替代传统时间线操作。用户只需将原始素材放入文件夹并描述需求,Agent 自动完成素...
-
Skywork Tags -天工AI推出的团队级 AI Agent 协作功能
Skywork Tags是昆仑万维天工3.2版本推出的团队级AI Agent协作功能,让Agent以'共享同事'身份入驻Slack、飞书、钉钉、Discord、Telegram等工作群。
-
Astryx – Meta 开源的 React 设计系统
Astryx 是 Meta 开源的 React 设计系统,目前处于 Beta 阶段。系统基于 React 与 StyleX 构建,提供 150+ 可访问组件、品牌级主题、暗黑模式、即用型模板及 C...
-
Nemotron-Labs-TwoTower – 英伟达开源的双塔架构扩散语言模型
NVIDIA Nemotron-Labs-TwoTower 是英伟达开源的双塔架构扩散语言模型,总参数约60B、活跃参数3B。模型将上下文理解与去噪生成解耦为两个独立塔,冻结的AR上下...
-
LLM Admin – 开源免费的本地化 LLM 统一API,省钱又省心
LLM Admin 是开源免费的本地化 LLM 统一网关,采用 Apache-2.0 协议。通过一套 API 兼容 OpenAI 与 Anthropic 协议,轻松调度 80+ 主流模型,支持文本、图像...
-
豆包音频生成模型1.0实测 – 多角色配音、有声书一键生成
你可能也在烦恼:用 AI 生成大片,画面质感已经很到位了,可角色一开口,瞬间让人出戏。 画面里明明在经历生死关头,配音听起来却像在四平八稳地念产品说明...
-
ChatExcel Ultra – 元空AI推出的企业级桌面版AI数据智能体
ChatExcel Ultra 是元空AI推出的企业级桌面版AI数据智能体,面向专业数据办公场景。产品支持文件本地处理、数据库直连、永久记忆与终身学习,可通过自然语言...