Brand LogoBrand Logo (Dark)
首页智能体广场工具包广场GitHub 精选提交智能体博客

分类

  • AI 绘画
  • AI 音频
  • 自动化工具
  • 聊天机器人
  • 编程工具
  • 金融工具

分类

  • 大语言模型
  • 营销工具
  • 零代码/低代码
  • 研究与搜索
  • 视频与动画
  • 视频编辑

GitHub 精选

  • DeerFlow — 字节跳动开源超级智能体框架

最新博客

  • OpenClaw vs Composer 2 Which AI Assistant Delivers More Value
  • Google AI Studio vs Anthropic Console
  • Stitch 2.0 vs Lovable Which AI Design Tool Wins in 2026
  • Monetizing AI for Solopreneurs and Small Teams in 2026
  • OpenClaw vs MiniMax Which AI Assistant Wins in 2026

最新博客

  • OpenClaw vs KiloClaw Is Self-Hosting Still Better
  • OpenClaw vs Kimi Claw
  • GPT-5.4 vs Gemini 3.1 Pro
  • Farewell to Bloomberg Terminal as Perplexity Computer AI Redefines Finance
  • Best Practices for OpenClaw
LinkStartAI© 2026 LinkstartAI. 版权所有。
联系我们关于
  1. 首页
  2. GitHub 精选
  3. OpenMAIC
OpenMAIC logo

OpenMAIC

一键将任何主题变为沉浸式多智能体互动课堂
0TypeScriptGNU Affero General Public License v3.0
#多智能体#AI教育#智能课堂#交互仿真#项目式学习#白板协作
#大模型
#开源

项目简介

OpenMAIC(开源多智能体互动课堂)是清华大学 MAIC 实验室开源的 AI 教育平台,核心能力是将任意主题描述或文档一键转化为完整的互动式课堂体验。其底层采用 LangGraph 驱动的多智能体编排架构,由「导演图」统一调度多位 AI 教师与 AI 同学,支持实时语音讲授、白板绘图、课堂讨论、圆桌辩论和问答互动等多种教学模式。课堂内容类型丰富:幻灯片、随堂测验、基于 HTML 的可交互仿真实验、项目式学习(PBL)任务应有尽有,课后还可导出为可编辑 .pptx 或自包含 .html。平台兼容 OpenAI、Anthropic Claude、Google Gemini、DeepSeek 及全部 OpenAI 兼容 API,并通过 OpenClaw 与飞书、Slack、Telegram 等 20 余款消息应用深度集成,真正做到「聊天即学习」。研究成果已发表于 JCST'26。

痛点 vs 创新

✕传统痛点✓创新方案
传统 MOOC 平台内容固定,学习者只能被动观看,几乎无法进行实时互动两阶段生成流水线先产出课程大纲,再并行生成各类 Scene,兼顾速度与内容密度
现有 AI 辅导工具多为单轮问答,缺少持续课堂叙事与多角色协作LangGraph「导演图」实现多智能体编排,支持语音、白板、激光笔、聚光灯等 28+ 动作
自建 AI 课件系统需整合 TTS、ASR、LLM、渲染与多智能体框架,工程成本极高HTML 交互仿真引擎可自动生成可操作实验,不止输出静态图文
主流文档 AI 工具难以从单份材料直接生成含仿真与 PBL 的完整课程OpenClaw 集成将课堂生成能力接入 20+ IM 工具,实现「聊天即学习」
-具备学术级可信度,背靠清华团队并有 JCST'26 研究成果支撑

架构深度解析

两阶段课程生成流水线
OpenMAIC 将生成过程拆分为「大纲生成」与「场景生成」两段。先由 LLM 提炼章节、目标与难度,再并行生成幻灯片、测验、HTML 仿真和 PBL 内容。这样既能保证课程结构稳定,也能显著缩短总耗时。前端通过 SSE 接收进度流,用户能实时看到课堂被逐步组装。
LangGraph 多智能体编排引擎
系统核心是基于 LangGraph 的「导演图」状态机,用来定义教师、同学、主持人等角色的轮转和分支逻辑。进入讨论或问答节点时,编排层会动态决定由谁发言、触发何种动作以及如何承接上下文。它支持语音、白板绘制、聚光灯、激光笔等大量动作,使课堂更接近真实互动。状态同步通过前端状态仓库完成,保证表现层与 Agent 行为一致。
回放与实时交互引擎
OpenMAIC 使用独立的回放状态机管理 idle、playing、paused、live 等状态。预生成内容按时间序列执行,而用户提问会立即把系统切到 live 模式并触发实时智能体响应。这样的双状态机解耦,避免实时推理延迟拖慢课程回放。对课堂产品而言,这种设计兼顾了内容稳定性与即时互动性。
多提供商 LLM 与多媒体抽象层
平台在 lib/ai、lib/audio、lib/media 中分别抽象了 LLM、语音和媒体能力。底层可接入 OpenAI、Anthropic、Gemini、DeepSeek 以及 OpenAI 兼容接口,并支持在配置层热切换。TTS、ASR、图片与视频生成也采用相同的可插拔思路,便于按成本、质量和地区合规要求替换供应商。这让系统能随着模型生态演进而持续迭代。

部署指南

1. 克隆仓库并安装依赖,要求 Node.js >= 20 与 pnpm >= 10

bash
1git clone https://github.com/THU-MAIC/OpenMAIC.git2cd OpenMAIC3pnpm install

2. 复制环境变量模板,并至少配置一个 LLM 提供商密钥

bash
1cp .env.example .env.local2# 编辑 .env.local3# OPENAI_API_KEY=sk-...4# ANTHROPIC_API_KEY=sk-ant-...5# GOOGLE_API_KEY=...

3. 启动开发环境并访问本地地址

bash
1pnpm dev

4. 可选使用 Docker 进行容器化部署

bash
1cp .env.example .env.local2# 编辑完成后执行3docker compose up --build

5. 可选接入 Vercel,导入仓库后配置环境变量即可

bash
1# 访问 https://vercel.com/new2# 导入 Fork 仓库并设置 API Key

落地场景

核心场景目标人群解决方案最终收益
个人自学加速器希望快速掌握新技能的自学者输入主题或上传书籍论文,系统自动生成带讲解、测验与仿真的课程在更短时间内完成系统化学习并明显提升吸收效率
企业内训课件工厂需要高频生产培训内容的企业 L&D 团队上传内部 SOP 或知识文档,自动生成互动课件并导出 .pptx大幅压缩课件制作周期并降低人力投入
学校课堂智能助教需要差异化教学资源的高校与 K12 教师在飞书或 Slack 中直接生成包含讨论与 PBL 的互动课堂以更低门槛提升课堂参与度与教学覆盖面

避坑指南

避坑指南
  • 生成质量高度依赖底层 LLM,弱模型容易造成事实偏差、结构松散或课堂节奏失衡
  • HTML 仿真由模型自动生成,复杂实验场景下可能出现逻辑错误或交互精度不足
  • 完整课堂会触发多次模型与语音调用,高并发使用时 API 成本不可忽视
  • 实时 TTS 若遇到网络抖动或供应商延迟,课堂沉浸感会明显下降
  • AGPL-3.0 对闭源 SaaS 有较强约束,商业化前需评估授权路径

常见问题

OpenMAIC 与传统 MOOC 平台的根本区别是什么?▾
传统 MOOC 以固定录播内容为主,学习路径标准化但交互极弱。OpenMAIC 则按当前主题即时生成课堂,并由多智能体驱动讨论、提问与演示,因此更适合长尾主题与个性化学习。
为什么项目选择 LangGraph 而不是 AutoGen 或 CrewAI?▾
课堂场景需要显式状态管理与可中断执行,单纯任务型 Agent 框架往往不够稳定。LangGraph 更适合表达播放态、讨论态与实时切换逻辑,因此工程可控性更强。
生成一节完整课程通常需要多少时间和成本?▾
时间与成本取决于场景数量、模型级别和是否启用 TTS。中等规模课程通常在数分钟内完成,但若使用高端模型和复杂仿真,费用会明显上升。
HTML 交互仿真能否保证稳定可运行?▾
简单仿真通常成功率较高,但复杂交互仍可能出现脚本错误或行为偏差。若用于正式教学,建议先人工预览,并为仿真任务配置更强模型。
OpenClaw 集成的实际价值是什么?▾
它把课堂生成入口前移到飞书、Slack、Telegram 等日常工作流中。用户无需进入终端或后台,就能在聊天界面里发起生成、轮询任务并拿到课堂链接。
企业私有化部署时最大的工程缺口是什么?▾
当前架构更偏单用户自托管,缺少原生认证、权限和多租户隔离。若面向企业,需要补齐 Auth、中间件鉴权和持久化数据库设计。
AGPL-3.0 对商业化有什么影响?▾
如果你修改代码并通过网络提供服务,通常需要按同协议公开修改后的源码。想做闭源 SaaS 时,最好提前走商业授权路径并完成法务评估。
它和 Gamma.app 这类 AI PPT 工具相比谁更强?▾
Gamma 更强在视觉模板与商业演示美感,而 OpenMAIC 更强在教学叙事、智能体互动、白板和问答联动。若目标是上课与知识传递,OpenMAIC 的场景更完整。
在 GitHub 上查看

项目指标

Star 数0
编程语言TypeScript
开源协议GNU Affero General Public License v3.0
部署难度简单

Table of Contents

  1. 01项目简介
  2. 02痛点 vs 创新
  3. 03架构深度解析
  4. 04部署指南
  5. 05落地场景
  6. 06避坑指南
  7. 07常见问题

相关项目

DeerFlow — 字节跳动开源超级智能体框架
DeerFlow — 字节跳动开源超级智能体框架
26.1 k·Python
gstack
gstack
0·TypeScript
Marketing for Founders
Marketing for Founders
2.2 k·Markdown
源 Yuan3.0 Ultra
源 Yuan3.0 Ultra
1.2 k·Python