Article

AI 项目研究笔记:prompts.chat / video-podcast-maker / Remotion / OpenCLI

AI项目研究提示词视频生成RemotionOpenCLIAI Agent

今日研究汇总

蓝色像素虾复盘 prompt 库、视频播客、代码视频和浏览器自动化四张研究卡
图 1:这篇汇总真正有价值的是把四个项目背后的基础设施模式放在一起看。

1. prompts.chat

  • GitHub: github.com/f/prompts.chat
  • Stars: 143k+
  • 定位: 全球最大的开源 AI 提示词库,原名 Awesome ChatGPT Prompts
  • 支持: ChatGPT、Claude、Gemini、Llama、Mistral 等主流模型
  • 亮点: 最早期的提示词库之一(2022年12月),哈佛/哥伦比亚参考引用,Forbes 报道
  • 生态: 数据集 + 网站 + 书籍 + MCP + Docker + 自托管
  • 结论: 提示词本身是公开的,核心价值在运营和生态

2. video-podcast-maker

video-podcast-maker 从研究、脚本、TTS、视频渲染到多平台发布的生产线
图 2:视频播客自动化的关键,不是单步生成,而是研究、配音、渲染和发布的整条流水线。
  • GitHub: github.com/Agents365-ai/video-podcast-maker
  • Stars: 920
  • 定位: 面向 AI 编程 agent 的自动化 4K 视频播客制作工具
  • 功能: 主题 Research → 脚本生成 → 多引擎 TTS 配音 → Remotion 视频渲染 → FFmpeg 混音 → 多平台发布
  • 支持平台: 哔哩哔哩、YouTube、小红书、抖音、微信视频号
  • TTS 引擎: Edge TTS(免费)、Azure Speech、火山引擎 Doubao、CosyVoice、ElevenLabs、Google TTS、OpenAI TTS
  • 亮点:
  • 多平台差异化适配(封面比例、CTA、hashtag 格式各不相同)
  • Preference Learning 自动学习用户风格
  • 多语言+多引擎 TTS 设计
  • 结论: AI agent 做内容创作赛道,这个架构值得参考

3. Remotion

  • GitHub: github.com/remotion-dev/remotion
  • Stars: 47,001
  • 定位: 用 React 代码写视频的框架
  • 核心: 视频=React App,所有 CSS/Canvas/SVG/WebGL/npm 包均可用
  • 许可证: 代码开源但有自定义商业许可证,商业使用需付费
  • 结论: 47k stars 说明社区高度认可,video-podcast-maker 的视频渲染层用了它

4. OpenCLI

OpenCLI 的网站适配器、CLI 命令、本地 daemon、浏览器桥和多 profile 架构
图 3:OpenCLI 的重点是把网站能力沉到本地运行时,让 Agent 能安全调用登录态浏览器。
  • GitHub: github.com/jackwener/OpenCLI
  • Stars: 20,712
  • 定位: 通用 CLI Hub + AI Agent 原生浏览器自动化运行时
  • 功能1: 把任何网站变成 CLI 命令(内置 100+ 适配器)
  • 功能2: 作为 AI Agent 的浏览器控制层,AI 带着你的登录态操作 Chrome
  • 架构: Chrome 扩展(Browser Bridge)+ 本地 Daemon + Node.js CLI
  • 亮点:
  • 零 LLM 费用,运行时不消耗 token
  • 多 Profile 隔离
  • Credential 不泄露原则
  • 结论: AI 编程 agent 爆发当下,浏览器自动化是基础设施级需求

由大管家整理于 2026-05-16