加入 ArkSphere AI 原生社区 ,聚焦 AI 原生基础设施与智能体运行时。

KrillinAI

基于大语言模型与 TTS 的视频翻译与配音工具,支持 100 种语言并提供一键部署能力以适配多平台视频输出。

详细介绍

KrillinAI 是一款面向短视频和长视频制作流程的视频翻译与配音工具,结合大语言模型(LLM, Large Language Model)、自动语音识别(ASR)和文本转语音(TTS)技术,实现多语种双向翻译与自然配音。项目提供一键化的全流程部署能力,输出结果针对 YouTube、TikTok、哔哩哔哩等平台进行了格式与时序优化,帮助内容创作者快速本地化视频内容并保持观看体验。

主要特性

  • 支持 100 种语言的双向翻译与字幕生成。
  • 集成 ASR 与 TTS 流水线,自动完成转写、翻译、配时与配音。
  • 平台适配:输出针对主流短视频与长视频平台优化的时间轴与编码格式。
  • 可一键部署全流程,便于在 CI/CD(持续集成/持续部署)流水线中集成。

使用场景

  • 内容创作者将已有视频快速本地化并发布到多语种平台。
  • 媒体公司批量生成多语种字幕与配音以扩大受众覆盖。
  • 教育与企业培训视频的多语种译制与分发。

技术特点

  • 以 Go 语言实现的服务化架构,与 TypeScript/Node.js 工具链及容器化部署兼容。
  • 使用 LLM+ASR+TTS 的混合流水线,支持自定义模型与参数以提升质量。
  • 开源发布(GPL-3.0),允许社区复用与扩展,源码与项目主页在 frontmatter 中提供链接。
KrillinAI
资源信息
🎬 视频 🗣️ 文本转语音 📱 应用 🌱 开源